Pinpoint – עוזר המחקר מבית גוגל

 

 

 

גוגל הרחיבה לאחרונה את הגישה החופשית ל-Pinpoint גם עבור הקהילה האקדמית.

בקצרה, Pinpoint הוא כלי שנועד במקור לסייע לעיתונאים חוקרים בניתוח של גופים גדולים של מידע שמקורו במסמכים, טבלאות, מיילים, קבצי וידאו ואודיו (חשבו על הדלפות בסדר גודל של Enron או מסמכי הפנטגון בוויקיליקס).

כלי זה משלב את מנוע הבינה המלאכותית של גוגל באופן הבא:

  1. לאחר העלאת הקבצים המנוע של Google Document AI, שהוא אחד מכלי ה-OCR המתקדמים ביותר בשוק, מבצע זיהוי תווים אופטי; כך קבצי PDF שנסרקו כתמונה הופכים לחפישים. במקרה של קובץ אודיו או וידאו, מנוע התמלול של גוגל מתמלל את הנאמר, כולל תמיכה בשפה העברית (ניתן גם לתקן את המלל במקרה של טעויות). Pinpoint תומך גם בזיהוי כתב יד (HTR).
  2. לאחר שמסתיים תהליך העיבוד, ניתן לחפש בצורה חופשית בכלל המסמכים/תמלילים.
  3. במקביל, מנוע הבינה המלאכותית של גוגל מחלץ ישויות באופן אוטומטי מתוך המסמכים/תמלילים (NER). כלומר, אם המסמכים מכילים שמות של אנשים, ארגונים או מדינות, התוצאות יוצגו בהתאם בממשק בצורה מרוכזת.
  4. במקרה של טבלאות, ל-Pinpoint יש פונקציה מתקדמת לחילוץ Structured Data. כלומר, ניתן להמיר טבלאות ישירות לקבצי אקסל. הסרטון כאן מרחיב על פונקציה זו.
  5. Pinpoint כמובן הוא חלק אינטגרלי מהאקוסיסטם של גוגל. כלומר, ניתן לקשרו ל-Google Drive ולשתף מסמכים או אוספים עם משתמשי גוגל אחר.
  6. שילוב של Gemini ע"מ לתשאל מסמכים בשפה טבעית. פונקציה זו עדיין נמצאת בבטא, אבל היא מאפשרת סיכום של המסמכים או שאילת שאלות בשפה טבעית, בדומה ל-ChatGPT רק עם Gemini של גוגל.

בתרחישים אקדמיים, לכלי זה הפוטנציאל להוות One Stop Shop (חינמי בשלב זה) עבור פרויקטים מחקריים מסוגים שונים. בפשטות, ניתן להעלות חומרים מסוגים שונים (טקסט/אודיו/וידאו), לקבל OCR או תמלול, לתקן טעויות ולשתף עם משתתפים אחרים בפרויקט. אני באופן אישי ניסיתי אותו עם טקסטים היסטוריים בשפות שונות (ערבית/אנגלית/צרפתית), יחד עם קטע וידאו בעברית מערוץ ה-Youtube של הספרייה, וקיבלתי תוצאות מצוינות.

באופן כללי יותר, הכיוון של גוגל עם Pinpoint גם מצביע על הדרך אליה פונות תוכנות המיועדות לשוק האקדמי. רוצה לומר כלים לניהול בביבליוגרפי כדוגמת זוטרו או מנדלי לא יוכלו להמשיך ולספק רק ניהול הפניות, אלא ייאלצו לשלב גם יכולות OCR ובינה מלאכותית, אחרת יישארו מאחור.

 

אל Pinpoint ניתן להגיע דרך הקישור הבא (נדרש רישום חינמי):

https://journaliststudio.google.com/pinpoint/about/

סרטון הדרכה קצר:

https://youtu.be/Hn9xgSMxawg?si=mT1OwAygrZ_hQBe4

צילום מסך לדוגמה:

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *