"עוזרי מחקר" – כלי AI לתמיכה בעולמות האקדמיה

עם התפתחותו המואצת של תחום הבינה המלאכותית, כלי AI הופכים למשאב חיוני הולך וגדל המציע לנו שלל של מידע וקיצורי דרך. מידי יום אנו שומעים על התפתחויות חדשות ומה שרלוונטי להיום לא בהכרח יישאר רלוונטי גם מחר. העולם האקדמי הוא חלק מהעידן החדש ועולות תהיות ומחשבות רבות כיצד להשתמש ב- AI במחקר ובהוראה. האם אפשר להיעזר בכלי AI  לצורך כתיבת עבודות או מחקר אקדמי? איך ניתן לשלב בין העולמות ולשמור על מקוריות וחדשנות וגם על ביקורתיות ואיכות? כיצד נכון להיעזר ב- AI בצורה שתסייע לנו וגם תפיק תוצרים העומדים בסטנדרטים המקובלים בעולמות המחקר?

אכן, השימוש בכלי בינה מלאכותית מצריך זהירות וביקורתיות, במיוחד בעולמות האקדמיה. הצ'אטים השונים עשויים "להזות" הפניות ביבליוגרפיות למאמרים וספרים שלא באמת קיימים (לא אחת בספרייה אנו פוגשים סטודנטים/יות המגיעים עם רשימה ארוכה של מאמרים, שאחרי בירור קצר אנו מבינים שהופקה על ידי אחד הצ'אטים ולא באמת מפנה למקורות שקיימים בעולם האמיתי), להסתמך בתשובתם על מקורות פופולריים מהרשת או לא לתת סימוכין כלל. דרך אחת להימנע מבעיות אלו היא להיעזר בכלים ייעודיים המותאמים ורלוונטיים לעולם האקדמי ודרישותיו הייחודיות, שיכולים לסייע לנו באיתור מאמרים (אמיתיים!), סיכום, דליית מידע רלוונטי ולייעל את תהליך העבודה שלנו. בפוסט הזה אציג שלושה כלים מרכזיים מסוג זה: Perplexity, Elicit, ו- Humata, כשכל אחד מציע יכולות שונות התומכות בתהליך המחקרי.

Perplexity

מנוע חיפוש מבוסס AI העונה על שאלות באמצעות חיפוש ברשת האינטרנט, התשובות המתקבלות נראות  כשילוב של google  וChatGPT. יחד עם התשובה המילולית לשאלה מתקבלת גם רשימת המקורות עליהם היא מתבססת, כך שבשונה מהצ'אטים המוכרים – כאן אנחנו מקבלים אסמכתאות לתשובות שהכלי מספק. הכלי מתיימר לספק תשובות עדכנית ומדויקות בזמן אמת ומידע אמין ושלם.

אחת הפונקציות החשובות ב- Perplexity היא המיקוד (Focus), נמצאת בתוך חלון שורת החיפוש.

ניתן לבחור את סוג המקורות אליהם הצ'ט יתייחס במתן התשובה.

יש לנו שש אפשרויות:

Web – חיפוש כללי במגוון מקורות ברשת האינטרנט, Academic – חיפוש בתוך מאמרים אקדמיים בלבד- אפשרות מהותית עבורנו, סטודנטים וחוקרים, Math – תשובות עם בסיס חישובי, Writing – אם אנחנו רוצים כתיבה יצירתית יותר של הצ'אט (בלי התבססות על מקורות ספציפיים), Video – חיפוש המבוסס על קטעי וידיאו, Social  – חיפוש המבוסס על מדיה חברתית, בעיקר דיונים ברשת החברתית Reddit.

הבחירה במיקוד המתאים צריכה להיות בהתאם לסוג השאלה אותה אני רוצים לשאול, ניתן גם להשתמש במיקודים שונים על מנת לקבל פרספקטיבה רחבה על השאלה שלנו ממקורות שונים ולבקש לותר על מקורות מסוימים שפחות מתאימים לנו.

ניסיתי לשאול את הכלי – מהם מקצועות העתיד? ולהשתמש במיקוד אקדמי.

התשובה שהתקבלה מבוססת על 8 מקורות אקדמיים המגיעים ממאגרים בגישה פתוחה כמו Semantic Scholar  ו- Pubmed. המקורות מופיעים בחלק העליון של התשובה. יש לשים לב לכך שהכלי לא מתבסס על מאגרים אקדמיים חשובים רבים (משום שהגישה אליהם מוגבלת למנויים משלמים), אבל בהחלט מתייחס למקורות מהימנים וטובים.

*חלק מהתשובה שהתקבלה

ויש גם הצעות לשאלות המשך:

במיקודים האחרים התשובות שהתקבלו היו שונות במקצת, אך הרעיונות הבסיסיים היו דומים.

עוד פונקציה מעניינת היא הכפתור Pro, המתיימר להכיר את המשתמש ולהתאים את תוצאות החיפוש לצרכיו, לשאול יותר שאלות, לשקלל יותר פרטים ולהציע תשובות מדויקות יותר.

הגרסה בתשלום מאפרת יותר חיפושי Pro יומיים (5 חיפושים בגרסה החינמית  ומעל ל- 300 חיפושים בגרסה בתשלום). אין הגבלה על חיפושים רגילים בגרסה החינמית.

ניתן לחפש גם בעברית, אך מרבית המקורות שהצ'אט מתבסס עליהם הם באנגלית – התשובות המתקבלות בעברית הן תשובות מתורגמות.

Elicit 

בדומה לפרפלקסיטי, זהו כלי AI המאפשר לאתר מאמרים אקדמיים באמצעות מילות מפתח. מתקבלת סקירת ספרות קצרה המבוססת על תקצירים של ארבעה מאמרים (ניתן לשנות את בחירת המאמרים או להעלות מאמרים משלנו)

בנוסף לתקציר מתקבלת  רשימת מאמרים ארוכה המאורגנת בטבלה: שם המאמר, תיאור קצר ואפשרות להוסיף עמודות נוספות – סיכום המאמר, ממצאים עיקריים, מתודולוגיה, שאלת מחקר, תאריך ועוד. ניתן גם להוסיף עמודות חדשות שלא מופיעות ברשימה, וכך ליצור פילוח מידע מותאם אישית מתוך המאמרים.

כך נראה הסיכום הראשוני על הנושא על הנושא Professions of the future:

יש אפשרות ליצור סינון ראשוני לאיתור מאמרים איכותיים ורלוונטיים: סינון לפי תאריך, סוג המחקר וגם בחירה של מאמרים מכתבי עת בעלי דירוג גבוה.

*בתמונה אפשרויות הסינון

כשיש המון מידע Elicit עוזר לנו בעיבוד ראשוני וסיכום מהיר ויעיל שממנו אנחנו יכולים להמשיך, גם פה מדובר על מאמרים בגישה פתוחה המגיעים ברובם מהאתר Semantic Scholar, כך שאין לנו פה סריקה שיטתית של כל המאמרים הקיימים ולכן חשוב גם לחפש חומרים בקטלוג הספרייה ובמאגרי המידע המקצועיים. למרות זאת, אפשרויות הסינון לתאריכים מסוימים וקבוצת איכות כן מאפשרים לנו לוודא שהמאמרים שאנו מקבלים הם איכותיים ומהימנים ולהמשיך הלאה אל עבר המחקר שלנו.

הגרסה בתשלום מאפשרת סיכום של שמונה מאמרים ביחד כל פעם (במקום ארבעה בלבד) וביצוע של יותר פעולות.

Humata

כלי AI נוסף המתמחה בניתוח מסמכים ומאמרים אקדמיים. ניתן להעלות אליו מאמרים ולשאול שאלות לגביהם באמצעות שיחה עם הצ'אט: אפשר לבקש ממנו לתקצר את המאמר, לציין את הדברים החשובים העולים ממנו ולהגיע למידע ספציפי. התשובות מגיעות עם מראי מקום מתוך המאמרים כאשר הטקסטים הרלוונטיים מודגשים. הכלי מאפשר לנו להבין מאמרים ארוכים ולעבוד איתם בצורה חכמה, לנתח, לסכם וליצור תוכן חדש. בשונה מהכלים האחרים Humata לא מציע חיפוש מאמרים, העבודה היא עם מאמרים שאנחנו מעלים לאתר. הגרסה החינמית מאפשרת עבודה על מספר מאמרים באורך כולל של 60 עמודים ומגבילה את מספר השאלות היומי (10 שאלות ביום). בתשלום ניתן להעלות יותר עמודים ולשאול יותר שאלות, בהתאם לסוג המנוי, יש מספר אפשרויות שונות. במנויים מתקדמים ישנו שילוב עם ChatGPT.

התכתבות סביב מאמר העוסק בספריות העתיד:

*מרקור מתוך המאמר

בסך הכול התשובות שקיבלתי עם הכלי היו מספקות, הוא התייחס לטקסט וענה מתוכו ומרקר עבורי את החלקים החשובים. בעברית התשובות היו פחות טובות ואם ניסיתי לשאול שאלה קצת יותר מורכבת הוא ענה לי שלא ניתן למצוא את התשובה בתוך הטקסט.

 

לסיכום, הצגנו שלושה כלים בעלי יכולות משמעותיות לעזרה בשלבים שונים של המחקר: איסוף מידע, עיבוד ראשוני, סיכום וסקירת ספרות. כל אחד מהכלים מתאים לשלב אחר של התהליך המחקרי: Perplexity נתן לנו תשובה לשאלה שלנו כמו בצ'אטים אחרים, אך עם בסיס אקדמי וקישורים למסמכים על פיהם התבססה התשובה, Elicit מצא עבורנו מאמרים מתאימים, תקצר עבורנו ומיין אותם בטבלה בהתאם לפרמטרים שבחרנו ו-Humata עזר לנו לסכם ולחלץ מידע מתוך המאמרים שהעלנו אליו. שלושתם כלים שימושיים ומועילים שבהחלט יכולים לסייע לחוקרים ולסטודנטים בתהליך הראשוני של איסוף והערכת חומרים, יחד עם זאת חשוב תמיד לזכור שמדובר בכלים שתפקידם לסייע לנו ולא להחליף אותנו (לפחות בינתיים)…השתמשו בכלים בצורה חכמה! קחו הכול בערבון מוגבל ותמיד תקראו, תחפשו ותבדקו היטב את המידע שהתקבל.

נקודה מהותית היא שהכלים לא מכסים את כל המאמרים האקדמיים הקיימים. משום שאין להם גישה למאגרי מידע מקצועיים מובילים הכרוכים בתשלום, כלל לא בטוח שהמאמרים שהם מציעים הם העדכניים ביותר, המשפיעים ביותר או הטובים ביותר בתחום. לכן, חשוב מאוד להשלים את החיפוש בדעת"א, במאגרים האקדמיים של הספרייה או בגוגל סקולר.

התנסיתם בכלים ויש לכם תובנות עליהם? מכירים כלים טובים יותר? כתבו לנו בתגובות!

שבע מילים כמשל לעתיד המדע והידע

לפני 70 שנה כתב אורוול את הספר "1984", וסיפר בו על "השיחדש": מהלך של מפלגת השלטון, בו משנים את השפה הרגילה בעזרת ביטול מגוון מילים מיותרות כדי "לשמש כלי ביטוי להשקפת העולם והרגלי המחשבה היאים"[i], לקו המחשבה של המפלגה כמובן. ייחודה של שפת שיחדש הוא שמשנה לשנה קטן בה אוצר המילים, ויחד איתו קטן הפיתוי לחשוב כי "דברים שכבר אין להם שם, אי אפשר כלל להעלותם על הדעת"[ii]. בימים אלה נראה שאורוול טעה ב- 30 שנה, וחזה לא את 1984, אלא את ימינו.

ב- 15/12/17 בישר ה – Washington Post, כי למרכז לבקרת מחלות ומניעתן, ה-CDC, ניתנה רשימת מילים אסורות לשימוש בבקשות תקציבי פעילות ומחקר ממשלתיים: פגיע vulnerable, זכאות entitlement, גיוון/מגוון diversity, טראנסג'נדר transgender, עובר fetus, מבוסס ראיות evidence-based, מבוסס-מדעית science-based. לשניים מהביטויים הללו הוצעה חלופה: במקום הביטויים "מבוסס מדעית" או "מבוסס ראיות", הוצע נוסח "מבוסס על מדע, תוך מתן תשומת לב לסטנדרטים ורצונות קהילתיים". למחרת בישר ה – New York Times, שאין איסור מפורש על מילים או מחקר בתחומים אלה, ומדובר בהצגה מוטעית של תהליך הדיון בנוסח התקציב המתגבש. כלומר, מקורה של "ההמלצה" הוא רצונם הטוב של פקידי ממשל להקל על רפובליקנים להצביע בעד בקשות התקציב.

שינוי מדיניות של ממשלים שונים הוא טבעי, אך משמעות ביטול המילים רחבה יותר משינוי שכזה. איך ניתן לכתוב בקשות לתקציב על נושאים "שאי אפשר לומר את שמם"? מי יקצה תקציבים למחקר והתמודדות עם בעיות שלא קיימות? מה יעשו, למשל, החוקרים המנסים להילחם בנגיף הזיקה והשפעתו של מומים מולדים, מבלי לדבר על העוברים? או סוכנויות הפועלות לסיוע לטראנסג'נדרים -אוכלוסייה הפגיעה למחלות כמו איידס, צהבת, שחפת, ומחלות נוספות, אם האוכלוסייה לא קיימת?

לא ברור מה גרוע יותר – האיסור הראשוני להשתמש בשבע המילים או ההבהרה שמדובר בהמלצה בלבד לצורך קבלת מימון. מותר לחקור הכל במימון ממשלתי, ובדרך זו, אם לא נזכיר את שמם המפורש של דברים, מי שדעתו שונה יוכל לעצום עיניים, לסרב לדון בהם, ואולי כמעשה קסמים, בעיות ייעלמו מעצמן. אם אוכלוסיית הטרנסג'נדרים לא קיימת, היא לא יכולה להיות חשופה למחלות ומצבים נפשיים שונים, ולכן אין צורך לטפל באוכלוסייה זו או להשקיע בפעילות מניעה. כך גם לגבי עוברים: כיוון שעוברים לא קיימים כנושא למחקר – אפשר להתעלם מהנזק שתרופות שונות גורמות לעוברים ומהשפעת אלכוהול וסמים עליהם. חברי הקהילה העסקית היו מאוד שמחים אלמלא הוטרדו בזוטות כמו מחקרי יעילות ובטיחות של מוצרים, או התגוננות מתביעות על נזקים שמוצריהם גרמו.

יריית הפתיחה ל"רצונות הקהילה" כמצפן למחקר ותקציבים נורתה כבר עשרים שנה, והשלכותיה נראות גם היום. בשנת 1996, נאסר על ה- CDC להקצות משאבים למחקר בנושא מניעת פציעות או כל מחקר אחר הקשור לפיקוח על כלי נשק, איסור שעדיין נמצא בתוקף. גם במקרה זה לא נאסר המחקר בנושא בטיחות השימוש בכלי נשק ופציעות הקשורות לירי. מה שנאסר הוא הוצאת כספי ציבור על מחקרים הקוראים לפיקוח על כלי נשק. בעזרת המונח המוצע החדש אפשר לומר כי אפילו אם העדויות העולות ממחקרים מבוססים מבחינה מדעית, מראות כי רצוי לפקח על שימוש בנשק, יש לשים לב לסטנדרטים ורצונות קהילתיים, הקובעים כי זכותם של האזרחים לשאת נשק, ולכן מחקר שעלול לסתור זאת – לא ימומן. רוצים לחקור? בבקשה. אבל לא על חשבון משלם המיסים.

אם נמשיך להאמין בחופש לחקור הכל, גם אם במימון לא ממשלתי, נשאלת השאלה מי יממן את כל המחקרים בנושאים אלה? מימון המונים? חברות פרטיות בעלות אינטרסים מסחריים? שאלה זו חשובה במיוחד לאור ההצעה להחליף את המונח "רפואה מבוססת הראיות", במשפט "רפואה שאמנם מבוססת על מדע, אך נותנת תשומת לב לסטנדרטים ורצונות קהילתיים".

אם נניח שחוכמת ההמונים תנחה את מימון ההמונים למחקר, אנו נתקלים בבעיה, כיוון שחוכמת המונים מבוססת על ידע, הטרוגניות של ההמון, על מצבור ידע קיים וזמין לצורך קבלת ההחלטות, ועל כך שהמון זה אינו מוטה על ידי מערכת השולטת בהתנהגותם או נטיות פוליטיות. ברגע שמילים נמחקות מהלקסיקון – קיימת הטייה של חוכמת ההמון, ונגזלת ממנו הבחירה החופשית באמת אם לממן מחקר או לא.

כפי שהוכיחה ההיסטוריה, גם על חברות מסחריות אי אפשר לסמוך, בכל הנוגע למימון מחקר ניטראלי. עוד כשהותר השימוש בבסיס מדעי, נדרשו עשרות שנים ומחקרים כדי להוכיח את הנזק שבעישון. חברות הטבק השתמשו בטקטיקות רבות ומגוונות כדי למכור סיגריות, תוך שהסתירו במשך שנים את נזקי העישון, מימנו מחקרים שערפלו את הקשר בין עישון ומחלות ואף ממנו מחקרים בעד עישון[iii][iv]. חברות אלה היו שמחות להיפטר מהבזבוז המציק של תשלום מעל ל-200 מיליארד דולר שנכפה עליהן בארצות הברית, רק בגלל כל אותו "בסיס מדעי".

בנקודת המפנה בה אנו נמצאים כעת, בפתחה של שנת 2018, כדאי שנשים לב ונחליט מהם רצונות הקהילה שלנו. האם נתעלם משבע המילים האסורות הללו ונמשיך באומץ וחופש אקדמי לחקור הכל, או שנגלוש בעזרת אותן שבע המילים ואחרות שיוסיף לנו "האח הגדול" אל עבר "שיחדש" של בורות וחוסר יכולת חשיבה, אל עבר עתיד בו איש לא יבלבל אותנו עם העובדות, כי "בערות היא כוח"[v].

[i] אורוול, ג' (1971). 1984. (תרגום : ג' אריוך). תל אביב : עם עובד.

[ii] שם.

[iii] Bero, L. A. (2005). Tobacco industry manipulation of research. Public health reports120(2), 200.

[iv] Glantz, S. A., Bero, L. A., Slade, J., Hanauer, P., & Barnes, D. E. (Eds.). (1998). The cigarette papers. [Online reader version]. Retrieved from https://publishing.cdlib.org/ucpressebooks/view?docId=ft8489p25j;brand=ucpress

[v] אורוול, ג' (1971). 1984. (תרגום : ג' אריוך). תל אביב : עם עובד.