איסוף ואיתור מידע באוקיינוס הביג דאטה ללא תכנות (No-Code) – הרצאה של ד"ר גל יעבץ

הפוסט מבוסס על ההרצאה המרתקת של ד"ר גיל יעבץ מאוניברסיטת בר אילן, איסוף ואיתור מידע באוקיינוס הביג דאטה ללא תכנות (No-Code).

ההרצאה, שהתקיימה בזום ב5/7/22, היא הראשונה מתוך סדרת המיטאפים "מומנטום: מידע בתנועה" יוזמה משותפת של המחלקה למדעי מידע באוניברסיטת בר אילן עם הוועדה המתמדת של מנהלי הספריות האוניברסיטאיות.

כולנו מייצרים מידע בכל רגע נתון. כשאנחנו מחפשים ב- Google, כשאנחנו עורכים קניות בסופר, כשאנחנו מאזינים למוזיקה, מידע ונתונים על ההתנהגויות שלנו נאספים וניתן להפיק מהם תובנות משמעותיות. בהרצאה הוצגו מספר כלים מרכזיים ושימושיים שיכולים לסייע לנו, כמידענים ואנשים סקרנים, להגיע למסקנות מתוך נתונים שונים בדרך קלה ואפקטיבית.

נעבור על כלים אלו כאן בהרחבה: חיפוש שאלות, מגמות וטרנדים בהתבסס על מסדי הנתונים של Google, חיפוש דאטה ונתונים ממשלתיים מ-Dataset, ניתוח טקסטים ואימוג'ים מ-Twitter, ניתוח מוזיקה מ-Spotify, וגם – איך לייצר של רשת מאמרים אקדמיים  דרך Connected Papers.

כל הכלים הם חינמיים.

שאלות, מגמות וטרנדים דרך מסדי הנתונים של Google:

Answer the public, Trendy ו-Google Trends.

Answer the public כלי המאפשר לראות מה אנשים שואלים. הרבה מהחיפושים בגוגל הם לא רק מילה או נושא מסוים, אלא חיפושים הרבה יותר פרסונליים כמו "מהן שעות הפעילות של הספרייה?" "היכן אוכלים באוניברסיטת תל אביב?". וכך, הכלי מאפשר לחפש מילה או ביטוי בכל השפות, לסנן לפי מקום גאוגרפי ולראות מה נשאל בהקשר שלו במנוע החיפוש. למשל חיפוש המילה librarians מראה לנו מה אנשים שואלים על ספרנים.

הנתונים מוצגים באמצעות ויזואליזציה מרשימה של גלגל ענק, חלוקה לפי מילות שאלה ובהמשך לפי מילות יחס, חלוקה אלפביתית והקשרים נפוצים.

חיפוש Librarians  ב- Answer the Public

בין התוצאות אפשר למצוא תהיות פילוסופיות והתחבטויות מקצועיות כמו, לצד שאלות על סדרת טלוויזיה ושלל פנינים נוספות:

?Librarians what is it? Why librarians are important? Librarians what they do

?Librarian or farmer? Why librarians wear cardigans

אפשר לשנות את הוויזואליזציה לתצוגה טבלאית ולהוריד את המידע לקובץ CSV.

זהו כלי המהווה קו ישיר לדעת הקהל ולכן מועיל לכל העוסקים בקידום אתרים. למשל, אפשר להיעזר בו כדי לבחור כותרת אטרקטיבית לפוסט בבלוג או כדי להבין על מה כדאי לשים את הדגש בבניית אתר אינטרנט. מעניין גם לבחון דרכו הבדלים תרבותיים בין מדינה למדינה, דרך ניסוחי השאלות השונים העולים ממנו.

*יש הגבלה על מספר החיפושים החינמיים שאפשר לעשות ביום.

Trendy כלי נוסף המבוסס על מסד הנתונים של google, מאפשר לראות חיפושים פופולאריים מהיומיים האחרונים, על מה אנשים מדברים הכי הרבה בעולם או באזור מסוים. מדובר למעשה בנושאים שחלה עלייה בכמות החיפושים שלהם, דרך טובה להבין על מה מדובר בגוגל רגע נתון ואולי להחליף צפייה בחדשות.

הנתונים מוצגים באמצעות בועות כחולות, לחיצה על כל אחת מהבועות תוביל לכתבה רלוונטית לנושא שחיפשנו. אם הבועה גדולה במיוחד סימן שגם העלייה בכמות החיפושים הייתה משמעותית.

*תוצאות החיפוש ב- Trendy  מה- 19.7.2022

Google trends זהו הכלי המוכר מהבין שלושת כלי גוגל שהוזכרו בהרצאה (ואפילו הוזכר בניוזלטר הראשון שלנו). למרות שרבים מכירים אותו, לא רבים מודעים לשלל היכולות המתקדמות שלו. גם פה אפשר כמובן לחפש בשפות שונות ובאזורים שונים בעולם ובטווחי זמן מגוונים: שעה / יום / שנה / 5 שנים / זמן מותאם אישית ועוד… ולהשוות בין ערכים שונים.

 

לדוגמא: חיפוש ספריית סוראסקי בשנה האחרונה. אפשר לראות שיש עלייה בחיפושים בתקופות מסוימות כמו תחילת סמסטר ואפילו עליה מסוימת בקיץ וירידה בתקופות אחרות כמו חופשת הסמסטר.

דוגמה נוספת: עלייה בפופולאריות של המילה פיסטוק בשנה האחרונה

 

אם מסתכלים על טווח של חמש שנים זה אפילו מובהק עוד יותר…האם מדובר במגמה חשובה או טרנד חולף? בשביל זה צריך להמשיך לעקוב.

בנוסף, ניתן לערוך השוואות שונות באמצעות מפות: איפה מתעניינים בגביע העולם בכדורגל? היכן עומדת לפרוץ שפעת? את מי חיפשו במדינות ארצות הברית השונות בשבוע האחרון יותר – נתניהו או לפיד?

Page Views כלי משלים לשלושת כלי גוגל שנסקרו לעיל. הוא שייך לוויקיפדיה ונותן מידע על צפייה בערכים ספציפיים לאורך זמן, תוך אפשרות לעריכת השוואות שונות. אפשר גם להתייחס לטווח תאריכים ספציפי ולהתייחס להבדלים לפי ימים או לפי חודשים (שימו לב, כשנכנסים לאתר הוא באופן אוטומטי מראה לנו השוואה בין המונחים Cat ו- (Dog.

דרך נוספת להגיע לנתוני הצפייה היא מדפי הערכים עצמם. בוחרים ב-'מידע על הדף' תחת כלים באפשרויות המופיעות בצד ימין של הערך ולאחר מכן לוחצים על 'קישור לגרף סטטיסטיקת צפייה באתר  ‘wmflabs

 

הספרייה המרכזית ע"ש סוראסקי  גם כאן בחיפוש לפי חודשים, ניתן לראות שחודשי החיפוש המובילים במהלך השנה האחרונה היו אוקטובר ואפריל והפחות פופולריים היו ספטמבר ופברואר, בהתאם לזמני פתיחת שנת הלימודים וחופשות הסמסטר והקיץ.

 

זהו כלי פשוט מאוד לשימוש, המראה לנו עד כמה וויקיפדיה הפכה להיות כוח מוביל בכל הקשור למשאבי ידע.

מידע נוסף על טרנדים אפשר למצוא גם דרך Twitter, עם הכניסה לאתר בצד ימין נמצא את כפתור Trends for you,  דרכו נוכל לצפות בכל החיפושים המובילים באזור ברגע זה.

דאטה ונתונים

Dataset Search – כלי נוסף מבית גוגל, אך מעט שונה ממה שראינו עד עכשיו. זהו מעין מאגר מידע של נתונים המבוסס על מסדי נתונים של רשויות ממשלתיות וגורמים ציבוריים. בעזרתו ניתן להגיע למידע שיכול להיות רלוונטי לחוקרים ומדענים על משרדי ממשלה, שווקים ומדיניות.

הכלי מאפשר לחפש מידע מאוד ספציפי בעזרת שאילתות מורכבות, כמו – מה היו מותגי הקפה המובילים בספרד ב- 2020? מי שינסה למצוא את התשובה דרך מנוע החיפוש הרגיל של Google  ילך לאיבוד בתוך בליל של תוצאות לא בהכרח רלוונטיות. דרך Dataset אפשר לקבל את התשובה באמצעות חיפוש  בסיסי ופשוט.

המאגר מאפשר סינונים כמו: צפייה רק בנתונים חינמיים ובחירת סוג המסמך (תמונה, טקסט, טבלה). אפשר לראות גם מי הוא הספק של הנתונים ולהוריד קבצי Excel.

בינתיים המאגר עובד פחות טוב בעברית מכיוון שאין מספיק הנגשה של מסמכים ונתונים רשמיים בארץ. ארגונים כמו 'שקוף', 'התנועה לחופש המידע' ו'ישראל דיגיטלית' פועלים לפרסום הנתונים, לצד אינדוקס מסוים מ- Data.gov , אבל המאמצים הללו עדיין אינם מספקים.

עוד על המאגר מתוך גיקטיים ו- עולם המידע.

כלים מבוססי Twitter

Vicinitas – כלי לניתוח מידע מ-,Twitter שהיה עד לא מזמן אתר נישתי של עיתונאים. הוא קטן בהשוואה לרשתות חברתיות אחרות, אך ממשיך לצמוח ולגדול כל הזמן וניתן למצוא בו מידע ושיח שניתן להסיק מהם תובנות מעניינות. לכלי יש גרסה חינמית וגרסה בתשלום, הדרישה היחידה היא להיות מחוברים ל-Twitter. אפשר לחפש מידע על תגיות או מילות מפתח מובילות, על משתמשים או עוקבים מסוימים, למשל מי עוקב דמות ספציפית. ניתן גם לראות את כל הציטוטים בנושא מסוים (בגרסה החינמית עד 2000 ציוצים מעשרת הימים האחרונים). השימוש בכלי פשוט ואינטואיטיבי.

גם פה חיפשתי את המילה פיסטוק וקיבלתי 533 תוצאות. ניתן לייבא את הנתונים לקובץ Excel ולראות את הציוץ המלא, מי המשתמש?, מתי?, מי עשה לו ריטוויט? ואפשרויות נוספות כמו לארגן את הציטוטים לפי מספר הלייקים.

בשל עומס הנתונים, ד"ר יעבץ ממליץ להיעזר בכלי נוסף ששמו Voyant. זהו כלי לניתוח טקסט מעולם מדעי הרוח הדיגיטליים שתורגם לעברית על ידי ד"ר סיני רוסניק מאוניברסיטת חיפה, המאפשר לנתח כמויות גדולות מאוד של טקסט בצורה אוטומטית. דרכו ניתן לראות מילים נוספות החוזרות על עצמן בציוצים, לאתר ציוצים מובילים וליצור ניתוחי טקסט שונים.

Emojitracker – כלי חביב העוסק בניטור אימוג'ים בזמן אמת ב- Twitter. דרכו אפשר לראות כל אימוג'י שעושים בו שימוש ברגע נתון. ככה זה נראה :

 

*Emojitracker בזמן אמת

אם בוחרים את אחד האימוג'ים – אפשר לראות את הציוצים שנכתבים אתו כרגע, הסבר על המשמעות שלו ואת מיקומו במדרג הפופולאריות. זהו כלי קצת פחות שימושי מבחינה מידענית, אבל הוא נותן אינדיקציה למה פופולארי ברגע זה ומהו הלוך הרוחות הציבורי.

מוזיקה ורשתות

ניתוח האזנה למוסיקה (spotify) – כל פעולה שלנו משאירה סימן בעולם הנתונים, וכך גם האזנה למוסיקה של האומן או הלהקה האהובים עלינו. גם במימד הזה נוכל להיעזר בכלים שונים להפקת תובנות, כמו בכלי שמתייחס להאזנה ב-spotify ועל סמך נתונים יוצר ניתוח רשתות של קשרים ומשרטט יחסי גומלין בין אומנים ולהקות בהתאם לאנשים המאזינים להם.

לדוגמא: חיפוש של עומר אדם מראה את הקרבה שלו לאומנים אחרים כמו עדן בן-זקן, עדן חסון וסטטיק ובן-אל בהתאם להעדפות הקהל. ככל שהעיגול יותר גדול מדובר באומן שיש לו יותר מאזינים ברשת. באמצעות הוויזואלזציות הללו ניתן לזקק תובנות ומסקנות על העדפות האזנה, את מי שומעים ואת מי פחות שומעים וכדומה. ניתן להוריד את הניתוחים כקובץ JDF.

 

*ניתוח האזנה ל- עומר אדם דרך Spotify

רשתות באקדמיה

Connected Papers – ונסיים עם כלי המתאים לעולם האקדמיה. זהו פיתוח ישראלי של תלמידי מחקר המבוסס על הרעיון שכל פריט אקדמי הוא חלק מרשת: אפשר לראות את מי הוא מצטט, מי מצטט אותו ומה הקשרים בין כל הגורמים הללו. כל פריט הוא חלק ברשת של ידע אקדמי, כשאפשר גם לראות את מי כמעט ולא מצטטים והוא נשאר כעיגול מבודד. ד"ר יעבץ מלמד את הכלי יחד עם Scopus  ו- Web of science  וממליץ עליו כדרך נוספת למצוא מאמרים דומים כשנקודת המוצא היא מאמר רלוונטי בודד. את הנתונים המתקבלים ניתן להוריד כטבלה ולבצע עליהם ניתוחים סטטיסטיים.

*דוגמא לרשת הקשרים של המאמר Informational Justice: A Conceptual Framework for Social Justice in Library and Information Services  מתוך Connected Papers

 

מדעי הרוח הדיגיטליים בספרייה המרכזית – סדנת קריאה רחוקה

החל משנת הלימודים תשפ"ב (22-21) מועברות בספרייה המרכזית ע"ש סוראסקי סדנאות בנושאים שונים מתחום מדעי הרוח הדיגיטליים. סדנאות אלו נועדו להקנות לתלמידים ולחברי הסגל הכרות ראשונית עם כלים מרכזיים בתחום דרך תרגול מעשי בתנאי מעבדה. הסדנה הראשונה, שהתקיימה בדצמבר 2021, הוקדשה להכרות עם תחום ה-GIS. את הסדנה השנייה, שהתקיימה במאי 2022, ייחדנו לעולם הקריאה הרחוקה (Distant Reading).

מקובל לייחס את המונח "קריאה רחוקה" למאמרו של פרופ' פרנקו מורטי "השערות על ספרות העולם" (2000). בניגוד לגישה המסורתית לניתוח טקסטואלי, דהיינו קריאה קרובה של מספר מצומצם של טקסטים, מורטי הציע מסגרת אחרת לדיון בקורפוס עצום ממדים כספרות העולם: התמקדות ביחידות שהן קטנות בהרבה או גדולות בהרבה מן הטקסט עצמו (תחבולות, תמות, ז'אנרים) ללא קריאה ישירה של הטקסט, קריאה שבה המרחק הוא תנאי לידע. רק באמצעות התבוננות מרחוק בקורפוס גדול של יצירות ספרותיות, כתב מורטי, נוכל להבין מערכות מורכבות כספרות העולם.

במקור, מורטי כלל לא התייחס במאמרו לטכנולוגיה מבוססת מחשב. יחד עם זאת, במרוצת השנים הפך המונח שטבע לזהה למחקר טקסטואלי בכלים חישוביים. כלים מסוג זה מאפשרים ניתוח אוטומטי של טקסטים (לדוגמה, יצירת קונקורדנציה או איתור דפוסים לשוניים חוזרים). בנוסף לממד האוטומטי, כלים אלו מאפשרים לשלב באנליזה גם היבטים פרשניים, וזאת באמצעות תיוג וסימון ידני של הטקסט. כך, למעשה, מתאפשרת תנועה בין צורת שונות של ניתוח טקסטואלי, אוטומטי וידני.

בסדנה שהועברה בחודש מאי התנסינו בשימוש בשני כלים:

  1. AntConc: תוכנה חופשית למחקר חישובי של טקסטים שפותחה ע"י פרופ' לורנס אנטוני מאוניברסיטת וואסדה, יפן. אל תוכנה זו הטענו קורפוס של כ-400 ביקורות סרטים בשפה האנגלית מן האתר IMDB, אותו ניתחנו בעזרת המודלים השונים של התוכנה: חיפוש מילות מפתח ותצוגתן בהקשר, היקרותן של מילים, יצירת קונקורדנציה והשוואה בין קורפוסים. ניתוח זה אפשר לנו לאתר דפוסים לשונים חוזרים, תבניות, וצירופי מילים בקורפוס.
  2. CATMA: תוכנה חופשית לניתוח אוטומטי ממוחשב ותיוג חופשי של טקסטים מאוניברסיטת המבורג, גרמניה. בניגוד ל-Antconc, שמאפשרת אך ורק ניתוח אוטומטי ממוחשב של טקסטים, תוכנה זו מאפשרת לשלב בין ניתוח אוטומטי לניתוח ידני של טקסט. אל התוכנה הטענו את הסיפור "העוורת" מאת יעקב שטיינברג, אותו המשתתפים הורידו מפרויקט בן-יהודה. בחלק זה של הסדנה התנסינו בוויזואליזציה של הטקסט בעזרת המודל הוויזואלי של התוכנה, וייצרנו גרפים מסוגים שונים: תפוצה, עץ כפול וענן מילים. לאחר מכן ייצרנו ספריית תגים, תגים, תתי-תגים ואף תייגנו את הטקסט עצמו, כל זאת בעזרת מערכת התגים המשוכללת של CATMA.

בסדנה, שנמשכה ארבע שעות, השתתפו שלושה עשר תלמידים לתארים מתקדמים וחברי סגל מהפקולטות למדעי הרוח והאומנויות. בקישור המצוי בתחתית פסקה זו תוכלו לעיין בחוברת העבודה שחיברנו עבורה. במדור הדרכה וייעץ נשמח לסייע פרטנית לתלמידים וחברי סגל המעוניינים להכיר לעומק את עולם הקריאה הרחוקה כדי לשלבו במחקרם.

חומרי הסדנה:

חיפוש קולי והספריות האקדמיות

 חיפוש קולי והספריות האקדמיות

בסרט 'שם הוורד' זכורה הסצנה בה הדמויות הראשיות המגולמות על-ידי שון קונרי וכריסטיאן סלייטר מגלות את מבוך הספרייה במנזר ימי-ביניימי, ומבצעות מחקר בין ספרי הענק הפזורים לכל עבר.
שש מאות שנה אל העתיד, ספרי הענק הפכו למאגרי מידע והשיטוט הפיזי בין המדפים, הספרים והדפים -לחיפוש באינטרנט. אך עדיין החוקר הוא זה שמבצע את מלאכת החיפוש.

האם זה מה שצפוי לנו בעתיד בו טכנולוגית החיפוש והמחקר משתנות?

מה זה חיפוש קולי?

חיפוש קולי הוא טכנולוגיה לזיהוי דיבור המאפשרת למשתמשים לבצע חיפושים דרך פקודות קוליות. בשנים האחרונות, החיפוש הקולי הפך לנגיש יותר וכתוצאה מכך גם שימושי יותר עם השיפור הרב שחל בטכנולוגיות NLP – זיהוי שפה טבעית (Natural Language Processing) המתבצע בעזרת למידת מכונה וכריית מידע – תחומים בבינה מלאכותית. התפוצה הרחבה של מכשירים ניידים ועוזרים חכמים/וירטואלים (virtual/smart assistant) מסייעת גם היא לשיפור הטכנולוגיה.

כך, החיפוש הקולי שהחל את דרכו כאפשרות באפליקציות כדוגמת חיפוש בגוגל, וויז וכדומה, משמש כעת כדרך החיפוש העיקרית בעוזרים החכמים כגון: אלקסה (Alexa) של אמזון, סירי (Siri) מבית אפל וקורטנה (cortana) ילידת מייקרוסופט. עוזרים חכמים אלו מוזנים במידע המגיע מהפלטפורמות האינטרנטיות השונות וממכשירי אינטרנט של הדברים (IoT) שבשימוש יומיומי.

קצת נתונים סטטיסטיים (מקור):

  • על פי נתוני גוגל ואפל היקף החיפוש הקולי בגוגל ובסירי נע בין 25-20 אחוז מכלל החיפושים.
  • עד שנת 2020 כ- 50% מכלל החיפושים יהיו חיפושים קוליים, וכמות זהה תעשה ממכשירים נטולי מסך (רמקולים חכמים וכדומה).
  • השימוש בחיפושים קוליים עלה בין השנים 2016-2008 פי 35.
  • 60% מהמשתמשים בחיפוש קולי החלו לעשות זאת בשנה האחרונה (2017).
  • 72% ממשתמשי העוזרים החכמים טוענים שהעוזרים הם חלק משגרת יומם.

יתרונות

היתרונות של חיפוש קולי ושימוש בעוזרים חכמים ווירטואלים (virtual assistant) רבים וברורים. ראשית, הקלדה. אין בה צורך. האדם הממוצע יכול להקליד כ- 40 מילים בדקה בעוד שבדיבור הקצב נע בין 150-110 מילים בדקה, כך שמתקיים חיסכון בזמן עבור המשתמשים. מעבר לכך, אנשים עם מוגבלות פיזית שאינם מסוגלים להשתמש במקלדת, יכולים כעת לבצע בקלות יחסית פעולות שדרשו בעבר זמן, מאמץ ובקשת עזרה.

נוחות. המשתמשים יכולים בעזרת פקודות קוליות לבצע פעולות שבעבר דרשו מאמץ רב, כגון לקום מהכיסא ולהפעיל את שואב האבק הרובוטי, להתקשר להזמין ארוחת ערב או לבצע משלוח קניות מהסופר. כמו כן, מיומנות דיבור לעומת מיומנות הקלדה מגיעה באופן טבעי ללא צורך בהכשרה או למידה מיוחדים.

יתרון נוסף הוא שמכשירים אלו תורמים לצמצום הפער הדורי. פעולות שיכלו להיתפס כמאיימות עבור אנשים מבוגרים יכולות להתבצע כיום בעזרת בקשה קולית פשוטה, וכך לסייע להנגשת שירותים רבים הזמינים כיום דרך האינטרנט אך רחוקים מלהיות זמינים עבור אלו החוששים מטכנולוגיות חדשות.

על חודו של קול

החיפוש הקולי והעוזרים החכמים על יתרונותיהם הרבים נוצרו על ידי חברות פרטיות בהתאם לאסטרטגיה המסחרית שלהן. באופן זה, אלקסה משמשת לרכישות דרך אמזון, סירי משמשת לרכישת מוצרים ושירותים מאפל וגוגל כמובן מבקשים לאסוף מידע נוסף על המשתמשים לטובת התאמת פרסומות. כמו כן, ההתאמה לממשק הקולי מובילה לכך שמתוך תוצאות החיפוש לרוב תושמע באוזני המשתמש התוצאה הראשונה בלבד התואמת את אלגוריתם החיפוש. זאת בהשוואה לדף התוצאות במנועי החיפוש הקיימים היום, המציגים את עשר התוצאות הראשונות שעולות.

אילו השלכות יכולות להיות להצגת התוצאה הראשונה בלבד?
אם לדוגמה אתם נעזרים בקורטנה לבצע הזמנות לחופשה הקרובה באיטליה ומבקשים לשכור רכב – האם הרכב יוזמן מ- Avis או מ- Sixt? אולי בכלל מחברה מקומית? בחירת התוצאה הראשונה כברירת מחדל בעצם מנטרלת את אפשרות הבחירה מהמשתמש עצמו, ומעניקה אותה למייקרוסופט לפי האינטרס הכלכלי שלה שהוא לא תמיד תואם את רצון המשתמשים.

על כן נשאלת השאלה – האם שירות זה מתאים לשימוש בספרייה אקדמית כמנוע חיפוש ועוזר אישי?

נא לשמור על השקט

כדי לענות על כך, תחילה יש להכיר את צרכי קהל המשתמשים.

בספרייה האקדמית צרכי המשתמשים מגוונים ומשתנים כשמדובר בצוות הספרייה, בסטודנטים וחוקרים וכן בין תחומי הלימוד והמחקר השונים. לדוגמה, סטודנט הלומד ספרות ופילוסופיה לתואר ראשון יכול להתעניין במטלות שבועיות להגשה, קריאת חומרי לימוד המוצגים על ידי המרצה (ולרוב מועלים ל- Moodle) ואיתור ספרים ומאמרים עבור עבודות סמינר ורפראטים. לעומתו, חוקר מתחומי ההנדסה יכול להתעניין בסקירה של חומרים אקדמיים ומקצועיים חדשים או אפילו במציאת פטנטים רשומים.

שימושים אלה מתקיימים בעולם אקדמי משתנה הדורש פרסונליזציה לשירותים כגון קורסים מתוקשבים, גישה מרחוק למאגרי מידע, תוכנות לניהול ביבליוגרפיה ותוכנות שונות המדברות אחת עם השנייה.

מה יהיה העתיד של טכנולוגיות אלו?

תוצאה עתידית אפשרית, היא התכנסות של כלל השירותים האקדמיים והספרייתיים לגורם אחד המסוגל לסייע בלימוד ובמחקר יחדיו. התכנסות דומה של טכנולוגיות ראינו בטלפון החכם בו: הטלפון, המצלמה, המחשב, ה-GPS ומכשירים ושירותים נוספים חוברו למכשיר "חכם" אחד.
ניצנים לחיבור שכזה ניתן למצוא במערכת Leganto של אקסליבריס, בה ניתן ליצור רשימות קריאה לקורסים עם קישור לעלמא ולפרימו – באופן היוצר שילוב אקדמי-שירותי בין המרצים, הסטודנטים והספריות. כבר היום, חברה בשם ConverSight.ai פיתחה מוצר בשם Libro המאפשר לאלקסה להתממשק עם קטלוג הספרייה ועל ידי כך לבצע בו חיפושים בסיסיים בשפה טבעית.

כעת כשכל אלו מחוברים, הדרך לעבודה ישירה של הסטודנט או החוקר למול מערכת חיפוש וניהול מחקר אקדמי משולבת הופכת לקצרה יותר. בואו נדמיין לרגע שאקסליבריס מפתחת מערכת משולבת, מן עוזר חכם שכזה ונקרא לו בשם – 'אֶקסל'.

עד כמה רחוקה המציאות בה סטודנט מבקש מהעוזר החכם: "אקסל, הגש את מטלה 3 בקורס 'אמנות הנאום והשכנוע ביוון וברומא', המשך להשמיע את יחידה ארבע ופתח את המאמרים לקריאה לשיעור הבא".
עד כמה רחוק המקרה בו חוקרת מבקשת מהמערכת את הבקשה הבאה: "אקסל, הציג לי את המאמר של בן ג'ייקובס על אתיקה באינטרנט משנת 2017. לאחר מכן הכן רשימת תזות באנגלית בנושא ICT ופילוסופיה מחצי השנה האחרונה".

עכשיו דמיינו את האפשרויות כאשר גוגל, על כל יכולותיה, תפתח מערכת שכזו.

בסרט 'היא' (Her) מ- 2013 חואקין פיניקס התאהב בעוזרת הדיגיטלית שלו סמנתה, שלטענתו מכירה אותו טוב יותר מכולם…

אתגרים ויתרונות

עוזר חכם שיעניק לחוקרים והסטודנטים את כל שירותי הספרייה והאקדמיה אותם הם מבקשים, נשמע כמו פתרון אידיאלי עבור אוכלוסיות אלו. אם הדבר יצא אל הפועל, ניתן להניח שכמות הכניסות לספריות והביקוש לשירותי היעץ יפחת. מצב זה, יכול להוות אתגר עצום עבור הספריות שירידה בכמות המבקרים עלולה לגרור אחריה צמצום בתקציבים ובכוח האדם.

אז להתחיל לחפש עבודה חדשה?

רעיון 'הספרייה כמקום' מהווה כבר היום פתרון מסוים לירידה בכמות המבקרים בספריות. יצירת אזורי למידה משותפים, הוספת מחשבים ושירותים שאינם קשורים לשימושים המסורתיים של הספרייה. כל אלו נותנים ערך מוסף לספרייה, ומושכים קהל שמרחב למידה שקט או קבוצתי אינו בהישג ידם. כמו כן, הספרייה כמוסד יכולה לנצל חללי עבודה וגיוס תרומות לצורך יצירת מרחבי למידה ומחקר חדשניים כגון חדרי מציאות מדומה ורבודה (VR, AR). פתרון זה יכול להועיל עבור חוקרים המתקשים באיתור מרחב לביצוע מחקר ומציאת מימון להקמתו.

יתרון מובהק נוסף שיש לספריות על פני עוזרים חכמים למיניהם הוא כמובן הגורם האנושי. ישנו פרדוקס מסוים בו עקב הצפת המידע- ככל שיש יותר פריטים שזמינים אלקטרונית, כך קשה יותר למצוא את המידע הרלוונטי. מענה אנושי ומקצועי יכול לסייע רבות במקרים אלו בהבנת הבעיה ופתרונה. חשיבות נוספת נובעת מכך שטכנולוגיות מידע אלו מאפשרות לנו לבצע פעולות רבות בפשטות יחסית, אך במחיר של התרחקות חברתית. ניתן לראות זאת כמובן בטלפונים החכמים המאפשרים גישה לעולם ומלואו אך מצמצמים קירבה אישית. במקרה של מחקר אקדמי, הקשר הבין-אישי חשוב לצורכי העשרה, החלפת רעיונות והשאת עצה באופן בלתי אמצעי – והספרייה יכולה להוות מקום לחיבור שכזה בין חוקרים וסטודנטים.

נראה שקשה יהיה להתחמק מהשינוי הטכנולוגי העתיד לעבור על העולם האקדמי והספריות בכללותו. אך יכול להיות שעם התאמה נכונה של הספריות לקהל המשתמשים שלהן ניתן יהיה לשפר את השירות לאין ערוך ולהמשיך ולתמוך במחקר בעולם משתנה.

פרשת פייסבוק: איך שיפור חווית המשתמש משפיע על הכיס של כולנו

השבוע קיבלנו דוגמה מאלפת לקלות שבה נאסף עלינו מידע מהרשת, לכמות מידע זה, ולאחד השימושים בו: הטיית תוצאות בחירות. פן נוסף של אותה קלות איסוף הוא שאלת האחריות של מחזיקות המידע לשמירה על המידע פרטי זה של המשתמשים וזכותה להשתמש בו. כל כלי התקשורת זעקו חמס כאשר נחשפה פרשת דליפת מידע מפייסבוק.  ראשיתה ב-2014, אך היא התגלתה וטופלה רק שנתיים מאוחר יותר. הפרשה אכן חמורה, אך רוב כלי התקשורת עסקו בעיקר בהיבט של דליפת המידע ופחות בשערורייה של השימוש שנעשה במידע זה – החברה שקיבלת את המידע השתתפה לכאורה בהטיית תוצאות בחירות פוליטיות.

כל האירוע מדגים עד כמה נגיש ולא מוגן המידע שאנו בוחרים לפרסם על עצמנו ברשת. רשתות חברתיות ואתרים אינם כופים עלינו הצטרפות, ואת רוב המידע שאנו מספקים להם, אנו בוחרים אם לציין על עצמנו – היכן גדלנו ולמדנו, מה מצבנו המשפחתי, עם מי שוחחנו וכמה זמן בטלפון, אילו דברים מעניינים אותנו. כל אלה פרטים אישיים לחלוטין שאנו בוחרים למסור לאותה חברה בתמורה לשיפור חווית המשתמש שלנו. מלבד כל אלה, אנו משתמשים ברשתות החברתיות כדי לחלוק את חיינו עם חברינו הקרובים והרחוקים. כבר לא צריך לספר על הטיול האחרון לכל חבר בנפרד בשיחת טלפון או מפגש פנים אל פנים. תולים תמונות, חוויות ומחשבות על הקיר, ומגיבים לקירות של אחרים. קצר, מהיר, נעים ונוח לגלול עד אין סוף.

כל המידע הזה שאנו מפרסמים ומשתפים הוא משאב רווחי ביותר לחברות האוספות ומנתחות אותו. לנו, יצרני המידע, יש רק אשליה של שליטה בו. בסופו של יום החברות בוחרות מה ייעשה בו, וההשפעה של בחירה זו מתחילה להכות גלים הרבה מעבר לגבולות הרשת החברתית, והרבה מעבר לניסיון להשאיר אותנו זמן רב יותר באפליקציה כדי שנחשף גם לפרסומות. מה שאנו בוחרים לחלוק עם העולם מלמד על בחירות עתידיות שאנו צפויים לבחור כאשר נחשף למסרים שונים, וכיצד אפשר ליצור לכל אחד מאתנו את המסר האישי המדויק כדי להניע אותנו לכיוון רצוי, ועדיין לגרום לנו לחשוב שאנו חיים בדמוקרטיה ובחירותינו חופשיות. בפועל רצוי שנזכור שאנו בוחרים לפי רצונו של בעל המאה ושל שירות המסרים שלו. אם עד היום חשבנו שרק משטרים טוטאליטריים מעסיקים אנשים שתפקידם לקדם מידע מחמיא ולדחוק לעמודים האחוריים של גוגל תוצאות לא מחמיאות למשטר, קמנו וגילינו שאצלנו חברות ואינטרסים כלכליים שולטים בתוכן שנחשף אליו ובבחירות שנבחר. רק ההיסטוריה תשפוט את תוצאות בחירת טראמפ לנשיא ואת עזיבת בריטניה את האיחוד האירופי.

כרגע, כל מדינה שחוקקה חוק הנוגע להגנת פרטיות ושימוש במידע אישי, מנסה לבדוק כעת את התנהלותה של פייסבוק בנושא השמירה על המידע של משתמשיה. החקירות שיתנהלו יפרנסו בעיקר ציים של עורכי דין ופוליטיקאים שישחררו הצהרות וססמאות ויכתבו עוד חוקים, שכרגיל לא יעמדו בקצב התפתחות הטכנולוגיה. גם העיתונות המסורתית מוחה על האירוע, בקול גדול, במיוחד לאור הצניחה הדרסטית במספר צרכניה. העיתונות המסורתית צפויה להיות בין המרוויחים מפרשייה זו,  אם ציבור הנפגעים יחזור לצרוך מידע מהעיתונים וערוצי החדשות, ולא מהרשתות החברתיות, וכך תחזיר אליה גם תקציבי פרסום שנדדו אל פייסבוק.

בפועל כוחות השוק והאינטרס הכלכלי הם שיקבעו מה יעשה במידע שלנו. פייסבוק עצמה הודיעה שנקטה צעדים והגבילה את הגישה של אפליקציות דומות למידע על המשתמשים. אבל אף אחד לא באמת יכול להבטיח שלא תתרחש דליפה עתידית ממנה או שיום אחד תחליט לשנות את דעתה בנושא. המידע שנתנו לה אחרי הכל – הוא שלה. וחשוב לזכור – פייסבוק אינה החברה היחידה שאוספת מידע עלינו: דפדפנים, מעבדי תמלילים, תוכנות עיבוד גרפי, וסתם אתרי אינטרנט – כולם מנסים לשפר את חווית המשתמש, לנחש טוב יותר מה הוא רוצה, למשוך אותו אל האתר ולפתות אותו להישאר, בכל דרך אפשרית. כמה מכם הקלקתם ALLOW לבקשות שונות מהדפדפן בלי לקרוא ממש מה אישרתם? וגם אם לא נדרשתם לאשר דבר בעת הגישה לאתר, פרסומות המוצגות באתרים שותלות קובצי קוקיז במחשבנו, כדי לעקוב אחרי תנועת הגולשים, גם אחרי שיצאו מהאתר בו פגשו באותה פרסומת. בעזרת "עוגיות" אלה יכולים אותם מפרסמים לאסוף נתונים על הרגלי הגלישה שלנו ולדייק בפרסומות המוצגות לנו. מדובר בחסכון עצום בתקציב הפרסום, לעומת זה הנדרש לפרסום בכלי התקשורת המסורתיים לקהל עצום ואנונימי.

למול אשליית הפרטיות ברשת, שגם החוק אינו מצליח להציע לנו הגנה אמיתית מאיבודה, הקריאות להתנתקות מפייסבוק הן אירוניות, במיוחד כשהן באות מטייקונים כמו מייסד Whatsapp, בריאן אקטון, שמכר את החברה שהקים לפייסבוק, או מאילון מאסק, מייסד שירות התשלומים ברשת PayPal. שניהם יודעים היטב מה כמות המידע הנאגר על משתמשים בשרתי חברות. מאסק אגב, הוא משתמש פעיל ברשת החברתית המתחרה – Tweeter. עבור טייקונים כמותם, קריסה של פייסבוק היא מכה קטנה בכנף בהיבט הכספי והפרסומי. גם מארק צוקרברג, מייסד פייסבוק שאיבד כשבעה מליארד דולר בעקבות הפרשה, לא ממש צריך לדאוג מה יהיה עם קרן הפנסיה שלו.

לעומת הטייקונים הללו, מי שכן צפוי להרגיש את קריסת פייסבוק בכיסו הם בעיקר המפרסמים הקטנים המקדמים את עסקיהם בעזרת תשלום לפייסבוק, והזעירים, המשווקים את מרכולתם בעזרת שמועות ומבצעים בקבוצות. חשבו על כל בעלי העסקים שהציעו את מרכולתם או פנו ללבכם כדי לגייס כסף למטרות שונות, או הציעו מבצעים לחברי הקבוצה. כמה מכם פנו לבעלי עסקים קטנים דרך המלצות בקבוצות ולעומת זאת כמה מכם פנו לרכוש רכב מיבואן בגלל פרסומת בפייסבוק? ביום שאחרי פייסבוק, אותם עסקים קטנים יאבדו את הפילוח המדויק שפייסבוק מציעה ויאלצו להשקיע תקציב רב יותר בפרסום שיתחרה עם מודעות רבות אחרות. רק חשבו על הפרסום אליו אתם נחשפים תוך כדי הגלילה של הפיד, לעומת כל הכרוך בכניסה לאתר מודעות ייעודי לחיפוש בעל מקצוע כלשהו. כל אותם מפרסמים זעירים יפגעו מקריסת פייסבוק פעמיים: גם כמפרסמים, אבל, ובעיקר כמשקיעים בשוק המניות.

כולנו מושקעים במניות בין אם באופן עצמאי או כחוסכים שכספם מושקע על ידי משקיעים מוסדיים. קרנות כמו קרנות הפנסיה, קופות גמל, חברות ביטוח ומשקיעים מוסדיים אחרים,  משקיעים את כספי העמיתים החוסכים, כדי לשלם בעתיד למפקידים גמלה או תשואה על חסכונם. כחוסכים בעזרת אותם משקיעים מוסדיים נרגיש את קריסתה של פייסבוק כאשר נקרא את הדוח השנתי ששולחות לנו הקרנות, ונגלה מה שוויו. זוכרים את קריסת טבע? בימיה הטובים היא הייתה שווה בערך עשירית מפייסבוק.

פייסבוק והפרשייה הנוכחית היא רק משל וסימפטום לבעיה. היא משל לחברה שכולנו מושקעים בדרך זו או אחרת במניותיה, ושאת נפילתה אנו עלולים לחוש בכיסנו; היא משל לחברה שאנו מוסרים לה מידע אישי, שלא היה עולה בדעתנו למסור בנסיבות אחרות, ומשל לתוצאות השימוש במידע זה. היות שפייסבוק היא כמו כל חברה אחרת בתחום, גם אין טעם של ממש לנטוש אותה, כי הפרקטיקה של שימוש במידע לשיפור החוויה היא פרקטיקה בה נוהגים כולם. ואולי עכשיו נלמד לסנן בקשות, ולקרוא טוב יותר לעומק את הגדרות הפרטיות גם שלה וגם של מתחריה.

הייתם מוסרים את מפתחות ביתכם לזר? ומה לגבי המידע הפרטי שלכם?

היום, 28/1 מצוין במדינות רבות בעולם יום פרטיות המידע והגנתו. מטרתו של יום זה היא לעורר מודעות להגנה על פרטיות ונתונים. כיום, כאשר אנו חיים בעידן ה-BIG DATA קל לחברות לכרות מידע מבסיסי נתונים, לנתח את ים הידע הנאסף במהירות, להפיק מנתונים אלה תובנות אודות תבניות המניעות את עולמנו, וכך לצפות מהומות או לנבא התפרצות מגפות. למה אם כך יש צורך במודעות לפרטיות? הצורך במודעות לפרטיות המידע רק גדל כיוון שאסור לנו לשכוח מאין באו שלל הנתונים עליהם מתבסס ה-BIG DATA ואילו עוד שימושים יש למידע זה בדרך.

היום, כשלכולנו נייד בקצה היד, כל תהליך איסוף המידע, פיענוחו והפצתו הפכו קלים וזולים. מהפכת המחשוב שעבר העולם הקטינה את המחשב והפכה אותו למהיר. לשם השוואה – מערכת הניווט של חללית אפולו, פאר היצירה של אותה תקופה שקלה 32 ק"ג וזיכרון העבודה שלה היה 64KB RAM. בימינו הטלפונים שוקלים פחות מ- 200 גר', וזיכרון העבודה שלהם הוא בממוצע 4GB RAM, פי 64,000. מקצה היד שלנו זורם המידע אל מחשבי הענן שגודלם וכוחם המשותף כבר בלתי נתפס. כוח המחשוב המשותף של מחשב סריגי שכזה, מאפשר, כאמור, פתרון בעיות המטרידות את האנושות כמו חיזוי מגפות, אסונות, שאלות מסובכות כמו קיפול חלבונים ומציאת תרופות חדשות. אבל יש לו גם צד מסחרי.

בעבר כדי למכור מוצר, נאלצו המוכרים לכתת רגליהם ולעבור בין לקוחות, או לנחש היכן יקבל בית העסק שלהם חשיפה – היכן למקם חנות, והיכן לפרסם אותה: זמן שידור באמצעי התקשורת המוקדש לפרסום קצר ויקר וכך גם מודעות בעיתונים. גם הסתמכות על מובילי דעה כאמצעי פרסום היא בעייתית, כיוון שהיא מצריכה איתור שלהם, ומידה רבה של שכנוע ותקציב כדי שיפעילו את השפעתם ויפרסמו את המוצר. תהליך יקר ואיטי. היום, כאשר כולנו מחוברים לרשת האינטרנט, כל המכשירים המחוברים לרשת אוספים מיליוני טרה-בייטים של מידע ושולחים אותם בחזרה לענני המחשוב. משם הם נאספים ונמכרים על ידי חברות לכל מי שמוכן לשלם.

עולם זה של מסחר במידע הפרטי שלנו מתנהל הרחק מעל ראשינו, ואנו נהנים רק מפירורים הניתנים לנו כדי שנמשיך לספק אותו. בכל פעם שהזדהינו למערכת כלשהי, הצטרפנו למעשה למאגר המידע של אותה חברה, והתחלנו לתת לה פרטים אישיים עלינו. בתמורה מבטיחה לנו אותה חברה שתספק לנו שירות או מוצר מותאמים יותר לצרכינו, הטבות ופינוקים שונים בדמות הנחות למשל. מצד שני, מרגע שמסרנו את אותו מידע פרטי, איבדנו שליטה עליו. כל עוד אנו לקוח שנכנס לחנות, רכש מוצר ולא הזדהה, החנות יכולה לדעת רק שלאותו מוצר יש ביקוש. מרגע שהשתמשנו באמצעי זיהוי כלשהו המחבר אותנו הצרכנים למוצר, החברה יכולה להמשיך ולנסות למכור לנו מוצרים נוספים שלדעתה אנו צריכים: קניתם חולצה? רוצים גם מכנסיים, גרביים ונעליים? אולי תרצו משהו משותפינו המוכרים גם תיקים? תוכלו לקבל גם הנחה עבור רכישת נוספת בחנויות אחרות במועדון הלקוחות שלנו. נשמע מוכר?

את הקופאית המנסה למכור לנו עוד כמה מוצרים לא נחוצים כולנו מכירים. גם את הקופונים "המותאמים אישית" שמגיעים כל העת. אבל כמה מכם שמו לב להצהרת הפרטיות של האפליקציות? כמה שמו לב לרשימה הארוכה של הרשאות שאפליקציות שונות מבקשות לשימוש בטלפון הנייד? כמה מכם אישרו אותן מבלי לעצור שנייה ולחשוב למה? למה אפליקציה אחת צריכה לדעת אילו אפליקציות אחרות מותקנות על הטלפון? למה אפליקציות שבינן לבין מיקום גאוגרפי אין כל קשר, צריכות לדעת היכן אנחנו ולאילו רשתות WIFI התחברנו? קל להבין מדוע אפליקציות כמו WhatsApp צריכות גישה לרשימת אנשי הקשר שלנו, אבל למה אפליקציה להזמנת מונית צריכה להכיר אותם או מדוע היא צריכה גישה ללוח השנה שלנו? אנו צורכים את האפליקציות הללו אך רובנו לא שמים לב, ובלי משים מאשרים לאפליקציות לאסוף עלינו מידע פרטי. לעומת זאת האפליקציות, מצהירות בהצהרת הפרטיות שלהן כי מידע שאנו מוסרים להן מרצוננו הוא רכושן ויתכן שמידע זה יועבר גם לגורם שלישי. וכך לא רק הרגלי הקנייה שלנו הופכים לרכושן, גם תמונות שאנו משתפים, סטטוסים שפרסמנו, וכל פרט מידע אחר שפרסמנו הוא שלהן ויכול לעבור הלאה לגורם שלישי.

מיהו אותו "גורם שלישי"? מדובר בחברות מסחריות אחרות המשלמות עבור המידע, אבל לא רק. לעיתים מדובר בגורמים ממשלתיים הדורשים מחברות להעביר להן מידע על הגולשים מסיבות ביטחוניות, כמו מניעת פשע או טרור. גם כאן ההגדרות בעיתיות. במשטרים טוטאליטריים המנסים לשלוט במידע שמקבלים אזרחיהן ובמידע העובר ביניהם, ברור לנו שהממשלה המאזינה לאזרחיה ויודעת עליהם הכל. אבל אסור לשכוח שגם ממשלות מערביות עלולות לגלוש במדרון החלקלק של מעקב אחרי האזרחים, כדי להטות את דעת האזרחים לדעה הרצויה לממשל.

כאשר כל המערכות סביבנו מחוברות לרשת האינטרנט, לא מעשי שנתנתק לחלוטין. אבל מה כן אפשר לעשות?

  • היו מודעים לזכותכם לפרטיות ואל תמסרו מידע אישי מיותר. הוא שווה לקמעונאיות הרבה יותר מאשר קופסת השוקולדים ביום ההולדת וכל ההנחות שתקבלו בעזרת הקופונים, ושווה יותר מכל יתרון בכל אפליקציה.
  • אל תתפתו להשתתף בשאלוני רשת חביבים המחייבים כניסה עם חשבון גוגל או פייסבוק. הפרופיל שלכם שווה הרבה יותר מהידיעה מה פירוש אותיות שמכם באלפבית הרוני, איזו חיה הייתם בגלגול הקודם או כמה אתם חכמים.
  • קחו לכם מספר דקות ועברו על רשימת ההרשאות של כל אפליקציה בטלפון הנייד. אם הטלפון מאפשר – כבו כל הרשאה מיותרת. כמובן שמיד תוזהרו שהאפליקציה עלולה לא לפעול בלי ההרשאה הנסגרת, אך לא צריך להיבהל. הרוב יפעל גם בלי ההרשאות המיוחדות, ומה שלא ניתן תמיד לאישור מחודש.
  • הגדירו חשבונות כפרטיים ברשתות החברתיות, כך שרק מי שתאשרו יוכל לראות מה שיתפתם.
  • קיבלתם פנייה או שיחת טלפון מגורם לא מוכר ולא רצוי – חסמו אותו.
  • פנו למפתחים אם אפשר ודרשו לדעת – לאן הולך המידע. שימו לב גם לשינויים בהגדרות הפרטיות ופנו לחברות. תלונות גולשים גורמות לחברות לשמור טוב יותר על פרטיות תוכן הגולשים.

זכרו תמיד שהמידע האישי הוא שלכם. בדיוק כמו מפתחות הבית או הרכב. גם אותם לא תמסרו לזרים בלי לדעת למה. קחו את היום להתחיל לקחת בחזרה את המושכות אליכם.

יום עיון בנושא "חשיפה לעולם המחקר הרפואי"

בשבוע שעבר התקיים בספריה למדעי החיים ולרפואה ע"ש גיטר סמולרש, יום עיון בנושא "חשיפה לעולם המחקר הרפואי". בחסותה של הגב' מירה ליפשטיין, מנהלת הספרייה למדעי החיים ולרפואה. ביום נכחו מנהלי ספריות רפואיות בבתי החולים, ספרנים בספריות רפואיות, ספרנים ומידענים עצמאיים, ואורחים אחרים.

את היום פתחה הגב' מירה ליפשטיין, מנהלת ספרית מדעי החיים ורפואה, בדברי ברכה בהם הדגישה את החשיבות והתרומה של השתלבות צוותי הספריות במערך המחקר ובתמיכה שביכולתם לתת לחוקר, כל זאת לאור השינויים הטכנולוגים המתקדמים בעידן הנוכחי. לדברי הפתיחה.

בהמשך היום דיברה הגב' מירב בוך, מנהלת הספריה הרפואית במרכז הרפואי אסף הרופא, על הספריה ותרומתה מתומכת מחקר למקדמת מחקר. מירב חתמה וסיכמה במשפט:

"אנו אנשי הספריות מקבלים הזדמנות להרחיב את הידע וההבנה לגבי המערכות שעוסקות בארגונים שלנו בקידום מחקר, וכן על נושאים נוספים שהחוקרים מתמודדים אתם. זוהי הזדמנות לשמוע, להשמיע ולקבל רעיונות לשיתופי פעולה. לא צריך להמציא את הגלגל. אנחנו יכולים בכוחותינו לעשות שינוי." למצגת ההרצאה.

 

הד"ר בועז תדמור, ראש רשות המחקר במרכז רפואי רבין ומנהל בית החולים בעברו, סיפר על תפקידה של רשות המחקר במרכז הרפואי רבין. ד"ר תדמור הסביר כיצד חזון בית החולים עומד לנגד עיניו וכיצד רשות המחקר שמה לה בחזית יעדיה את ערך העלאת שביעות הרצון של החולים מבית החולים. בעזרת הפיכתו של בית החולים לבי"ח "מגנט", המושך אליו רופאים וחוקרים מקצועיים ומומחים בתחומם, ומצד שני מושך אליו את המקרים הטיפוליים הקשים (המצריכים טיפול) נוצר שיתוף פעולה פורה לייצור מחקר ולימוד וזוכה לעידוד ותמריץ קבוע מהנהלת בית החולים.

 

מהגב' לאה פאיס, ראש רשות המחקר באוניברסיטת תל אביב למדנו על תפקידה של רשות המחקר באקדמיה ובאונ' תל אביב בפרט ועל צוות המידענים אשר מבצע את העבודה הטרום מחקרית החשובה אשר מהווה את הבסיס ליצירתו בהמשך של מחקר פורה ומוצלח.

 

הגב' רינה קורס, מנהלת הספריה הרפואית בבית החולים שער מנשה דיברה בהרחבה על הקשר שבין הספריה והמחקר: על ניסויים רפואיים (Clinical Trials), על ההכנה שהיא מעבירה לרופאים בבית החולים שער מנשה לצורך קבלת הסמכה ב- GCP) Good Clinical Practice), על טופסי "הסכמה מדעת" עליהם מתבקשים המועמדים לניסויים לחתום ועל כללי האתיקה של ועדת הלסינקי בהם נדרשים החוקרים לעמוד. למצגת ההרצאה.

 

הגב' רותי סוחמי, רמ"ד חיפוש מידע בספריה למדעי החיים ולרפואה באוניברסיטת תל אביב, דיברה על מעורבותם של הספרנים והמידענים בעיקר בבנית ה Systematics Reviews ועל חשיבותם העצומה של הספרנים והמידענים לחוקרים בדרך לקבלת אישור ומימון למחקר שלהם, מעורבות היכולה לחסוך בזבוז משאבים רב בהתנהלות המחקר. למצגת ההרצאה.

 

חתמה את היום הגב' סנאית איילון, מנהלת הספריה הרפואית במרכז הרפואי העמק. בהרצאתה דיברה סנאית על כריית נתונים מהתיק הרפואי של המטופל (EMR) והפיכת אותם נתונים לקרקע פוריה למחקר, על נושא ה Big Data המתרחב בשימוש הרפואה וכיצד מיושם נושא זה במחקר אצלה בבית החולים. למצגת ההרצאה.

 

כל הדוברים הדגישו את השינוי שחל בתפקידה של הספרייה, שהופכת מאגר ספרים למקדמת ותורמת לעולם המחקר באופן פעיל. תודה גדולה שלוחה לכל המרצים ביום זה ולכל המשתתפים ביום העיון, ולמירב מורטנפלד קלס, מתאמת רשת הספריות הרפואיות, על ארגון יום העיון המעניין.

נתראה בשנה הבאה ורק בריאות טובה!

הפוסט נכתב ע"י מרב מורטנפלד קלס.

התמונות צולמו ע"י עטרה היבש.

Cognitive Café

ביום חמישי האחרון (22.12.16) התקיים במרכז 'נא לגעת' ביפו כנס מטעם IBM בנושא מחשוב קוגניטיבי. מחשוב קוגניטיבי הוא תחום במדעי המחשב המנסה לדמות תהליכים של חשיבה אנושית הכוללים בין היתר הבנת שפה מדוברת, זיהוי פנים, ניתוח מידע והסקת מסקנות, למידת מכונה, כריית מידע, איתור דפוסי התנהגות ועוד יכולות "אנושיות" שאנו מבצעים באופן כמעט בלתי מודע.
כדי ליצור מערכת המסוגלת להתמודד עם כל אלו- IBM יצרו את ווטסון. ווטסון היא (או הוא) פלטפורמה מבוססת ענן שהושקה לפני כשנתיים, ועליה ניתן ליצור תוכנות אחרות המשתמשות ביכולות החישוב ועיבוד המידע שפותחו ב- IBM.
(לקריאה נוספת – "מחשב העל IBM Watson" / יפה אהרוני).

לכנס הנושא את השם Cognitive café‬ ונערך זה השנה הרביעית, הגיעו כ- 700 משתתפים ובו הציגו מס' חברות את התוכנות אותן הן פיתחו ופועלות על פלטפורמת ווטסון. חברות כמו קופ"ח כללית ומאוחדת, טבע, סיטי בנק ואחרות הציגו את השימושים היומיומיים ואת יתרונות השימוש בפלטפורמה.

העולם על פי ווטסון

דוגמאות לשימושים בווטסון כוללות מערכת ניהול עירונית המקבלת מידע מחיישנים ומצלמות הפזורות בעיר. המערכת מנתחת את המידע, ויודעת להציף אירועים חריגים או בעייתיים ללא התערבות אדם לחדר בקרה ומשם המידע מועבר הלאה ליחידות המטפלות בשטח.
דוגמה שנייה היא היכולת להמליץ לרופאים על טיפולים שלא עלו על דעתו של הרופא בזמן טיפול בחולה. תוכנה ששולבה במחשבי הרופאים בקופ"ח מאוחדת, לוקחת את נתוני החולה באותו הרגע ובודקת את כל הטיפולים היכולים להתאים לסימפטומים הקיימים. הרופאים שכמובן התנגדו לרעיון גילו במהרה שמערכת מסוג זה עם יכולות ניתוח מידע גבוהות וללא בעיות זיכרון, מניבה תוצאות זהות להמלצות של רופאים מומחים, ובמקרים מסוימים אף ממליצה על טיפול שהרופא כלל לא חשב עליו.

פעולה נוספת שנעשתה בעזרת ווטסון היא יצירת טריילר (קדימון) לסרט האימה Morgan. הטריילר כולו נעשה כמעט ללא התערבות אדם. למערכת הוזנו מאות טריילרים מז'אנר קולנועי זה והמערכת בתורה יצרה קריטריונים לסרטון מוצלח וחתכה מהסרט 10 קטעים ש"לדעתה" צריכים להיכלל בו. לאחר בחינת הקטעים באולפנים אושרו 9 קטעים והטריילר הוכן. כל התהליך שכיום לוקח להכינו כחודש – לקח יום אחד בלבד.

מה לכל זה ולספריות?

בהרצאה שעסקה בשאלה כיצד למידת מכונה משפרת את הבריאות שלנו, ציין פרופ' רן בליצר ממכון כללית למחקר את תעשיית החלל כתעשייה המסורתית ביותר אחרי רפואה בכל הקשור לשימוש באמצעים הידועים כעובדים ואמינים (כששולחים לוויין שישהה 10 שנים בחלל צריך לדעת שהוא יעבוד ללא תקלות). חלקנו ודאי יושבים עכשיו מול מדפי ספרים עמוסים לעייפה ותוהים עד כמה "תעשיית" הספרנות התקדמה עם השנים? בייחוד אלו המשתמשים בשיטת דיואי שהומצאה בשנת 1876.

אם ננתח את עבודת ספרני היעץ – נמצא אדם המקבל מידע, מעבד אותו ומניב תוצאה שהיא פריט או פרטי מידע בפני עצמם. אם כך, מה ההבדל בינו לבין מערכת לומדת המסוגלת לתקשר עם אנשים? לדוגמה –
צ'טבוט (ChatBot) – יישום המאפשר למשתמש לנהל שיחה עם ישות דיגיטלית, מושתתת על בינה מלאכותית לשם ביצוע פעולות שונות או קבלת מידע – משולב עם מערכת המסוגלת לאחזר מידע ולומדת מכל משתמש יותר ויותר.

מערכת שכזו יכולה להשתלב בעבודת הספרנים או לשמש כ"ספרן אישי" לחוקרים ולהפוך לגורם המייעץ (ממש כמו לרופאים בקופ"ח), מאחזר וממליץ על מידע מדויק יותר לטובת משתמשי הספרייה.

ב- 20 שנה האחרונות ספריות אקדמיות וציבוריות נאבקו בכדי להישאר רלוונטיות בעולם בו האינטרנט וטכנולוגיות המידע מכתיבות את קצב השינויים. כאשר שינויים חוקתיים, שילוב טכנולוגיות חדשות וקבלת רעיון "הספרייה כמקום" הצליחו להפוך את הספריות למקום המעניק שירות מתקדם ועדכני. המחשוב הקוגנטיבי המהווה את השלב הבא בהתפתחות טכנולוגיות המידע, יכול להוביל את הספריות למקום המרכז שירותים רבים ומתקדמים יותר מבעבר.

לסיכום, שילוב של שירותי מידע חדשניים שמעניקים לסטודנטים ולחוקרים את כל מה שהם נזקקים לו במחקרם, יחד עם חוויה חיובית במטרה לגרום להם לרצות לשוב ולבקר היא חלק מובנה בשירות של הספרייה. ברור כי הספריות, כמקום האוצר כמויות עצומות של מידע, יצטרכו להמשיך ולהשקיע משאבים נוספים לצורך הפיכת הספרייה למרכז חברתי המשלב יכולות ייעוץ מתקדמות.
יכולות מחשוב קוגניטיביות יאפשרו להן להפוך למובילות טכנולוגיות בתחום זה.

(צילום תמונה ראשית: עידן סבח)

מקורות וקריאה נוספת

  1. כנס הצ׳אטבוטים הבינלאומי הראשון בישראל יוצא לדרך
  2. מקבץ כתבות בנושא באתר הידען
  3. אלבום הכנס בפייסבוק

ביג דאטה ואתיקה מחקרית

כלים לאיסוף ולניתוח של ביג דאטה הופכים לכלים חשובים בהנגשת נתונים ומציאת קשרים משמעותיים בין גורמים אותם לא היינו חושבים לקשר. קשרים אלו נחשפים לעיתים קרובות רק בזכות הכמות העצומה של הנתונים.  מחקרים רבים ומגוונים עושים שימוש בביג דאטה, ביניהם מחקרים בתחומי החברה,  רפואה, תכנון אורבני, קרימינולוגיה ועוד. אולם, השימוש בביג דאטה כולל לעיתים קרובות שימוש בנתונים מאנשים רבים, נתונים שלא כולם רלוונטיים למחקר הספציפי. הנגשת הנתונים מעלה דאגות בנושאי פרטיות ואתיקה מחקרית, כפי שמראים המקרים המתוארים להלן.

שימוש בביג דאטה בפלטפורמות חברתיות

 בחודש מאי 2016 פירסמה קבוצת חוקרים דנית מאגר מידע של פרטי פרופיל של כ- 70,000 משתמשי האתר למפגשי הכרויות אנליין – אוקיי קיופיד . המידע כלל שמות משתמש, גיל, מגדר, מיקום, העדפות מיניות, סוג מערכת יחסים  בו הם מעוניינים, תכונות אישיות, ופרטים אישיים נוספים

החוקרים לא הפכו את המידע לאנונימי לפני פירסומו בטענה כי מדובר במידע שהוא מלכתחילה ציבורי. הטענה הייתה שהמידע שנאסף היה נגיש בעבר או עדיין ניתן לגישה ציבורית דרך אוקיי קיופיד, ולכן הפצת בסיס הנתונים רק מאפשרת את הצגת המידע באופן יעיל יותר.

הדיון הקצר שהתפתח בטוויטר אודות החוקיות והמוסריות של המעשה מעניין מאוד והסתיים בנימה שמזכירה גם דיונים אחרים אודות פרטיות במרחב הציבורי, בייחוד בתקופה בה לכל אחד יש מצלמה ויכולת פרסום מידית.

ההתנערות מסוגיות של פרטיות ואתיקה מחקרית  בטענה שהמידע כבר ציבורי ולכן אין בעיה לפרסם את בסיס הנתונים אינה חדשה. אולם, יש שיטענו שהיות המידע ציבורי אינה מספיקה.

גם אם אדם שיתף מידע ביודעין, ניתוח הביג דאטה עשוי לפרסם את המידע הזה ולהעצימו באופן שהאדם מעולם לא התכוון או הסכים לו. יתרה מזאת, באתרים כדוגמת אוקיי קיופיד המידע אינו באמת נגיש באופן חופשי לכלל הציבור ,כיוון שכדי לגשת אל המידע יש צורך ברישום לאתר. בנוסף, משתמשים יכולים לחסום גישה לפרופיל שלהם בפני משתמשים שונים.

הנושא עלה בעבר גם כאשר קבוצת חוקרים מהרווארד הורידה מפייסבוק 1,700 פרופילים וחקרה כיצד גזע ותרבות משפיעים על מערכות יחסים. חלק מבסיס הנתונים הועלה לגישה חופשית לשימוש במחקרים אחרים, מתוך הבנה שפרופילים אלו יכולים לתת מידע רב במחקרים מסוגים שונים. אולם, לא נעשו מאמצים מספקים לשמור על אנונימיות הפרופילים והם זוהו כמחזור 2009 של אוניברסיטת הארוורד.

מקרה אחר התרחש ב 2010 כאשר מהנדס מאפל ניצל פירצה בארכיטקטורת המידע של פייסבוק כדי  לייצר  "זחלן רשת"  ( Web crawler -תוכנה רובוטית שסורקת דפי ווב)  והוריד באמצעותו מידע אודות 215 מיליון חשבונות פייסבוק. המהנדס תכנן להפוך את המידע לאנונימי לפני שיחלוק אותו לצורכי מחקר, אולם לבסוף מחק את המידע כולו, לאחר איומי תביעה מצד פייסבוק.

הדוגלים בכך שפרסום בסיסי נתונים מסוג זה אינו אתי טוענים בין היתר שעצם העובדה שאדם משתף מידע בציבור אינה שוות ערך להסכמה להשתתפות במחקר. אתיקה במחקר דורשת הגנה על פרטיות המשתתף, קבלת הסכמה מדעת, שמירה על חיסיון המידע שנאסף וצמצום נזקים. כל אלו אינם נלקחים בחשבון כאשר המידע נלקח מאתרים כגון פייסבוק, אוקיי קיופיד, טוויטר ועוד, ללא הסכמת בעלי הפרופילים.

מקרים אלו מראים שחובה על חוקרי ביג דאטה להתייחס אל השאלות האתיות העולות מסוג המחקר בו הם עוסקים.

ביג דאטה ברפואה ובמחקר

מחקר חברתי הוא לא המקום היחיד בו סטים גדולים של מידע אודות אנשים יכולים לסייע. מערכת הבריאות היא מקום נוסף בו שימוש בביג דאטה יכול לסייע במחקר.

בכתב העת New Scientist פורסם שגוגל חתמה לאחרונה על הסכם עם בתי חולים ממערכת הבריאות של בריטניה. לפי ההסכם חברת DeepMind שבבעלות Google ושעוסקת בתחום הבינה  המלאכותית ולמידת מכונה תקבל לידיה מידע רפואי מפורט אודות 1.6 מיליון חולים מאושפזים ברחבי בריטניה, במטרה לפתח כלים תומכי החלטה.

זו לא הפעם הראשונה שגוגל עוסקת בבריאות. גוגל השיקה לפני מספר שנים, יחד עם אוניברסיטאות דיוק וסטנפורד, את פרויקט Baseline שמטרתו להגדיר "פיזיולוגיה נורמלית". הם עשו זאת על ידי אגירת מידע רב אודות אלפי אנשים. בנוסף היא משתפת פעולה עם ה -NIH  (ארגון הבריאות של ארה"ב) במחקר אודות 50,000 חולים עבור הפרויקט הגדול 1-Million patient Precision Medicine cohort.

בפרויקט הנוכחי של גוגל המידע שגוגל תקבל לגבי החולים יכלול נתונים על בדיקות מעבדה, היסטוריה רפואית, ואף נתוני מעקב אחר המיטות בהן שהו החולים בעת האשפוז. על מנת להגן על המידע הוא יאוחסן על ידי גורם שלישי, לגוגל יהיו הגבלות בשימוש במידע, ותוקפו של ההסכם, וכך גם הגישה למידע יפוגו בשנת 2017.

בעוד שיש הגבלות על הגישה למידע, נראה שגוגל מקבלת יותר מידע משנחוץ לה עבור האפליקציות אותן היא מפתחת, כגון סטטוס HIV  של החולים. מצב זה מדאיג את הדוגלים בשמירה על הפרטיות, בייחוד מכיוון שבעבר התגלו בעיות אבטחה באפליקציות שאושרו על ידי ארגון הבריאות של בריטניה.

מצד שני, השימוש בביג דאטה, למידת מכונה ובינה מלאכותית מסייע לאיתור מכנה משותף בין חולים ועזרה באבחון, יכול לסייע רבות במציאת גורמים משותפים ומגמות, וכן לעזור במחקר ופיענוח נתונים שלא היו נראים ללא שימוש בביג דאטה. כדי לעשות זאת יש לאסוף כמה שיותר מידע, מכיוון שאין לדעת מה יתגלה כרלוונטי. יחד עם זאת, שאלת הזכות לפרטיות וההסכמה של החולים להעביר את המידע היא שאלה חשובה שיש לשים אליה לב.

להמשך קריאה אודות ביג דאטה במחקרים חברתיים.

להמשך קריאה אודות המידע הרפואי שקיבלה גוגל.