Cognitive Café

ביום חמישי האחרון (22.12.16) התקיים במרכז 'נא לגעת' ביפו כנס מטעם IBM בנושא מחשוב קוגניטיבי. מחשוב קוגניטיבי הוא תחום במדעי המחשב המנסה לדמות תהליכים של חשיבה אנושית הכוללים בין היתר הבנת שפה מדוברת, זיהוי פנים, ניתוח מידע והסקת מסקנות, למידת מכונה, כריית מידע, איתור דפוסי התנהגות ועוד יכולות "אנושיות" שאנו מבצעים באופן כמעט בלתי מודע.
כדי ליצור מערכת המסוגלת להתמודד עם כל אלו- IBM יצרו את ווטסון. ווטסון היא (או הוא) פלטפורמה מבוססת ענן שהושקה לפני כשנתיים, ועליה ניתן ליצור תוכנות אחרות המשתמשות ביכולות החישוב ועיבוד המידע שפותחו ב- IBM.
(לקריאה נוספת – "מחשב העל IBM Watson" / יפה אהרוני).

לכנס הנושא את השם Cognitive café‬ ונערך זה השנה הרביעית, הגיעו כ- 700 משתתפים ובו הציגו מס' חברות את התוכנות אותן הן פיתחו ופועלות על פלטפורמת ווטסון. חברות כמו קופ"ח כללית ומאוחדת, טבע, סיטי בנק ואחרות הציגו את השימושים היומיומיים ואת יתרונות השימוש בפלטפורמה.

העולם על פי ווטסון

דוגמאות לשימושים בווטסון כוללות מערכת ניהול עירונית המקבלת מידע מחיישנים ומצלמות הפזורות בעיר. המערכת מנתחת את המידע, ויודעת להציף אירועים חריגים או בעייתיים ללא התערבות אדם לחדר בקרה ומשם המידע מועבר הלאה ליחידות המטפלות בשטח.
דוגמה שנייה היא היכולת להמליץ לרופאים על טיפולים שלא עלו על דעתו של הרופא בזמן טיפול בחולה. תוכנה ששולבה במחשבי הרופאים בקופ"ח מאוחדת, לוקחת את נתוני החולה באותו הרגע ובודקת את כל הטיפולים היכולים להתאים לסימפטומים הקיימים. הרופאים שכמובן התנגדו לרעיון גילו במהרה שמערכת מסוג זה עם יכולות ניתוח מידע גבוהות וללא בעיות זיכרון, מניבה תוצאות זהות להמלצות של רופאים מומחים, ובמקרים מסוימים אף ממליצה על טיפול שהרופא כלל לא חשב עליו.

פעולה נוספת שנעשתה בעזרת ווטסון היא יצירת טריילר (קדימון) לסרט האימה Morgan. הטריילר כולו נעשה כמעט ללא התערבות אדם. למערכת הוזנו מאות טריילרים מז'אנר קולנועי זה והמערכת בתורה יצרה קריטריונים לסרטון מוצלח וחתכה מהסרט 10 קטעים ש"לדעתה" צריכים להיכלל בו. לאחר בחינת הקטעים באולפנים אושרו 9 קטעים והטריילר הוכן. כל התהליך שכיום לוקח להכינו כחודש – לקח יום אחד בלבד.

מה לכל זה ולספריות?

בהרצאה שעסקה בשאלה כיצד למידת מכונה משפרת את הבריאות שלנו, ציין פרופ' רן בליצר ממכון כללית למחקר את תעשיית החלל כתעשייה המסורתית ביותר אחרי רפואה בכל הקשור לשימוש באמצעים הידועים כעובדים ואמינים (כששולחים לוויין שישהה 10 שנים בחלל צריך לדעת שהוא יעבוד ללא תקלות). חלקנו ודאי יושבים עכשיו מול מדפי ספרים עמוסים לעייפה ותוהים עד כמה "תעשיית" הספרנות התקדמה עם השנים? בייחוד אלו המשתמשים בשיטת דיואי שהומצאה בשנת 1876.

אם ננתח את עבודת ספרני היעץ – נמצא אדם המקבל מידע, מעבד אותו ומניב תוצאה שהיא פריט או פרטי מידע בפני עצמם. אם כך, מה ההבדל בינו לבין מערכת לומדת המסוגלת לתקשר עם אנשים? לדוגמה –
צ'טבוט (ChatBot) – יישום המאפשר למשתמש לנהל שיחה עם ישות דיגיטלית, מושתתת על בינה מלאכותית לשם ביצוע פעולות שונות או קבלת מידע – משולב עם מערכת המסוגלת לאחזר מידע ולומדת מכל משתמש יותר ויותר.

מערכת שכזו יכולה להשתלב בעבודת הספרנים או לשמש כ"ספרן אישי" לחוקרים ולהפוך לגורם המייעץ (ממש כמו לרופאים בקופ"ח), מאחזר וממליץ על מידע מדויק יותר לטובת משתמשי הספרייה.

ב- 20 שנה האחרונות ספריות אקדמיות וציבוריות נאבקו בכדי להישאר רלוונטיות בעולם בו האינטרנט וטכנולוגיות המידע מכתיבות את קצב השינויים. כאשר שינויים חוקתיים, שילוב טכנולוגיות חדשות וקבלת רעיון "הספרייה כמקום" הצליחו להפוך את הספריות למקום המעניק שירות מתקדם ועדכני. המחשוב הקוגנטיבי המהווה את השלב הבא בהתפתחות טכנולוגיות המידע, יכול להוביל את הספריות למקום המרכז שירותים רבים ומתקדמים יותר מבעבר.

לסיכום, שילוב של שירותי מידע חדשניים שמעניקים לסטודנטים ולחוקרים את כל מה שהם נזקקים לו במחקרם, יחד עם חוויה חיובית במטרה לגרום להם לרצות לשוב ולבקר היא חלק מובנה בשירות של הספרייה. ברור כי הספריות, כמקום האוצר כמויות עצומות של מידע, יצטרכו להמשיך ולהשקיע משאבים נוספים לצורך הפיכת הספרייה למרכז חברתי המשלב יכולות ייעוץ מתקדמות.
יכולות מחשוב קוגניטיביות יאפשרו להן להפוך למובילות טכנולוגיות בתחום זה.

(צילום תמונה ראשית: עידן סבח)

מקורות וקריאה נוספת

  1. כנס הצ׳אטבוטים הבינלאומי הראשון בישראל יוצא לדרך
  2. מקבץ כתבות בנושא באתר הידען
  3. אלבום הכנס בפייסבוק

ביג דאטה ואתיקה מחקרית

כלים לאיסוף ולניתוח של ביג דאטה הופכים לכלים חשובים בהנגשת נתונים ומציאת קשרים משמעותיים בין גורמים אותם לא היינו חושבים לקשר. קשרים אלו נחשפים לעיתים קרובות רק בזכות הכמות העצומה של הנתונים.  מחקרים רבים ומגוונים עושים שימוש בביג דאטה, ביניהם מחקרים בתחומי החברה,  רפואה, תכנון אורבני, קרימינולוגיה ועוד. אולם, השימוש בביג דאטה כולל לעיתים קרובות שימוש בנתונים מאנשים רבים, נתונים שלא כולם רלוונטיים למחקר הספציפי. הנגשת הנתונים מעלה דאגות בנושאי פרטיות ואתיקה מחקרית, כפי שמראים המקרים המתוארים להלן.

שימוש בביג דאטה בפלטפורמות חברתיות

 בחודש מאי 2016 פירסמה קבוצת חוקרים דנית מאגר מידע של פרטי פרופיל של כ- 70,000 משתמשי האתר למפגשי הכרויות אנליין – אוקיי קיופיד . המידע כלל שמות משתמש, גיל, מגדר, מיקום, העדפות מיניות, סוג מערכת יחסים  בו הם מעוניינים, תכונות אישיות, ופרטים אישיים נוספים

החוקרים לא הפכו את המידע לאנונימי לפני פירסומו בטענה כי מדובר במידע שהוא מלכתחילה ציבורי. הטענה הייתה שהמידע שנאסף היה נגיש בעבר או עדיין ניתן לגישה ציבורית דרך אוקיי קיופיד, ולכן הפצת בסיס הנתונים רק מאפשרת את הצגת המידע באופן יעיל יותר.

הדיון הקצר שהתפתח בטוויטר אודות החוקיות והמוסריות של המעשה מעניין מאוד והסתיים בנימה שמזכירה גם דיונים אחרים אודות פרטיות במרחב הציבורי, בייחוד בתקופה בה לכל אחד יש מצלמה ויכולת פרסום מידית.

ההתנערות מסוגיות של פרטיות ואתיקה מחקרית  בטענה שהמידע כבר ציבורי ולכן אין בעיה לפרסם את בסיס הנתונים אינה חדשה. אולם, יש שיטענו שהיות המידע ציבורי אינה מספיקה.

גם אם אדם שיתף מידע ביודעין, ניתוח הביג דאטה עשוי לפרסם את המידע הזה ולהעצימו באופן שהאדם מעולם לא התכוון או הסכים לו. יתרה מזאת, באתרים כדוגמת אוקיי קיופיד המידע אינו באמת נגיש באופן חופשי לכלל הציבור ,כיוון שכדי לגשת אל המידע יש צורך ברישום לאתר. בנוסף, משתמשים יכולים לחסום גישה לפרופיל שלהם בפני משתמשים שונים.

הנושא עלה בעבר גם כאשר קבוצת חוקרים מהרווארד הורידה מפייסבוק 1,700 פרופילים וחקרה כיצד גזע ותרבות משפיעים על מערכות יחסים. חלק מבסיס הנתונים הועלה לגישה חופשית לשימוש במחקרים אחרים, מתוך הבנה שפרופילים אלו יכולים לתת מידע רב במחקרים מסוגים שונים. אולם, לא נעשו מאמצים מספקים לשמור על אנונימיות הפרופילים והם זוהו כמחזור 2009 של אוניברסיטת הארוורד.

מקרה אחר התרחש ב 2010 כאשר מהנדס מאפל ניצל פירצה בארכיטקטורת המידע של פייסבוק כדי  לייצר  "זחלן רשת"  ( Web crawler -תוכנה רובוטית שסורקת דפי ווב)  והוריד באמצעותו מידע אודות 215 מיליון חשבונות פייסבוק. המהנדס תכנן להפוך את המידע לאנונימי לפני שיחלוק אותו לצורכי מחקר, אולם לבסוף מחק את המידע כולו, לאחר איומי תביעה מצד פייסבוק.

הדוגלים בכך שפרסום בסיסי נתונים מסוג זה אינו אתי טוענים בין היתר שעצם העובדה שאדם משתף מידע בציבור אינה שוות ערך להסכמה להשתתפות במחקר. אתיקה במחקר דורשת הגנה על פרטיות המשתתף, קבלת הסכמה מדעת, שמירה על חיסיון המידע שנאסף וצמצום נזקים. כל אלו אינם נלקחים בחשבון כאשר המידע נלקח מאתרים כגון פייסבוק, אוקיי קיופיד, טוויטר ועוד, ללא הסכמת בעלי הפרופילים.

מקרים אלו מראים שחובה על חוקרי ביג דאטה להתייחס אל השאלות האתיות העולות מסוג המחקר בו הם עוסקים.

ביג דאטה ברפואה ובמחקר

מחקר חברתי הוא לא המקום היחיד בו סטים גדולים של מידע אודות אנשים יכולים לסייע. מערכת הבריאות היא מקום נוסף בו שימוש בביג דאטה יכול לסייע במחקר.

בכתב העת New Scientist פורסם שגוגל חתמה לאחרונה על הסכם עם בתי חולים ממערכת הבריאות של בריטניה. לפי ההסכם חברת DeepMind שבבעלות Google ושעוסקת בתחום הבינה  המלאכותית ולמידת מכונה תקבל לידיה מידע רפואי מפורט אודות 1.6 מיליון חולים מאושפזים ברחבי בריטניה, במטרה לפתח כלים תומכי החלטה.

זו לא הפעם הראשונה שגוגל עוסקת בבריאות. גוגל השיקה לפני מספר שנים, יחד עם אוניברסיטאות דיוק וסטנפורד, את פרויקט Baseline שמטרתו להגדיר "פיזיולוגיה נורמלית". הם עשו זאת על ידי אגירת מידע רב אודות אלפי אנשים. בנוסף היא משתפת פעולה עם ה -NIH  (ארגון הבריאות של ארה"ב) במחקר אודות 50,000 חולים עבור הפרויקט הגדול 1-Million patient Precision Medicine cohort.

בפרויקט הנוכחי של גוגל המידע שגוגל תקבל לגבי החולים יכלול נתונים על בדיקות מעבדה, היסטוריה רפואית, ואף נתוני מעקב אחר המיטות בהן שהו החולים בעת האשפוז. על מנת להגן על המידע הוא יאוחסן על ידי גורם שלישי, לגוגל יהיו הגבלות בשימוש במידע, ותוקפו של ההסכם, וכך גם הגישה למידע יפוגו בשנת 2017.

בעוד שיש הגבלות על הגישה למידע, נראה שגוגל מקבלת יותר מידע משנחוץ לה עבור האפליקציות אותן היא מפתחת, כגון סטטוס HIV  של החולים. מצב זה מדאיג את הדוגלים בשמירה על הפרטיות, בייחוד מכיוון שבעבר התגלו בעיות אבטחה באפליקציות שאושרו על ידי ארגון הבריאות של בריטניה.

מצד שני, השימוש בביג דאטה, למידת מכונה ובינה מלאכותית מסייע לאיתור מכנה משותף בין חולים ועזרה באבחון, יכול לסייע רבות במציאת גורמים משותפים ומגמות, וכן לעזור במחקר ופיענוח נתונים שלא היו נראים ללא שימוש בביג דאטה. כדי לעשות זאת יש לאסוף כמה שיותר מידע, מכיוון שאין לדעת מה יתגלה כרלוונטי. יחד עם זאת, שאלת הזכות לפרטיות וההסכמה של החולים להעביר את המידע היא שאלה חשובה שיש לשים אליה לב.

להמשך קריאה אודות ביג דאטה במחקרים חברתיים.

להמשך קריאה אודות המידע הרפואי שקיבלה גוגל.