כלים לאיסוף ולניתוח של ביג דאטה הופכים לכלים חשובים בהנגשת נתונים ומציאת קשרים משמעותיים בין גורמים אותם לא היינו חושבים לקשר. קשרים אלו נחשפים לעיתים קרובות רק בזכות הכמות העצומה של הנתונים. מחקרים רבים ומגוונים עושים שימוש בביג דאטה, ביניהם מחקרים בתחומי החברה, רפואה, תכנון אורבני, קרימינולוגיה ועוד. אולם, השימוש בביג דאטה כולל לעיתים קרובות שימוש בנתונים מאנשים רבים, נתונים שלא כולם רלוונטיים למחקר הספציפי. הנגשת הנתונים מעלה דאגות בנושאי פרטיות ואתיקה מחקרית, כפי שמראים המקרים המתוארים להלן.
שימוש בביג דאטה בפלטפורמות חברתיות
בחודש מאי 2016 פירסמה קבוצת חוקרים דנית מאגר מידע של פרטי פרופיל של כ- 70,000 משתמשי האתר למפגשי הכרויות אנליין – אוקיי קיופיד . המידע כלל שמות משתמש, גיל, מגדר, מיקום, העדפות מיניות, סוג מערכת יחסים בו הם מעוניינים, תכונות אישיות, ופרטים אישיים נוספים
החוקרים לא הפכו את המידע לאנונימי לפני פירסומו בטענה כי מדובר במידע שהוא מלכתחילה ציבורי. הטענה הייתה שהמידע שנאסף היה נגיש בעבר או עדיין ניתן לגישה ציבורית דרך אוקיי קיופיד, ולכן הפצת בסיס הנתונים רק מאפשרת את הצגת המידע באופן יעיל יותר.
הדיון הקצר שהתפתח בטוויטר אודות החוקיות והמוסריות של המעשה מעניין מאוד והסתיים בנימה שמזכירה גם דיונים אחרים אודות פרטיות במרחב הציבורי, בייחוד בתקופה בה לכל אחד יש מצלמה ויכולת פרסום מידית.
ההתנערות מסוגיות של פרטיות ואתיקה מחקרית בטענה שהמידע כבר ציבורי ולכן אין בעיה לפרסם את בסיס הנתונים אינה חדשה. אולם, יש שיטענו שהיות המידע ציבורי אינה מספיקה.
גם אם אדם שיתף מידע ביודעין, ניתוח הביג דאטה עשוי לפרסם את המידע הזה ולהעצימו באופן שהאדם מעולם לא התכוון או הסכים לו. יתרה מזאת, באתרים כדוגמת אוקיי קיופיד המידע אינו באמת נגיש באופן חופשי לכלל הציבור ,כיוון שכדי לגשת אל המידע יש צורך ברישום לאתר. בנוסף, משתמשים יכולים לחסום גישה לפרופיל שלהם בפני משתמשים שונים.
הנושא עלה בעבר גם כאשר קבוצת חוקרים מהרווארד הורידה מפייסבוק 1,700 פרופילים וחקרה כיצד גזע ותרבות משפיעים על מערכות יחסים. חלק מבסיס הנתונים הועלה לגישה חופשית לשימוש במחקרים אחרים, מתוך הבנה שפרופילים אלו יכולים לתת מידע רב במחקרים מסוגים שונים. אולם, לא נעשו מאמצים מספקים לשמור על אנונימיות הפרופילים והם זוהו כמחזור 2009 של אוניברסיטת הארוורד.
מקרה אחר התרחש ב 2010 כאשר מהנדס מאפל ניצל פירצה בארכיטקטורת המידע של פייסבוק כדי לייצר "זחלן רשת" ( Web crawler -תוכנה רובוטית שסורקת דפי ווב) והוריד באמצעותו מידע אודות 215 מיליון חשבונות פייסבוק. המהנדס תכנן להפוך את המידע לאנונימי לפני שיחלוק אותו לצורכי מחקר, אולם לבסוף מחק את המידע כולו, לאחר איומי תביעה מצד פייסבוק.
הדוגלים בכך שפרסום בסיסי נתונים מסוג זה אינו אתי טוענים בין היתר שעצם העובדה שאדם משתף מידע בציבור אינה שוות ערך להסכמה להשתתפות במחקר. אתיקה במחקר דורשת הגנה על פרטיות המשתתף, קבלת הסכמה מדעת, שמירה על חיסיון המידע שנאסף וצמצום נזקים. כל אלו אינם נלקחים בחשבון כאשר המידע נלקח מאתרים כגון פייסבוק, אוקיי קיופיד, טוויטר ועוד, ללא הסכמת בעלי הפרופילים.
מקרים אלו מראים שחובה על חוקרי ביג דאטה להתייחס אל השאלות האתיות העולות מסוג המחקר בו הם עוסקים.
ביג דאטה ברפואה ובמחקר
מחקר חברתי הוא לא המקום היחיד בו סטים גדולים של מידע אודות אנשים יכולים לסייע. מערכת הבריאות היא מקום נוסף בו שימוש בביג דאטה יכול לסייע במחקר.
בכתב העת New Scientist פורסם שגוגל חתמה לאחרונה על הסכם עם בתי חולים ממערכת הבריאות של בריטניה. לפי ההסכם חברת DeepMind שבבעלות Google ושעוסקת בתחום הבינה המלאכותית ולמידת מכונה תקבל לידיה מידע רפואי מפורט אודות 1.6 מיליון חולים מאושפזים ברחבי בריטניה, במטרה לפתח כלים תומכי החלטה.
זו לא הפעם הראשונה שגוגל עוסקת בבריאות. גוגל השיקה לפני מספר שנים, יחד עם אוניברסיטאות דיוק וסטנפורד, את פרויקט Baseline שמטרתו להגדיר "פיזיולוגיה נורמלית". הם עשו זאת על ידי אגירת מידע רב אודות אלפי אנשים. בנוסף היא משתפת פעולה עם ה -NIH (ארגון הבריאות של ארה"ב) במחקר אודות 50,000 חולים עבור הפרויקט הגדול 1-Million patient Precision Medicine cohort.
בפרויקט הנוכחי של גוגל המידע שגוגל תקבל לגבי החולים יכלול נתונים על בדיקות מעבדה, היסטוריה רפואית, ואף נתוני מעקב אחר המיטות בהן שהו החולים בעת האשפוז. על מנת להגן על המידע הוא יאוחסן על ידי גורם שלישי, לגוגל יהיו הגבלות בשימוש במידע, ותוקפו של ההסכם, וכך גם הגישה למידע יפוגו בשנת 2017.
בעוד שיש הגבלות על הגישה למידע, נראה שגוגל מקבלת יותר מידע משנחוץ לה עבור האפליקציות אותן היא מפתחת, כגון סטטוס HIV של החולים. מצב זה מדאיג את הדוגלים בשמירה על הפרטיות, בייחוד מכיוון שבעבר התגלו בעיות אבטחה באפליקציות שאושרו על ידי ארגון הבריאות של בריטניה.
מצד שני, השימוש בביג דאטה, למידת מכונה ובינה מלאכותית מסייע לאיתור מכנה משותף בין חולים ועזרה באבחון, יכול לסייע רבות במציאת גורמים משותפים ומגמות, וכן לעזור במחקר ופיענוח נתונים שלא היו נראים ללא שימוש בביג דאטה. כדי לעשות זאת יש לאסוף כמה שיותר מידע, מכיוון שאין לדעת מה יתגלה כרלוונטי. יחד עם זאת, שאלת הזכות לפרטיות וההסכמה של החולים להעביר את המידע היא שאלה חשובה שיש לשים אליה לב.
להמשך קריאה אודות ביג דאטה במחקרים חברתיים.
להמשך קריאה אודות המידע הרפואי שקיבלה גוגל.