הייתם מוסרים את מפתחות ביתכם לזר? ומה לגבי המידע הפרטי שלכם?

היום, 28/1 מצוין במדינות רבות בעולם יום פרטיות המידע והגנתו. מטרתו של יום זה היא לעורר מודעות להגנה על פרטיות ונתונים. כיום, כאשר אנו חיים בעידן ה-BIG DATA קל לחברות לכרות מידע מבסיסי נתונים, לנתח את ים הידע הנאסף במהירות, להפיק מנתונים אלה תובנות אודות תבניות המניעות את עולמנו, וכך לצפות מהומות או לנבא התפרצות מגפות. למה אם כך יש צורך במודעות לפרטיות? הצורך במודעות לפרטיות המידע רק גדל כיוון שאסור לנו לשכוח מאין באו שלל הנתונים עליהם מתבסס ה-BIG DATA ואילו עוד שימושים יש למידע זה בדרך.

היום, כשלכולנו נייד בקצה היד, כל תהליך איסוף המידע, פיענוחו והפצתו הפכו קלים וזולים. מהפכת המחשוב שעבר העולם הקטינה את המחשב והפכה אותו למהיר. לשם השוואה – מערכת הניווט של חללית אפולו, פאר היצירה של אותה תקופה שקלה 32 ק"ג וזיכרון העבודה שלה היה 64KB RAM. בימינו הטלפונים שוקלים פחות מ- 200 גר', וזיכרון העבודה שלהם הוא בממוצע 4GB RAM, פי 64,000. מקצה היד שלנו זורם המידע אל מחשבי הענן שגודלם וכוחם המשותף כבר בלתי נתפס. כוח המחשוב המשותף של מחשב סריגי שכזה, מאפשר, כאמור, פתרון בעיות המטרידות את האנושות כמו חיזוי מגפות, אסונות, שאלות מסובכות כמו קיפול חלבונים ומציאת תרופות חדשות. אבל יש לו גם צד מסחרי.

בעבר כדי למכור מוצר, נאלצו המוכרים לכתת רגליהם ולעבור בין לקוחות, או לנחש היכן יקבל בית העסק שלהם חשיפה – היכן למקם חנות, והיכן לפרסם אותה: זמן שידור באמצעי התקשורת המוקדש לפרסום קצר ויקר וכך גם מודעות בעיתונים. גם הסתמכות על מובילי דעה כאמצעי פרסום היא בעייתית, כיוון שהיא מצריכה איתור שלהם, ומידה רבה של שכנוע ותקציב כדי שיפעילו את השפעתם ויפרסמו את המוצר. תהליך יקר ואיטי. היום, כאשר כולנו מחוברים לרשת האינטרנט, כל המכשירים המחוברים לרשת אוספים מיליוני טרה-בייטים של מידע ושולחים אותם בחזרה לענני המחשוב. משם הם נאספים ונמכרים על ידי חברות לכל מי שמוכן לשלם.

עולם זה של מסחר במידע הפרטי שלנו מתנהל הרחק מעל ראשינו, ואנו נהנים רק מפירורים הניתנים לנו כדי שנמשיך לספק אותו. בכל פעם שהזדהינו למערכת כלשהי, הצטרפנו למעשה למאגר המידע של אותה חברה, והתחלנו לתת לה פרטים אישיים עלינו. בתמורה מבטיחה לנו אותה חברה שתספק לנו שירות או מוצר מותאמים יותר לצרכינו, הטבות ופינוקים שונים בדמות הנחות למשל. מצד שני, מרגע שמסרנו את אותו מידע פרטי, איבדנו שליטה עליו. כל עוד אנו לקוח שנכנס לחנות, רכש מוצר ולא הזדהה, החנות יכולה לדעת רק שלאותו מוצר יש ביקוש. מרגע שהשתמשנו באמצעי זיהוי כלשהו המחבר אותנו הצרכנים למוצר, החברה יכולה להמשיך ולנסות למכור לנו מוצרים נוספים שלדעתה אנו צריכים: קניתם חולצה? רוצים גם מכנסיים, גרביים ונעליים? אולי תרצו משהו משותפינו המוכרים גם תיקים? תוכלו לקבל גם הנחה עבור רכישת נוספת בחנויות אחרות במועדון הלקוחות שלנו. נשמע מוכר?

את הקופאית המנסה למכור לנו עוד כמה מוצרים לא נחוצים כולנו מכירים. גם את הקופונים "המותאמים אישית" שמגיעים כל העת. אבל כמה מכם שמו לב להצהרת הפרטיות של האפליקציות? כמה שמו לב לרשימה הארוכה של הרשאות שאפליקציות שונות מבקשות לשימוש בטלפון הנייד? כמה מכם אישרו אותן מבלי לעצור שנייה ולחשוב למה? למה אפליקציה אחת צריכה לדעת אילו אפליקציות אחרות מותקנות על הטלפון? למה אפליקציות שבינן לבין מיקום גאוגרפי אין כל קשר, צריכות לדעת היכן אנחנו ולאילו רשתות WIFI התחברנו? קל להבין מדוע אפליקציות כמו WhatsApp צריכות גישה לרשימת אנשי הקשר שלנו, אבל למה אפליקציה להזמנת מונית צריכה להכיר אותם או מדוע היא צריכה גישה ללוח השנה שלנו? אנו צורכים את האפליקציות הללו אך רובנו לא שמים לב, ובלי משים מאשרים לאפליקציות לאסוף עלינו מידע פרטי. לעומת זאת האפליקציות, מצהירות בהצהרת הפרטיות שלהן כי מידע שאנו מוסרים להן מרצוננו הוא רכושן ויתכן שמידע זה יועבר גם לגורם שלישי. וכך לא רק הרגלי הקנייה שלנו הופכים לרכושן, גם תמונות שאנו משתפים, סטטוסים שפרסמנו, וכל פרט מידע אחר שפרסמנו הוא שלהן ויכול לעבור הלאה לגורם שלישי.

מיהו אותו "גורם שלישי"? מדובר בחברות מסחריות אחרות המשלמות עבור המידע, אבל לא רק. לעיתים מדובר בגורמים ממשלתיים הדורשים מחברות להעביר להן מידע על הגולשים מסיבות ביטחוניות, כמו מניעת פשע או טרור. גם כאן ההגדרות בעיתיות. במשטרים טוטאליטריים המנסים לשלוט במידע שמקבלים אזרחיהן ובמידע העובר ביניהם, ברור לנו שהממשלה המאזינה לאזרחיה ויודעת עליהם הכל. אבל אסור לשכוח שגם ממשלות מערביות עלולות לגלוש במדרון החלקלק של מעקב אחרי האזרחים, כדי להטות את דעת האזרחים לדעה הרצויה לממשל.

כאשר כל המערכות סביבנו מחוברות לרשת האינטרנט, לא מעשי שנתנתק לחלוטין. אבל מה כן אפשר לעשות?

  • היו מודעים לזכותכם לפרטיות ואל תמסרו מידע אישי מיותר. הוא שווה לקמעונאיות הרבה יותר מאשר קופסת השוקולדים ביום ההולדת וכל ההנחות שתקבלו בעזרת הקופונים, ושווה יותר מכל יתרון בכל אפליקציה.
  • אל תתפתו להשתתף בשאלוני רשת חביבים המחייבים כניסה עם חשבון גוגל או פייסבוק. הפרופיל שלכם שווה הרבה יותר מהידיעה מה פירוש אותיות שמכם באלפבית הרוני, איזו חיה הייתם בגלגול הקודם או כמה אתם חכמים.
  • קחו לכם מספר דקות ועברו על רשימת ההרשאות של כל אפליקציה בטלפון הנייד. אם הטלפון מאפשר – כבו כל הרשאה מיותרת. כמובן שמיד תוזהרו שהאפליקציה עלולה לא לפעול בלי ההרשאה הנסגרת, אך לא צריך להיבהל. הרוב יפעל גם בלי ההרשאות המיוחדות, ומה שלא ניתן תמיד לאישור מחודש.
  • הגדירו חשבונות כפרטיים ברשתות החברתיות, כך שרק מי שתאשרו יוכל לראות מה שיתפתם.
  • קיבלתם פנייה או שיחת טלפון מגורם לא מוכר ולא רצוי – חסמו אותו.
  • פנו למפתחים אם אפשר ודרשו לדעת – לאן הולך המידע. שימו לב גם לשינויים בהגדרות הפרטיות ופנו לחברות. תלונות גולשים גורמות לחברות לשמור טוב יותר על פרטיות תוכן הגולשים.

זכרו תמיד שהמידע האישי הוא שלכם. בדיוק כמו מפתחות הבית או הרכב. גם אותם לא תמסרו לזרים בלי לדעת למה. קחו את היום להתחיל לקחת בחזרה את המושכות אליכם.

ביג דאטה ואתיקה מחקרית

כלים לאיסוף ולניתוח של ביג דאטה הופכים לכלים חשובים בהנגשת נתונים ומציאת קשרים משמעותיים בין גורמים אותם לא היינו חושבים לקשר. קשרים אלו נחשפים לעיתים קרובות רק בזכות הכמות העצומה של הנתונים.  מחקרים רבים ומגוונים עושים שימוש בביג דאטה, ביניהם מחקרים בתחומי החברה,  רפואה, תכנון אורבני, קרימינולוגיה ועוד. אולם, השימוש בביג דאטה כולל לעיתים קרובות שימוש בנתונים מאנשים רבים, נתונים שלא כולם רלוונטיים למחקר הספציפי. הנגשת הנתונים מעלה דאגות בנושאי פרטיות ואתיקה מחקרית, כפי שמראים המקרים המתוארים להלן.

שימוש בביג דאטה בפלטפורמות חברתיות

 בחודש מאי 2016 פירסמה קבוצת חוקרים דנית מאגר מידע של פרטי פרופיל של כ- 70,000 משתמשי האתר למפגשי הכרויות אנליין – אוקיי קיופיד . המידע כלל שמות משתמש, גיל, מגדר, מיקום, העדפות מיניות, סוג מערכת יחסים  בו הם מעוניינים, תכונות אישיות, ופרטים אישיים נוספים

החוקרים לא הפכו את המידע לאנונימי לפני פירסומו בטענה כי מדובר במידע שהוא מלכתחילה ציבורי. הטענה הייתה שהמידע שנאסף היה נגיש בעבר או עדיין ניתן לגישה ציבורית דרך אוקיי קיופיד, ולכן הפצת בסיס הנתונים רק מאפשרת את הצגת המידע באופן יעיל יותר.

הדיון הקצר שהתפתח בטוויטר אודות החוקיות והמוסריות של המעשה מעניין מאוד והסתיים בנימה שמזכירה גם דיונים אחרים אודות פרטיות במרחב הציבורי, בייחוד בתקופה בה לכל אחד יש מצלמה ויכולת פרסום מידית.

ההתנערות מסוגיות של פרטיות ואתיקה מחקרית  בטענה שהמידע כבר ציבורי ולכן אין בעיה לפרסם את בסיס הנתונים אינה חדשה. אולם, יש שיטענו שהיות המידע ציבורי אינה מספיקה.

גם אם אדם שיתף מידע ביודעין, ניתוח הביג דאטה עשוי לפרסם את המידע הזה ולהעצימו באופן שהאדם מעולם לא התכוון או הסכים לו. יתרה מזאת, באתרים כדוגמת אוקיי קיופיד המידע אינו באמת נגיש באופן חופשי לכלל הציבור ,כיוון שכדי לגשת אל המידע יש צורך ברישום לאתר. בנוסף, משתמשים יכולים לחסום גישה לפרופיל שלהם בפני משתמשים שונים.

הנושא עלה בעבר גם כאשר קבוצת חוקרים מהרווארד הורידה מפייסבוק 1,700 פרופילים וחקרה כיצד גזע ותרבות משפיעים על מערכות יחסים. חלק מבסיס הנתונים הועלה לגישה חופשית לשימוש במחקרים אחרים, מתוך הבנה שפרופילים אלו יכולים לתת מידע רב במחקרים מסוגים שונים. אולם, לא נעשו מאמצים מספקים לשמור על אנונימיות הפרופילים והם זוהו כמחזור 2009 של אוניברסיטת הארוורד.

מקרה אחר התרחש ב 2010 כאשר מהנדס מאפל ניצל פירצה בארכיטקטורת המידע של פייסבוק כדי  לייצר  "זחלן רשת"  ( Web crawler -תוכנה רובוטית שסורקת דפי ווב)  והוריד באמצעותו מידע אודות 215 מיליון חשבונות פייסבוק. המהנדס תכנן להפוך את המידע לאנונימי לפני שיחלוק אותו לצורכי מחקר, אולם לבסוף מחק את המידע כולו, לאחר איומי תביעה מצד פייסבוק.

הדוגלים בכך שפרסום בסיסי נתונים מסוג זה אינו אתי טוענים בין היתר שעצם העובדה שאדם משתף מידע בציבור אינה שוות ערך להסכמה להשתתפות במחקר. אתיקה במחקר דורשת הגנה על פרטיות המשתתף, קבלת הסכמה מדעת, שמירה על חיסיון המידע שנאסף וצמצום נזקים. כל אלו אינם נלקחים בחשבון כאשר המידע נלקח מאתרים כגון פייסבוק, אוקיי קיופיד, טוויטר ועוד, ללא הסכמת בעלי הפרופילים.

מקרים אלו מראים שחובה על חוקרי ביג דאטה להתייחס אל השאלות האתיות העולות מסוג המחקר בו הם עוסקים.

ביג דאטה ברפואה ובמחקר

מחקר חברתי הוא לא המקום היחיד בו סטים גדולים של מידע אודות אנשים יכולים לסייע. מערכת הבריאות היא מקום נוסף בו שימוש בביג דאטה יכול לסייע במחקר.

בכתב העת New Scientist פורסם שגוגל חתמה לאחרונה על הסכם עם בתי חולים ממערכת הבריאות של בריטניה. לפי ההסכם חברת DeepMind שבבעלות Google ושעוסקת בתחום הבינה  המלאכותית ולמידת מכונה תקבל לידיה מידע רפואי מפורט אודות 1.6 מיליון חולים מאושפזים ברחבי בריטניה, במטרה לפתח כלים תומכי החלטה.

זו לא הפעם הראשונה שגוגל עוסקת בבריאות. גוגל השיקה לפני מספר שנים, יחד עם אוניברסיטאות דיוק וסטנפורד, את פרויקט Baseline שמטרתו להגדיר "פיזיולוגיה נורמלית". הם עשו זאת על ידי אגירת מידע רב אודות אלפי אנשים. בנוסף היא משתפת פעולה עם ה -NIH  (ארגון הבריאות של ארה"ב) במחקר אודות 50,000 חולים עבור הפרויקט הגדול 1-Million patient Precision Medicine cohort.

בפרויקט הנוכחי של גוגל המידע שגוגל תקבל לגבי החולים יכלול נתונים על בדיקות מעבדה, היסטוריה רפואית, ואף נתוני מעקב אחר המיטות בהן שהו החולים בעת האשפוז. על מנת להגן על המידע הוא יאוחסן על ידי גורם שלישי, לגוגל יהיו הגבלות בשימוש במידע, ותוקפו של ההסכם, וכך גם הגישה למידע יפוגו בשנת 2017.

בעוד שיש הגבלות על הגישה למידע, נראה שגוגל מקבלת יותר מידע משנחוץ לה עבור האפליקציות אותן היא מפתחת, כגון סטטוס HIV  של החולים. מצב זה מדאיג את הדוגלים בשמירה על הפרטיות, בייחוד מכיוון שבעבר התגלו בעיות אבטחה באפליקציות שאושרו על ידי ארגון הבריאות של בריטניה.

מצד שני, השימוש בביג דאטה, למידת מכונה ובינה מלאכותית מסייע לאיתור מכנה משותף בין חולים ועזרה באבחון, יכול לסייע רבות במציאת גורמים משותפים ומגמות, וכן לעזור במחקר ופיענוח נתונים שלא היו נראים ללא שימוש בביג דאטה. כדי לעשות זאת יש לאסוף כמה שיותר מידע, מכיוון שאין לדעת מה יתגלה כרלוונטי. יחד עם זאת, שאלת הזכות לפרטיות וההסכמה של החולים להעביר את המידע היא שאלה חשובה שיש לשים אליה לב.

להמשך קריאה אודות ביג דאטה במחקרים חברתיים.

להמשך קריאה אודות המידע הרפואי שקיבלה גוגל.