מדריך לנתונים הפתוחים

הרעיון והיישום של נתונים פתוחים תופס תאוצה. לאור זאת חשוב קיומו של מדריך לנושא  שיכלול  הדרכה והכוונה בהיבטים שונים של הנושא – איזה נתונים לפתוח, מה היא התועלת החברתית והכלכלית של פתיחת הנתונים וכיצד לעשות בהם שימוש נאות  ויעיל.

מדריך כזה פורסם לראשונה בשנת 2012 . ב-13 במאי 2015 הוצהר על פרסומו של המדריך המעודכן לאור הלקחים וניסיון העבר.

המדריך נכתב על ידי מומחים מקהילת הנתונים הפתוחים ותורגם ל-18 שפות.

המדריך המקורי היה בעיקרו תיאורטי. המדריך החדש , לאור הניסיון שהצטבר, כולל מידע  עובדתי וסיפורים אמיתיים שממחישים את התועלת של הנתונים הפתוחים. מאז פרסומו של המדריך המקורי נוספו גם מקורות מידע חדשים בנושא  שמוצאים מקומם במדריך החדש.

מידע זה נכלל ב- 3  חלקים עיקריים:

Open Data Guideשעוסק בהיבטים המשפטיים, החברתיים והטכניים של הנתונים הפתוחים. נועד במיוחד לאלה שמבקשים לפתוח את הנתונים. בו יוכלו למצוא מידע מדוע  לפתוח את הנתונים, מה המשמעות של נתונים פתוחים וכיצד לפתוח את הנתונים

Value Stories –  כולל חקר מקרים ששופכים אור על הערך החברתי והכלכלי, האימפקט והיישומים השונים בעולם

Resource Library – כולל אוסף מקורות מידע :  מאמרים, מצגות וקובצי וידיאו שנוצרו על ידי קהילת הנתונים הפתוחים.

המדריך ממשיך להתעדכן והנוגעים בדבר מוזמנים  להוסיף תכנים

לאתר המדריך

מנוע גנאלוגי חדש – Top 100 Genealogy Sites Mega-Search

Top 100 Genealogy Sites Mega-Search הוא מנוע מותאם אישית של גוגל  שכולל באינדקס שלו את Top 100 Genealogy Websites of 2015 של Genealogy InTime Magazine.  מן הראוי לציין שהקריטריונים לבחירתם של  100 אתרים אלו כפופולריים ביותר היו  מקומם ב- Alexa לצד 3 מדדים נוספים – מספר המבקרים באתר, משך זמן הביקור באתר וכמות התכנים שנצרכה.

מנוע החיפוש חופשי והוא כולל  2 אופציות חיפוש – האחת Full 100 Mega Search חיפוש בכל 100 האתרים – אופציה זו כוללת גם חיפוש באתרים שאינם חופשיים   והאופציה השנייה היא “Free” 46 Mega Search שמאפשרת חיפוש רק באתרים החופשיים. האופציה השנייה החופשית מומלצת.

Genalogy in Time 2015 Top Mega-Search Engine-

Genealogy in Time's 46 Free of Top 100 Mega-Search Engine

עולם המידע 2015 – חידושים וחדשנות – הזדמנויות ואתגרים

ביום שלישי  12.5.2015 התקיים במסגרת "2015 Info" – כנס המידע שעורכת חברת טלדן זו השנה ה-30 ,יום עיון בנושא: "עולם המידע 2015 – חידושים וחדשנות – הזדמנויות ואתגרים"

יום העיון התמקד בחידושים, חדשנות וחיפושי מידע ברשת האינטרנט, כלים וטיפים. ביום העיון הוצגו טכנולוגיות מתקדמות  בתוכם האינטרנט של הדברים, מציאות רבודה, יישומים מבוזרים, מהפכת הנתונים ,  קוד פתוח וגיוס המונים , רובוטיקה  ועיבוד אוטומטי  של מסמכים והשלכותיהם על תחומי החיים השונים כולל עתיד העיתונות והחינוך ועד כדי שינוי הסדר החברתי.  להתפתחויות הטכנולוגיות השלכות גם על חיפוש המידע ופרטיות המשתמש. יום העיון  כלל  טיפים לחיפוש מידע עסקי וחברתי, חיפוש אנשים ונתונים,  חיפוש מידע גנאולוגי, כלים שימושיים למידען , חידושים ברשתות החברתיות עם דגש על חיפושי מידע וגם כיצד נתמודד עם האתגר של שמירת הפרטיות וכיצד נממן חברות הזנק ברוח התקופה. בסופו של היום הצצנו גם לרשת האפלה ולמלחמות הסייבר  שעלו באחרונה לכותרות

 

במשך היום התקיימו 14 הרצאות במסגרת 4 מושבים. לבקשת משתתפי יום העיון, אני מפרסמת בפוסט זה תקצירים של ההרצאות ואת המצגות של ההרצאות שאושרו לי עד כה לפרסום על ידי המרצים. אם אקבל מצגות/הרצאות נוספות בהמשך, אעדכן את הפוסט בהתאם.

להלן תוכנית היום על פי סדר המושבים, סקירה קצרה על ההרצאות השונות ומצגות מיום העיון .

יו"ר: ד"ר יפה אהרוני, אוניברסיטת תל אביב, המכללה האקדמית בית ברל

ד"ר נדב דפני, מנכ"ל Stips ואאוריקה , יזם אינטרנט ואיש פיתוח

ההרצאות במסגרת יום העיון:

מושב א': חיפושי מידע ברשת: רשתות חברתיות ומנועי חיפוש – חידושים, חיפושי מידע, איומים ופתרונות

האינטרנט של הדברים וחווית המשתמש – אבי איצקוביץ , מרצה, מומחה חווית משתמש XG MEDIA

העידן הבא של המהפכה הדיגיטלית המתמשכת, שנקרא Internet of Things הופך למציאות בימים אלו. אבל למה הביטוי "האינטרנט של דברים" באמת מתכוון? ה"דברים" האלו יכולים להיות מכשיר חכם כמו טלפון, נעלי ריצה או אפילו קרטון החלב במקרר. כל אלו יהיו חלק מרשת דיגיטלית מחוברת שתשפיע על  חיי היום יום של כולנו. בהרצאה אבי הציג עולם חדש של אתגרים טכנולוגיים , הציג מגוון דוגמאות למכשירים מחוברים והיכולות שלהם, וספר  לנו על תהליכי המחשבה ועקרונות העיצוב עבור העולם החדש, עולם האינטרנט של הדברים.

חידושים וחיפושי מידע במנועי חיפוש ורשתות חברתיות אמיר פליישמן, מנכ"ל סיקום גלובל

ההרצאה עסקה במגוון נושאים שקשורים לחיפושי מידע ברשתות חברתיות הוצאת תובנות עסקיות-תחרותיות מרשתות חברתיות ומכל הקשור בהן מסביב

-חיפושים ב- Graph Search

-Facebook Insights ומקבילותיה ברשתות אחרות

-מנועי חיפוש שיודעים לחפש ברשתות חברתיות

-יישומים סלולריים

למצגת ההרצאה

האם אתה מדיום חברתי? – איך להפיק מידע "שלא מן העולם הזה"  מרשתות חברתיותיהודית קורן, מידענית עצמאית

הרשתות החברתיות מלאות במידע שאנשים מספרים על עצמם מרצונם החופשי. ומה שלא מספרים, אין – נכון? לא אם את/ה "מדיום חברתי"!  לא, לא צריך כדור בדולח – רק את ערכת הכלים שסופקה  בהרצאה זו. למשל: איך לגלות את המידע שאנשים לא מבינים שמסרו; איך לבנות פרופיל של חברה או יחידה עסקית מהמידע על אנשים; איך לגלות מי באמת בעלי ההשפעה ומי המומחים (לא, הם לאו דווקא אותם האנשים) בתחום מסוים. וגם כמה אזהרות על הגדרות פרטיות והסתובבות אנונימית ברשתות, למי שלא רוצה שידעו עליו את הכול

למצגת ההרצאה

רשתות חברתיות – איומים ופתרונות ד"ר מיכאל פייר, אוניברסיטת בן-גוריון בנגב

מרבית המשתמשים ברשתות החברתיות אינם מודעים לאיומים ולסכנות שהם עומדים בפניהם (כגון: איבוד פרטיות וגניבת זהות). ההרצאה תציג  סקירה קצרה של המצב ותבחן מה ניתן לעשות עם המידע הפרטי של המשתמשים בפלטפורמה מקוונת זו. בנוסף, נרחיב על הפתרונות והמחקרים הקיימים, הן בתעשייה והן באקדמיה, הבאים לתת מענה לבעיה זו. לבסוף, יוצגו מספר צעדים פשוטים למימוש שכל פרט וכל ארגון יכולים לעשות על מנת לשפר את ביטחונם ואת פרטיותם.

למאמר בנושא

מושב ב': בינה מלאכותית, טכנולוגיה ומידע מהעבר וההווה – עיתונות רובוטית אוטומטיזציה במחקר היסטורי

עיתונות אנושית בעידן עיתונות רובוטית, ד"ר נעם למלשטרייך לטר , דיקן ומייסד בית ספר סמי עופר לתקשורת, המרכז הבינתחומי הרצליה

אנו בפתח עידן חדש בו תוכנות בינה מלאכותית מחליפות את העיתונאי האנושי הן כתחקירן והן ככותב הספור העיתונאי. התוכנה הזו נקראת עיתונאי רובוט.

הרובוט העיתונאי הנו מהיר מאד, מסוגל לנתח הררי מידע ובעל יכולת לכתוב ספור עיתונאי המותאם לאופיו של צרכן המידע-וכל זאת בתוך שברירי שניה ובעלות מינימלית.

יעילות העיתונאי הרובוט מעמידה בסכנה אמתית את העיתונאי האנושי שעלול לאבד את מקום עבודתו.

אולם לבינה המלאכותית יש מגבלות בתחום היצירתיות בהשוואה לעיתונאי האנושי. ככל שישכיל להבין את המגבלות האלה-יפתחו בפניו אופקים חדשים ליצירה עיתונאית אנושית ברמה גבוהה  עם יכולת לנצח בקרב מול הרובוט.

ההרצאה עסקה  בנושא הזה

למצגת ההרצאה

ניתוח אוטומטי של מסמכים היסטוריים, פרופ' ג'יהאד אל-סאנה, המחלקה למדעי המחשב, אוניברסיטת בןגוריון בנגב

שמענו על פיתוח אלגוריתמים מתמטיים לניתוח מסמכים היסטוריים תוך הפרדה בין הטקסט לרקע ובין שורות ובין מילים ופיתוח   אפשרות של חיפוש במסמכים ואחזור מידע

מושב ג: חדשנות – כר של הזדמנויות ומקורות מימון, מה צופן העתיד?

עתיד החינוך מקורסים מקוונים ועד משחקים , ד"ר רועי צזנה,

חוקר בסדנת יובל נאמן למדע, טכנולוגיה וביטחון, אוניברסיטת תל אביב.

ההרצאה עסקה   בעתיד החינוך – כיצד  הטכנולוגיה משנה את הכיתה, את המורה ואת התלמיד

על גאווה ודעה קדומה – תפיסות של מתכנתים לגבי דוגמאות קוד באינטרנט ,  ד"ר אוהד ברזילי, אוניברסיטת תל-אביב

עולם פיתוח התוכנה משנה את פניו. עושר המידע, הקוד הפתוח, וטכנולוגיות שונות, מאפשרים למתכנתים לעשות שימוש חוזר בקטעי קוד אשר לא הם פיתחו. צורת פיתוח זו שונה בצורה מהותית מהאופן שבו תופסים מתכנתים רבים את עבודתם – ככותבים המרכזיים של קוד המקור. בהרצאה היום יציג ד"ר אוהד ברזילי מחקר חדשני העוסק בדעות קדומות שיש למתכנתים כלפי מתכנתים אחרים אשר משתמשים בדוגמאות קוד באופן תכוף, ובשל כך נתפסים כנחותים או לא מקצועיים. המחקר מוצא כי חלק מדעות קדומות אלו דומות במהותן לדעות קדומות על רקע מגדר, גזע, לאום וכו'.

המהפכה הגנאלוגית כבר כאן: חידושים במחקר המשפחתי ד"ר ארנון הרשקוביץ, אוניברסיטת תל-אביב

ההרצאה הציגה  את המהפכות שעבר המחקר הגנאלוגי בעידן הדיגיטלי, אשר שינו את פניו לחלוטין, ושרטטה את קוויה של המהפכה הנוכחית אשר עשויה לשנות את התחום פעם נוספת

מציאות רבודה – הטכנולוגיה שתחליף את ממשק האדם מסך – חזרה לממשק אדם לאדם, מוטי קושניר,  CEO – Infinity augumented reality

במסגרת ההרצאה הוסבר לנו כיצד מציאות רבודה תאפשר לנו לתקשר עם תכנים דיגיטליים מבלי להתנתק מהעולם הסובב אותנו. כיצד ניתן ללמד מכונאי על מנוע אמיתי בסביבת העבודה שלו , כיצד ניתן לאפשר לקבוצת רופאים להתאמן לקראת ניתוח מורכב ביחד וכיצד ניתן להושיב ילדים אחד מול השני למשחק מונופול או שח מלהיבים. מציאות רבודה היא השלב הבא ביכולת שלנו לשלב את העולם הדיגיטלי בתוך עולמנו הפיזי.

למצגת ההרצאה

מבוא למימון המונים , דני טימור, שותף  במימונה ומנהל האתר

יש לכם  פרויקט או מיזם שאתם רוצים לממש ולפתח, אבל חסרים לכם מזומנים?…גיוס המונים יכול להיות הפתרון. הרעיון שמאחורי מימון המונים הוא גיוס סכומים קטנים מהרבה אנשים.  דני טימור מנהל אתר מימונה הרצה  על התופעה.

מושב ד: העידן הסמנטי – כלים וחיפושים- טיפים למידען, הרשת האפלה ומלחמות הסייבר

עבודה עברית – ארגז הכלים למידען הישראלי בעידן הסמנטי, אהבה כהן, הספרייה המרכזית, המכללה האקדמית בית ברל

בהרצאה נסקרו מספר כלים חדשים שיעזרו למידענים במהלך עבודתם ונבדקה  רמת ההתאמה של הכלים לעבודה בשפה העברית

למצגת ההרצאה

הרשת האפילה ומלחמות הסייבר – ד"ר נדב דפני, מנכ"ל stips ואאוריקה, יזם אינטרנט ואיש פיתוח

בהרצאה שמענו על הטירור הקיברנטי, לוחמת הסייבר, איך, מי במשחק והרשת האפילה שעוזרת…..

למצגת ההרצאה

מהפכת הנתונים וחיפושי מידע –  ד"ר יפה אהרוני, אוניברסיטת תל-אביב, המכללה האקדמית בית ברל

אחת מהתופעות שמאפיינות את עולם המידע היום היא ההתפתחויות בתחום הנתונים – הנתונים הגדולים, הנתונים המקושרים והנתונים הפתוחים גם בתחום המדע.  ההרצאה עסקה בהתפתחויות אלה  בהקשר של חיפושי מידע

לסיכום ההרצאה

למצגת ההרצאה

תודה רבה לכול המרצים, לכול המשתתפים ביום העיון ולמארגני כנס מידע 2015 מחברת טלדן

נתונים ממשלתיים פתוחים – תוצאות סקר PEW

תופעת הנתונים הממשלתיים הפתוחים  תופסת תאוצה בעולם כולו ובארה"ב במיוחד  שמנסה להשתמש בנתונים כאמצעי לשפר את ביצועי הממשלה ולעודד גישה חיובית וחמה יותר כלפי הממשלה. במקביל לפרסום הנתונים הפתוחים נעשים מאמצים לפתח כלים יעילים יותר לשיתופו והפצתו.

סקר שנערך על ידי PEW   שם לו למטרה לבדוק את הסנטימנט הציבורי בארה"ב כלפי יוזמות ממשלתיות אלו. הסקר נערך בתקופה  17 בנובמבר – 15 בדצמבר 2014  והשתתפו בו   3212  נחקרים .תוצאות הסקר התפרסמו ב- 21 באפריל 2015.

הסקר בדק את דרגת המודעות של הציבור למאמצים אלו של הממשלה לשתף מידע, האם מאמצים אלו מתורגמים לשימוש בנתונים על ידי הציבור כדי לעקוב אחרי ביצועי הממשלה, האם הציבור סבור שליזמות אלה של הממשלה יש פוטנציאל לשיפור ביצועי     הממשלה.

מתוצאות הסקר עולה שהמודעות של הציבור ליזמות הממשלתיות היא עדיין בראשית דרכה, באופן כללי הציבור אופטימי לגבי  יכולתן של יזמות אלה להגביר את מחויבות הממשלה למתן דין וחשבון אם כי רבים בטוחים פחות לגבי שיפור ביצועיה של הממשלה.

בין ממצאיו העיקריים של הסקר:

רוב  האמריקאים עדיין מעורבים ב- e-gov 1.0   יותר מאשר    ב- data-gov 2.0  – יזמות שכרוכות  בשיתוף פעולה

65%  מהאמריקאים ב- 12 החודשים שקדמו לסקר השתמשו באינטרנט למצוא מידע או נתונים שקשורים לממשלה. בשלב זה המניע לשימוש  במידע הממשלתי פשוט כגון רוטינה לאיתור שעות פעילות של הפרק המקומי  או קשור לטרנזקציות   כגון תשלום קנס או חידוש רישיון

50%  מהנחקרים סבורים שהנתונים שהממשלה מספקת לציבור מסייעים  לעסקים ליצור מוצרים ושירותים חדשים.

למידע נוסף

Scientific Data ומאגרי מידע מומלצים להפקדת נתונים

בפוסט קודם כתבתי על  פרדיגמה חדשה של פרסום נתונים שמושתתת על מאמר נתונים. מטרתו של מאמר הנתונים לתאר סט של נתונים באופן שמאמר מחקר מתאר תוצאות מחקר כגון שיטות ופרוטוקולים, תהליך, מבנה של סט הנתונים פורמט והפוטנציאל לשימוש חוזר.

Scientific Data הוא כתב עת בגישה פתוחה לפרסום ותיאור סטים של נתונים שהושק באפריל  2013 על ידי Nature Publishing Group .  כתב העת כולל מאמרים מסוג  Data Descriptor שמתארים סטים של נתונים. האתר אינו כולל את הסטים של הנתונים. את הסטים של הנתונים יש להפקיד במאגרי מידע ייעודיים לכך .

מחקרים מייצרים בדרך כלל נתונים רבים כגון טבלאות בגיליונות אלקטרוניים, מפות תמונות ועוד. נתונים אלה חשובים מאוד לחוקרים באותו תחום לצורך תיקוף ועיבוד משני של המחקרים. ריכוזם של נתוני המחקר במאגרים ייעודים לכך יכול להקל על המלאכה.

באתר של כתב העת  Scientific Data  ניתן למצוא רשימה ארוכה של מאגרי מידע מומלצים להפקדת נתונים בתחומים שונים :  מדעי החיים, כימיה, מדעי הסביבה, פיסיקה ואסטרונומיה  ומדעי החברה . סטים שלא מזוהים עם קטגוריה ספציפית  מומלץ להפקיד במאגריםרבתחומיים/כלליים – figshare ו- Dryad

מבחינת המשתמשים אפשר למצוא במאגרים אלו   חומר מחקרי חופשי רב.

לרשימת מאגרי מידע ייעודיים לנתונים

Open trials – מאגר בשלבי הקמה

ב– 21 באפריל  2015  Open knowledge   הצהיר על התוכנית לפתח את Open trials מאגר מידע פתוח בנושא ניסויים   קליניים בעולם. המאגר יצבור מידע ממגוון מקורות קיימים כדי לספק תמונה על הנתונים והמסמכים שקשורים לתרופות ולניסויים

Open Knowledge עובד על הפרויקט בשיתוף פעולה עם ד"ר Ben Goldacre מהמרכז לרפואה מבוססת ראיות באוניברסיטת אוקספורד. הבלוג שלו   זמין בכתובת http://www.badscience.net/

שלב ראשון של הפרויקט אמור להסתיים במרץ  2017 . אפשר להירשם באתר לקבלת עדכונים

להצהרה

לאתר

RDA – יישום, הערכה וציפיות

ההתפתחויות בטכנולוגיות מידע הובילו לשינויים בכללי הקטלוג, עקרונות וסטנדרטים.

סטנדרט  קטלוג חדש  RDA    –    Resource Description and Access   נועד להחליף   את כללי הקטלוג AACR2   . סטנדרט זה נועד לאפשר שיתוף מידע על בסביבה דיגיטלית ושילוב הספריות בווב הסמנטי. ההערכה היא שחלק מיתרונותיה של שיטת קידוד זו  יתברר רק בעתיד.

הרבה ספריות החלו  ביישומו של המודל . חשיבות היישום של RDA    מחייב אימוץ סביבה ביבליוגרפית חדשה. לאור זאת חשוב לדעת מהי המודעות, התפיסה והציפיות של מקטלגים ביחס ל- RDA      והמאמצים  הכרוכים במעבר ל- RDA.

מחקר שהתפרסם   בגיליון מאי 2015 של כתב העת   JLIS.it שם לו למטרה להעריך את המודעות , התפיסה והציפיות של מקטלגים ביחס ל- RDA  בספריות אקדמיות  בתורכיה.  השתתפו במחקר למעלה מ- 20 מוסדות אקדמיים בתורכיה.

שאלות המחקר וממצאיו התייחסו בעיקר לנושאים הבאים:

השקפת המקטלגים לטרמינולוגיה של RDA

דעתם של המקטלגים על המבנה של RDA

וההתייחסות שלהם ליישומם של כללי RDA

מסקנת המחקר היא שלמרות שהמקטלגים רואים ביישום RDA   ככרוך בלחץ במקום העבודה הם מתארים את RDA    ככלי חשוב שמגדיל את הנראות של מקורות המידע ומספק אינטראופרביליות במטרה ליצור דור שני של קטלוגים . יש צורך בארגון הדרכות למקטלגים – הדרכות פרונטליות, דפי הדרכה, ארגון כנסים וסמינרים. כמו כן מומלץ לשלוח את העובדים לכנסים לאומיים ובינלאומיים בנושא. כול זאת על מנת  להפוך את המעבר  ל- RDA  לקל יותר.

מידע נוסף במאמר המלא