ספריות, נתונים מקושרים והווב הסמנטי – שירות חדש

לספריות יש משאבי מידע איכותיים וייחודיים שכיום אינם נראים  בווב באופן קוֹנְסִיסְטֶנְטִי  . הנראות של הספריות בווב באופן קונסיסטנטי חשובה לרלוונטיות של הספריות  מכיוון שהמשתמשים חיים בווב ומסתמכים על מקורות המידע בו.

חוסר הנראות נובע בין השאר ממגבלות של מערכות וסטנדרטים של נתונים מסורתיים   כגון  MARC 21 .   בשנת 2011  ספריית הקונגרס חתמה על הסכם עם Zepheira ,  חברה שמתמחה בסטנדרטים ונתונים במיוחד של ספריות,  כדי להגדיר דרך לקדם את הנראות של הנתונים של  הספריות בווב, וזו הגדירה את המודל של הנתונים המקושרים   BIBFRAME . ההנחה היא שכאשר המידע ב- MARC  יומר ל- BIBFRAME  ויחשף לווב הוא יהיה בר גילוי על ידי מנועי חיפוש ושאר יישומי גילוי בווב.       לאחר שמודל       BIBFRAME  נבחן  במספר ספריות גדולות בעולם כגון הספרייה הלאומית באנגליה, הספרייה הלאומית בגרמניה וספרית פרינסטון  ,  Zepheira החלה ביוני 2014 בפרויקט שנקרא בשם יוזמת  Libhub  – יוזמה  ששמה  לה למטרה להמיר סט גדול של רשומות ביבליוגרפיות של ספריות בסטנדרט של Marc ל- BIBFRAME ולפרסמו בווב  כאשר המטרה היא שכאשר המשתמשים יוכלו להקיש על מקורות מידע יועברו חזרה לקטלוג הספרייה . בכך  יוזמת   Libhub   באה להתגבר על המגבלות הקיימות במטרה לשפר את הנראות של הספריות בווב. עד סוף מרץ 2015  12 ספריות ציבוריות גילו מחויבות למאמץ זה

במסגרת יוזמה זו חברת Innovative,  שמספקת פתרונות טכנולוגיים ושירותים לאלפי ספריות  ברחבי העולם, וספונסורית אקטיבית של יוזמת LibHub  השיקה ב- 24 ביוני 2015 שירות חדש  שמפשט באופן דרמטי את הפרסום של רשומות בנתונים מקושרים  וחוסך לספריות זמן ומאמץ לחשיפת המשאבים שלהם בווב  . שירות זה בשיתוף עם שירותיה של חברת Zepheira הופך בסופו של דבר רשומות  ספריה מפלטפורמות של innovative   לשפות של נתונים מקושרים כולל BIBFRAME  ו- Schema.org   .כאשר מידע בפורמט זה מפורסם בווב הוא  נגיש למנועי חיפוש והתוצאות מובילות את המשתמש ישירות לקטלוג המקורי ברמת הרשומה. באופן זה שירות  זה תורם לנראות של  משאבי הספרייה ולשימוש בהם.

שיתוף פעולה זה משרת את האסטרטגיה של יוזמת LibHub   כפי שיעידו דברי בכיר בחברת Zepheira :

"libraries, partners, and vendors working together is a key aspect of the Libhub Initiative's strategy to explore new ways to grow Web-based visibility and usage of library resources."

יישומי הנתונים המקושרים – תוצאות סקר של OCLC

OCLC     ערך סקר בינלאומי  בתאריכים 7 ביולי – 15 באוגוסט 2014   בנושא יישומי הנתונים המקושרים.  מטרת הסקר הייתה לקבל מידע על פרויקטים ספציפיים ושירותים  שיוצרים מידע על כנתונים מקושרים  ומשתמשים בו.   וזאת מטרה ללמוד ולהפיק לקחים מהניסיון של ספריות/ארכיונים/מוזיאונים .

ענו על הסקר 122 נחקרים מ- 15 ארצות . תוצאות הסקר כללו תיאורים של 76 פרויקטים /שירותים  בתחום הנתונים המקושרים – 25 מהם צרכו נתונים מקושרים, 4 פרסמו נתונים מקושרים, 47 צרכו וגם פרסמו נתונים מקושרים.

ממצאיו העיקריים של הסקר:

הסיבה  העיקרית ליישום פרויקטים בתחום הנתונים המקושרים היא להעשיר את הנתונים של  המיישמים  על ידי צריכה של נתונים מקושרים ממקורות אחרים ולספק חווית משתמש עשירה יותר.

4 המקורות לנתונים מקושרים שבהם נעשה שימוש על ידי רוב המשתמשים הם:  id.ioc.gov , DBpedia , GeoNames ,  VIAF

הסיבה העיקרית לפרסום נתונים מקושרים היא לחשוף את המידע לקהל רחב יותר בווב ולהראות מה ניתן לעשות עם הסטים של הנתונים שלהם כנתונים מקושרים.

4 הסטים הגדולים של הנתונים המקושרים  הם :  WorldCat.org  ,  WorldCat.org Works, Europeana  ,  The European Library

פירוט  והסבר על תוצאות הסקר  ניתן למצוא באתר  בנושאים הבאים:

מי עושה זאת?  כולל רשימה של משתתפי הסקר

נתונים מקושרים – דוגמאות

נתונים מקושרים – מדוע ואיזה מוסדות צורכים נתונים מקושרים

נתונים מקושרים – מדוע ואיזה מוסדות מפרסמים נתונים מקושרים

נתונים מקושרים – פרטים טכניים

נתונים מקושרים – עצות  מהמיישמים

קובץ אקסל  עם תשובות הנחקרים (להוציא מידע אישי)  זמין בכתובת  http://oc.lc/0bglX7 .  מידע נוסף  על פעילותו של OCLC        בתחום זמין בכתובת  http://www.oclc.org/research/themes/data-science/linkeddata.html

לכתבה בנושא

Agriprofiles וניצול הפוטנציאל של VIVO בתחום החקלאות

Vivo הוא יישום וובי סמנטי חופשי בקוד פתוח שמאפשר גילוי ידע מחקרי ברמת המוסד ומעבר לו. היישום פותח כבר ב- 2003  על ידי אוניברסיטת קורנל. . היישום מספק מידע מקושר באמצעות RDF     ובכך הופך את המשתתפים בו לחלק מהווב הסמנטי.

רשת VIVO      בווב היא  רשת לאומית בה משתתפים מוסדות  בעלי התקנה מקומית של VIVO    או בעלי יישומים עם יכולת  לספק מידע סמנטי . כיום חברים בה 7 מוסדות  בארה"ב  והיא פתוחה למוסדות נוספים שירצו להצטרף..

לאחרונה נעשה ניסיון לנצל את הפוטנציאל של vivo  לסקטור המחקר בתחום החקלאות . ניסיון  זה הוליד את Agriprofiles – כלי לגילוי ידע  בתחום החקלאות

למידע נוסף

נתונים מקושרים וספריות – מבחר מצגות

מטרת הנתונים המקושרים היא לאפשר שיתוף בין נתונים מובנים בווב באותה קלות שניתן היום לשתף מסמכים ולאחרונה אנו שומעים על  ספריות שנרתמות לנושא. ב- 10 בפברואר 2015  התקיים  מפגש /כינוס   בספרייה הציבורית בסאן פרנסיסקו – Library Data [R]evolution: Applying Linked Data Concepts  . המפגש התקיים   גם בחסותו  של OCLC      במסגרת סדרת הדיונים    “Collective Insight"

סדרת ההרצאות עסקה  ביישום הנתונים המקושרים בספריות.  5 מצגות וידאו מהכינוס זמינות כעת ב-YouTube. ארבע מהן זמינות גם כקובצי pdf. ההרצאות  הן:

Walk Before You Run: Prerequisites to Linked Data

BIBFRAME Update – Why, What, When

Making Library Collections Discoverable on the Web

Linked Data in the Library Workflow Ecosystem

BIBFLOW: Linked Data in the Not-So-Wild

כמה מסרים מההרצאות:

יישומי נתונים מקושרים  לא יהיו  ברי עניין אם מנועי חיפוש לא ימצאו את אתרי הספריות והמאגרים יסרקו ויבינו את מידע העל שלהם .  הגדלת נגישות האוסף בגוגל   תעשה באמצעות יישום כללים שנוגעים לאופטימיזציה של מנועי חיפוש  כולל   נוכחות הספרייה בויקיפדיה, ב-freebase, ב- wikidata , ב- google places/google my business  .  נוכחות כזו חשובה לנראות  ב- knowledge graph של גוגל.  שימוש ב- schema.org שבה תומכים מנועי חיפוש  מרכזיים גוגל , בינג יאהו וינדקס   יגדיל  אף הוא את נראות האתרים והאוספים.

עוד דובר על ה- BIBFRAME כמודל שמטרתו לספק למנועי  חיפוש תיאור באופן שניתן לניצול יעיל.

הגדלת הנראות של הספרייה בווב  קשורה גם לקטלוג  ישויות  ויישום כללי RDA

מידע נוסף במצגות ובקובצי ה- pdf

Google מעבירה את Freebase ל- Wikidata

Freebase   הושק ב- 2007 כבסיס נתונים מובנים של הוויקיפדיה. הוא כולל מידע על ספרים, סרטים, אנשים, מקומות  ועוד.. בסיס הנתונים עבר לידי גוגל בשנת 2010 כאשר רכשה את Metaweb חברת ההזנק שעמדה מאוחרי הפרויקט.  Wikidata הוא פרויקט של Wikimedia  שהושק ב-2012,  דומה במהותו במידה מסוימת ל- Freebase וקשור לוויקיפדיה ולפרויקטים נוספים של Wikimedia .

ב- 16 בדצמבר 2014 גוגל הודיעה שהיא מעבירה את בסיס הנתונים  של Freebase ל- Wikidata  מתוך הכרה שבהיותו פרויקט של – Wikimedia  -Wikimedia  ראויה יותר ומתאימה  יותר להוביל בסיס ידע משותף.

במהלך שנת 2015 עד סוף יוני 2015  Freebase  יהיה זמין לקריאה בלבד ולאחר מכן יושבת .

Freebase  תמך  במתן גישה לנתונים למפתחים באמצעות API . לפני  השבתתו  של  Freebase  ב-30 ביוני 2015 כולל ה- API ,  גוגל תשיק API לחיפוש ישויות מ- Knowledge Graph .

על פי גוגל צעד זה מהווה תמיכה ב- Wikidata  מבלי לפגוע במפתחים:

“is the best first step we can take toward becoming a constructive participant in the Wikidata community, but we’ll look to continually evolve our role to support the goal of a comprehensive open database of common knowledge that anyone can use.”

SWIB14 – הווב הסמנטי בספריות

לאחרונה שומעים ויותר על פרויקטים שתומכים בווב הסמנטי ובנתונים מקושרים. מטרת הנתונים המקושרים היא לאפשר שיתוף בין נתונים מובנים בווב באותה קלות שניתן היום לשתף מסמכים ולאחרונה אנו שומעים על  ספריות שנרתמות לנושא.

מבחינת הספריות נתונים מקושרים אמורים להחליף את  MARC   כבסיס  למסגרת הביבליוגרפית החדשה של הספרייה. הנתונים המקושרים מהווים מהפכה  בארגון המידע ואמורים לענות על חסרונות של השיטה היום  שמארגנת את המידע בבסיסי נתונים יחסיים סגורים ודורשים תחזוקה שוטפת.

כנס SWIB      – Semantic Web IN Libraries   שמתקיים מדי שנה מאז 2009  שם לו למטרה לספק מידע  על ההתפתחויות בתחום הנתונים המקושרים בהקשר של הספריות ולאפשר חילופי מידע וניסיון בנושא.

השנה הכנס מתקיים בבון גרמניה בימים אלו – 1-3  בדצמבר 2014 . הכנס עוסק במגוון נושאים בתחום כגון:  RDFSchema.org , Wikidata ועוד.  ההרצאות משודרות בזמן אמת .

מידע, תקצירים ושקפים מהרצאות  משנים קודמות של הכנס זמינות באתר

תודה לטולי עמיכל על המידע על הכנס

לתוכנית הכנס

Symbolab – מנוע חיפוש סמנטי חדש למתמטיקה ומדעים

בפגישה היום 21 .11 2012  של המכון לחקר האינטרנט של אוניברסיטת תל אביב  התקיים סמינר פתיחת השנה בנושא מנועי חיפוש ופער דיגיטלי.

 אחת ההרצאות  הייתה הרצאתה של מיכל אבני  בנושא Symbolab  –  מנוע חיפוש סמנטי חדש למתמטיקה ולמדעים – פיתוח ישראלי של חברת EqsQuest שמיכל נמנית על מייסדיו. . לצערי לא התאפשר לי להיות  נוכחת בהרצאה  והדיווח על המנוע הוא על סמך המידע באתר המנוע  ובבלוג הנלווה והתנסות קצרה  עם המנוע. .

 Symbolab     מאפשר חיפוש משוואות, נוסחאות וביטויים באמצעות סימנים מתמטים ומדעיים בנוסף לחיפוש טקסט. מנוע החיפוש שם לו למטרה לספק את התוצאות הרלוונטיות ביותר לשאילתות מסוג זה ולשם כך הוא משתמש באלגוריתם חכם  שמנסה להבין את המשמעות וההקשר של שאילתות החיפוש. הוא כולל באינדקס שלו  טקסט מלא ונוסחאות ממגוון  מקורות מידע  מקוונים חופשיים – אנציקלופדיות, מילונים, פרסומים אקדמיים, הרצאות, ספרים ומקורות נוספים עדכניים בתחומים מתמטיקה, פיזיקה וכימיה.

 מקורות המידע שלהלן :Wikipedia, WikibooksWikiversity, MIT OCWStanford SEE, MathWorld, Scienceworld, Khan Academy, הם רק חלק ממקורות המידע שכלולים באינדקס של המנוע.

 באתר יש  עורך שמאפשר בקלות להזין בתיבת החיפוש  נוסחאות מתמטיות . מנוע החיפוש מספק פתרונות וגרפים לשאילתות שמבוססות על נוסחאות מתמטיות כאשר זה ישים  וגם מידע טקסטואלי רלוונטי.

אפשר להגביל מראש את תוצאות החיפוש למקור מסוים ואפשר גם לעדן את השאילתות ולסנן את תוצאות החיפוש על פי מקורות המידע השונים וקטגוריות נושאיות.

 כמו כן  יש אפשרות להתקין תוסף תוכנה Quick Search  לדפדפנים  Chrome ו- Firefox  שמציג אייקון ליד נוסחאות במספר אתרים נתמכים: Wikipedia, Wikibooks , StakExchange MathOverflow .לחיצה על האייקון תציג מידע על הנוסחה.  בעתיד הכוונה להרחיב את מספר האתרים הנתמכים.

 לאתר המנוע

כנס הווב הסמנטי הבינלאומי ה-11

כנס הווב הסמנטי הבינלאומי ה-11  התקיים בבוסטון ב-11-15  בנובמבר 2012 . הכנס עסק בווב הסמנטי ויישומיו בהיבט האקדמי והתעשייתי יישומי.

 הוצגו בין היתר Data.Govhealthdata.gov,  נדון נושא ה- big data , אונטולוגיות, נתונים מקושרים ועוד.

 סיכום האירוע ממי שנכח בכנס מכניס את הקורא  לאווירת הכנס.

 באתר הכנס אפשר למצוא  קישורים לאירועי הכנס  ולחומרים שונים שהוצגו בכנס כולל  סדנאות, מדריכים, מאמרי  מחקר , מאמרי הערכה וניסוימחקרי שימושהרצאות מפתחפאנל בו נטל חלק גם  ממציא הווב  Tim Berners-Lee,  פוסטרים ועוד.

 לאתר הכנס 

Schema Creator , Microdata Generator- צעדים ראשונים לקראת חיפוש מובנה בדרך לווב סמנטי

  בזמנוו כתבתי פוסט על  Schema.org – יוזמה משותפת של שלושת מנועי החיפוש הגדולים Google, Bing, Yahoo שתומכת בשפה משותפת לתיוג מידע מובנה בדפי ווב, עליה הצהירו ב- 2 ביוני 2011.

משמעות היוזמה היא  שבעלי אתרים, יוכלו להטמיע בקלות יחסית מידע סמנטי בתוך הקוד של דפי הווב הקיימים – דפי5 html – מידע שמכונות יכולות להבין ולחלץ אותו באופן חד משמעי. בכך יסיעו למנועי חיפוש להבין טוב יותר את התכנים של דפי הווב שלהם ולמעשה היוזמה מהווה  התקדמות לקראת החזון של הווב הסמנטי.

המשמעות מבחינתם של מנועי החיפוש והמשתמשים היא תשובות מדויקות יותר למספר רב יותר של שאלות. המשמעות מבחינת אתרי ווב שיאמצו סכימה זו היא הגדלת הנראות שלהם במנועי חיפוש.

כדי  להקל על בעלי אתרים  להטמיע את הקוד פותחו כלים שבעזרתם יוכלו בעלי אתרים ומשתמשים רלוונטיים ליצור באופן אוטומי בעזרת  טפסים קוד סמנטי אותו יוכלו להטמיע באתרים .

Schema Creator ו- Microdata Generator  הם כלים מסוג זה . המשתמש מזין את פרטי הארגון לדוגמה ובמקביל מקבל את הקוד הסמנטי המתאים אותו יוכל להטמיע באתר.

פירוט  ומידע נוסף אפשר למצוא בפוסט  ב- Search Engine Watch

 .

נתונים מקושרים וספריות – מדוע ואיך?

בפוסט קודם כתבתי על נתונים מקושרים וספריות . מטרת הנתונים המקושרים היא לאפשר שיתוף בין נתונים מובנים בווב באותה קלות שניתן היום לשתף מסמכים ולאחרונה אנו שומעים על  ספריות שנרתמות לנושא.

 מבחינת הספריות נתונים מקושרים אמורים להחליף את  MARC   כבסיס  למסגרת הביבליוגרפית החדשה של הספרייה. הנתונים המקושרים מהווים מהפכה  בארגון המידע ואמורים לענות על חסרונות של השיטה היום  שמארגנת את המידע בבסיסי נתונים יחסיים סגורים ודורשים תחזוקה שוטפת.

כדי שספרנים יוכלו להפיק את מרב התועלת מהנתונים המקושרים עליהם ללמוד להתנסות ולקחת חלק פעיל ביישום .

The Extensible Catalog Organization    תומך בפעילויות אלה על ידי אספקת תוכנת קוד פתוח לספרנים שרוצים ומוכנים למעבר מהתשתית הקיימת  לנתונים המקושרים.

 בפגישת האביב של CNI    הוצג נושא הנתונים המקושרים והספריות על ידי נציגים מאוניברסיטת  סטנפורד .סרטון הוידאו  זמין עתה בערוץ הוידאו של CNI

 לסרטון הוידאו ומידע נוסף  

נתונים מקושרים וספריות – OCLC , כנס IFLA 2012 , מצגות ועדכונים אחרונים

לאחרונה שומעים יותר ויותר על פרויקטים שתומכים בווב הסמנטי ובנתונים מקושרים. מטרת הנתונים המקושרים היא לאפשר שיתוף בין נתונים מובנים בווב באותה קלות שניתן היום לשתף מסמכים.

גם ספריות בעולם נרתמות לנושא. בפוסט ממרץ 2012  כתבתי על מספר פרויקטים של ספריות בתחום.גם Europeana הספרייה הדיגיטלית של אירופה – הצטרפה ליוזמות אלה.

 ב- 22  במאי ספריית  ספריית הקונגרס הודיעה על פרויקט   לתרגום MARC 21     למודל של נתונים מקושרים.

נראה שגם OCLC    נרתם לנושא.

  ב- 20 ליוני  OCLC  הודיע על צעדים ראשונים בכיוון  על ידי הוספת תיוג  ה– Schema.org  לרשומות שלו.   וכדי להבין יותר את הנושא וחשיבותו לספריות OCLC Research  הפיק לאחרונה סרטון  וידאו  בנושא נתונים מקושרים בספריות. סרטון הוידיאו בן 15 דקות  מהווה מבוא למושגים הבסיסיים בתחום ומדוע הנושא חשוב לספריות. על פי סרטון זה ספריות יצאו נשכרות מהשימוש בנתונים מקושרים : שימוש בנתונים מקושרים יגביר את הנראות של משאבי הספרייה, יאפשר יותר יישומים יצירתיים שיתבססו על מידע-העל של הספרייה ויפתחו הזדמנויות לקטלוג יעיל .

 בהקשר להדרכה בנושא מו הראוי  לציין את פרויקט  Learning Linked Data Project  בארה"ב  במימונו של  Institute of Museum and Library Services -IMLS

 לאור ההתפתחויות בנושא אין פלא שהנושא הוצג גם בכנס IFLA  2012     שמתקיים בימים אלו  בהלסינקי בירת פינלנד. OCLC   ארח ב- 13 באוגוסט 2012 במסגרת הכנס שולחן עגול בנושא הנתונים המקושרים. בדיונים בנושא השתתפו  נציגים מ-  British Library , OCLC    ,מרכז פומפידו, והספרייה הלאומית בשוודיה. קישורים  למצגות  בנושא של כל אחד מהנציגים    זמינות באתר:

 Making The connection: Linked Open Data at the British Library

The Digital Pompidou Center: Applying Linked Data Principle to Cultural Heritage Data

 Martin Malmsten, National Library of Sweden

 Library Linked Data Progress

המידע ברשת לאן? – סקירה והרצאות מיום העיון בכנס המידע 2012

ביום רביעי 16.5.2012 התקיים במסגרת "2012 Info" – כנס המידע שעורכת חברת טלדן זו השנה ה-27 ,יום עיון בנושא: " המידע ברשת לאן? – הנייד, רשתות חברתיות ומנועי חיפוש – לחוד או יחדיו?"    להלן סקירה קצרה על ההרצאות השונות ומצגות מיום העיון .

יו"ר: ד"ר יפה אהרוני, אוניברסיטת תל אביב, המכללה האקדמית בית ברל
ד"ר נדב דפני, מנכ"ל Stips, יזם אינטרנט ואיש פיתוח

האם הווב מת?    נשמעות  לא אחת חששות מהתופעה של  מידע  במערכות סגורות למחצה ברשת האינטרנט : יישומי מובייל סגורים שעלולים להשפיע על מעמדו של הווב ברשת,  ומידע סגור ברשתות חברתיות – תופעות שעלולות להיות להן השלכות על מנועי חיפוש. ביום העיון ראינו שהחששות לגורלו של הווב מופרכות.  לאור המצב ,  השאיפה והמגמה המסתמנת היום היא לחבר בין העולמות.

עולם המידע צועד לקראת חיבור בין מנועי חיפוש בווב, רשתות חברתיות והמובייל.  יום העיון עסק  בהתפתחויות  בתחומים אלו ובחיבור בין שלושת העולמות עם דגש על טיפים למשתמש

ביום העיון ראינו כיצד המידע הופך להיות יותר פתוח ונגיש , משותף ומקושר יותר , מותאם אישית יותר,  חוויתי יותר למשתמש ופותח לו חלון הזדמנויות במישור העסקי, המידעני, והחינוכי……………………………………………..

במשך היום התקיימו 13 הרצאות במסגרת 5 מושבים. לבקשת משתתפי יום העיון, אני מפרסמת בפוסט זה תקצירים של ההרצאות ואת המצגות של ההרצאות שאושרו לי עד כה לפרסום על ידי המרצים. אם אקבל מצגות/הרצאות נוספות בהמשך, אעדכן את הפוסט בהתאם. להלן תוכנית היום על פי סדר המושבים ההרצאות וקישורים להרצאות.

ההרצאות במסגרת יום העיון:

מושב א': איתור מידע ברשת

  • מידע ברשת –  לקראת מידע פתוח, משותף  ומקושר יותר – ד"ר יפה אהרוני , אוניברסיטת תל אביב, מכללת בית ברל

ההרצאה  עסקה  בשאלה –  לאן צועד המידע בעולם בו הרשתות החברתיות והנייד הביאו לכאורה לנסיגה במעמדם של הווב ומנועי חיפוש,  והתמקדה בהצגת שלוש מגמות חיוביות מבחינתו של המשתמש- המידע פתוח יותר, משותף יותר מובנה ומקושר יותר.ההרצאה התייחסה  להתפתחויות בתחום תנועת הגישה הפתוחה, הציגה  את הצד החיובי של רשתות חברתיות עם דגש על  רשתות חברתיות לאקדמיה,  ועסקה  גם בחזון הווב הסמנטי והנתונים המקושרים. בכל אחת ממגמות אלו הוצגו  נתונים ודוגמאות ליישומים מעשיים.   . למצגת ההרצאה ,   למצגת נוספת בנושא רשתות חברתיות לאקדמיה מיום העיון ספריות ומרכזי תרבות בעידן הגוגל – משתפים ומשתתפים

  • איתור מידע מדעי ברשת – פרופ'  יהודית בר אילן , אוניברסיטת בר-אילן

ההרצאה עסקה באיתור מידע מדעי ברשת.  נסקרו  סוגים שונים של כלים ברשת לאיתור חומר מדעי – מנועי חיפוש כגון: גוגל סקולר ומיקרוסופט אקדמיק, כלים חברתיים לניהול מידע  reference managers , קהילות אקדמיות ומאגרים נושאיים.  למצגת ההרצאה

  • ניטור מידע, ניתוח פעילות וחיפוש חברתי ברשתות חברתיות –  אלעד אמיר.מנכ"ל SpyTheNet

ההרצאה עסקה     בחיפוש חברתי בשירות הסקטור העסקיבאיתור משפיענים  ושימושים ובדרכים לאיתור אסטרטגיות מוצלחות, טרנדים וסיכונים ברשת . למצגת ההרצאה.   למצגת ההרצאה

  • הזיר"ה החדשה של הורדות וצפייה ישירה בסרטים , סדרות ותכני בידור מקוונים– ד"ר  נדב דפני, מנכ"ל stips יזם אינטרנט ואיש פיתוח

הרשת הישראלית זועזעה לאחרונה מהסרה של אתרים מרכזיים להורדת תכני מדיה, כגון סרטים, סדרות וכדומה. גוף בשם זיר"ה (זכויות יוצרים ברשת האינטרנט), האמון כאמור, על אכיפה של זכויות יוצרים בתחום זה, מצליח ל"ייבש" את תחום ההורדות והצפייה הישירה של תכנים לא חוקיים ברשת, על ידי סגירת אתרים והשתת קנסות כבדים על מפעיליהם.

מנגד, ברור שהטלוויזיה והקולנוע עוברים תהליך בלתי-הפיך של הגירה לרשת. הפתרונות והפיתוחים כבר בשער, חלקם במחשב האישי וחלקם במכשירי הסלולר והטבלטים. בהרצאה הוצג הנושא מהיבטים שונים שלו, כולל פיתוחים שונים בתחום ומגמות בצריכת מדיה מקוונת וכיצד הם מתמודדים עם ההיבטים החוקיים והכלכליים של פרסום מדיה שבעבר עלתה כסף רב – דרך האינטרנט – חלקה הגדול בחינם וחלקה במחירים זולים לאין-שיעור מבעבר. למצגת ההרצאה

מושב ב': מידע נייד, מותאם אישית ומבוסס מיקום

  • פרסונליזציה של מידע – פרופ'  ברכה שפירא , אוניברסיטת בן גוריון

ההרצאה עסקה בפרסונליזציה של מידע ומערכות המלצה

  • "העולם בכף ידך" – הטלפון ככלי לאיחזור מידע גאוגרפי מקומי – דניאל ליפסון, הספרייה הלאומית, ירושלים

ההרצאה עסקה  בנושא ההימצאות בשטח בעזרת אפליקציות גיאוגרפיות לסמארטפון. הוצגו והודגמו מפות סטטיות כלליות וייעודיות המותאמות למובייל אך הושם דגש  בעיקר את השימוש באפליקציות ה Geolocation על מנת לקבל וליצור מידע מבוסס מיקום המתרחש בזמן אמת. הייתה התייחסות לבעיות הפרטיות הקשורות למידע מבוסס מקום למצגת ההרצאה,,  להרצאה

מושב ג': הנייד וחווית המשתמש – מציאות רבודה והחיבור בין העולמות – הפיזי והוירטואלי וגם החברתי, מובייל ווב

  • Intuitive Content Authoring for Augmented Reality on Mobile Phones – פרופ' ג'יהאד אל-סאנה, אוניברסיטת בן גוריון

ההרצאה חשפה את ההיבט הטכנולוגי של המציאות הרבודה והשימושים השונים של המציאות הרבודה כגון חינוך ומשחקים

  • ויקיפדיזציה של המציאות המוחשית – שילובי מציאות רבודה ומידע ממדיה חברתית בתחומי חינוך, בידור וחברה– תמי נויטל, מרכז שהם , האוניברסיטה הפתוחה

יישומי מציאות רבודה (Augmented Reality) מאפשרים להוסיף לעצם מוחשי שכבות וירטואליות של מידע ומטא-דאטה המוצגות לצופים בעזרת אפליקציות במכשירים ניידים . מרבית הדוגמאות ברשת מציגות שימושים ביישומים אלה בהקשרים של שיווק או התמצאות מרחבית. בתחומי החינוך, ההעשרה והנגשת מידע חברתי מסוגים שונים לציבור ניתן לעשות שימוש מרשים ואפקטיבי ביותר ביישומים כאלה. בהרצאה הוצגו מספר דוגמאות קיימות ונדון הפוטנציאל הגלום בשילוב בין המוחשי לוירטואלי ובתרומתם של המשתמשים עצמם ליצירת שכבות המידע הוירטואליות האלה.  למצגת ההרצאה

למאמר שפרסמה תמי  בעלון "צליל מקוון" שיצא באחרונה , יש שם פירוט ודוגמאות נוספות לשימושי המציאות הרבודה בתחום החינוך וההדרכה, וטקסט ארוך יותר המפרט את עיקרי ההרצאה

  • חווית משתמש נכונה במוביל וובאתר סלולרי מול אפליקציה, ליאור יאיר , מנכ"ל משותף בחברת נטקראפט, מכון טכנולוגי חולון

מחקר של גרטנר שנערך ב-2010 מראה שעד סוף 2013 רוב הכניסות לאתרים בעולם כולו יהיו דרך סמארטפונים ומכשירים מובילים אחרים בעלי דפדפנים.

בשנים האחרונות הושקו מאות אלפי אפליקציות סלולריות למכשירים השונים. בשנה האחרונה התגלתה דרך חדשה להגיע אל ציבור המשתמשים – אתר מותאם לגלישה סלולרית. מה היתרונות של אתר סלולרי אל מול אפליקציה? מתי נכון להתאים אתר לסמארטפון ומתי נכון ליצר אפליקציה חדשה? מה ההבדלים ביניהם? איך ניתן לייצר חווית שימוש טובה באתר המותאם למכשירי הסלולר?

על זאת ועוד דובר בהרצאה. למצגת ההרצאה

מושב ד' :הווב הסמנטי

חיפוש סמנטי מתקדם: עולם הפטנטים ומידע רפואי כדוגמא

  • ד"ר אריאל פרנק, אוניברסיטת בר-אילן; ד"ר אשר וילק, המרכז הבינתחומי הרצליה

ההרצאה  כללה 2 חלקים –ד"ר אשר וילק הדגים בהרצאה את  מהותו ויתרונותיו של החיפוש הסמנטי וכלל דוגמאות לחיפושים כאלו מתחום הפטנטים. ד"ר אריאל פרנק  הדגים את מאפייניו ויתרונותיו של המנוע הסמנטי New Pubmed search שבו משולבת טכנולוגיה סמנטית על מאגר המידע הביורפואי Pubmed  למצגת ההרצאה של ד"ר אריאל פרנק, למצגת ההרצאה של ד"ר אשר וילק

מושב ה': ערוצי מידע ועסקים ברשת בשנת 2012 – קידום אתרים, שיווק, כיצד לעשות כסף מתוכן

  • גוגל 2012 – היכן נקודת ההיתוך בו נפגש המוח האנליטי עם המוח הקריאטיבי בתהליך תכנון האתר וקידומו,  ניר שי , nearme  – קידום אתרים בגוגל

ההרצאה התמקדה  בתפקידם של אנשי ה-SEO     בתהליך הקמת אתר ברשת . כיצד לתכנן אתר מצליח באינטרנט? המוח האנליטי והמוח הקריאטיבי בתהליך תכנון האתר "כיצד מתחלקת האחריות בין אנשי העיצוב וה- UI ובין אנשי ה- SEO ?"

אם עד היום היינו זקוקים לאנשים עם חשיבה אנליטית והיכרות טובה עם הטכנולוגיה כדי להצליח ולהשיג יתרון יחסי על פני המתחרים, כיום אנו זקוקים לחשיבה הרמונית בין השתיים, כדי להגיע לנקודת ההיתוך – היא ההצלחה

להרצאה , טיפים לקידום אתרים

  • שיווק המותג ברשת – שילוב בין ערוצי מידע שונים ובניית אסטרטגיה לנוכחות הוליסטית ברשת בשנת 2012, ורד חורי,  ewise , שיווק חכם ברשת

הרשת מלאה בפרסומות והצרכנים מוצפים במידע ובכל זאת ישנן דרכים חכמות להתבלט ולהצליח.
בהרצאה הודגם כיצד עסקים עם תקציבים קטנים כגדולים יכולים להיבדל, ליצור באזז ולמתג עצמם כאוטוריטות, בעזרת נוכחות חכמה ברשת ושימוש בערוצי מידע שונים. לקוחות ופרוייקטים הם לא 'העתק-הדבק', כל לקוח נבדל בצרכים ובאפיקי השיווק שנבחר עבורו.
מקצועיות, יצירתיות, ראש פתוח והכרות מעמיקה עם הלקוח – מאפשרים לתת את הפתרונות החכמים ביותר. למצגת ההרצאה, לצפייה בסרטון על שיווק אינטרנטי

  • עושים כסף מתוכן: לכל ארנק יש מפתח…הצרכנים מכתיבים את המודל העסקי סיגל אמסלם, אתר התיירות, מפה

נסקרו  מודלים קיימים (אתרי תוכן בחינם מול אתרי תוכן בתשלום) ונבחנו מודלים מתהווים (תוכן פרימיום, שירותי תוכן און ליין, מיקרו פיימנט ועוד) הוסבר כיצד פלטפורמות טכנולוגיות (web 2.0, פייסבוק, סמארטפונים בצירוף GPS ) משפיעים על שינוי במודלים העסקיים הקיימים. לבסוף ניתן מענה לשאלה  כיצד עשוי התוכן באינטרנט להצדיק את הקיום העסקי שלו..למצגת ההרצאה, לאתר מפה

תודה רבה לכל המרצים, לכל המשתתפים ביום העיון ולמארגני כנס מידע 2012  מחברת  טלדן

גרף הידע של גוגל – צעד לקראת הדור הבא של החיפוש

ב- 16 למאי 2012 גוגל השיקה את גרף הידע שמסייע למשתמש לגלות מידע חדש בקלות ובמהירות.

גרף הידע הוא מודל חיפוש חכם שמבין את הישויות בעולם האמיתי ואת היחסים ביניהם. גרף הידע של גוגל כולל למעלה מ- 500 מיליון אובייקטים ולמעלה מ- 3.5 מיליארד עובדות עליהם ויחסים בין האובייקטים השונים . המערכת אוספת מידע על האובייקטים השונים , לומדת גם מחיפושים של משתמשים אחרים בשאילתות השונות ומוסיפה מידע רלוונטי לגרף הידע.

גרף הידע מאפשר לחפש דברים אנשים ומקומות שגוגל יודע עליהם ולקבל מידע רלוונטי לשאילתה גם כאשר למונח החיפוש משמעויות שונות. .

באופן זה גרף הידע של גוגל מעצים את החיפוש ב- 3 דרכים עיקריות:

1. מאתר את הדבר הנכון. גוגל מבין את ההבדל במשמעויות השונות של המונח ומאפשר לצמצם את תוצאות השאילתה למשמעות הרצויה למשתמש. ומכאן שהתוצאות של השאילתה רלוונטיות יותר.

2. מאפשר קבלת תמצית טובה יותר . באמצעות גרף הידע גוגל מבין טוב יותר את השאילתה , הוא יכול לתמצת תכנים רלוונטיים לנושא, כולל מידע עובדתי. למשל אם אנו מחפשים מרי קרי נקבל מידע על תאריך הולדתה ומותה, אבל גם מידע על החינוך שלה והתגליות המדעיות שלה.

3. מאפשר העמקה והרחבה. מאפשר ללמוד עובדות חדשות וקשרים חדשים שקשורים לשאילתה. כך למשל אם נחפש ליאונרדו דה וינצי נקבל מידע על היצירות שלו ועל ציירים נוספים בתקופתו.

נכון להיום הגרף מיושם בגוגל US .

זהו צעד ראשון לקראת הדור הבא של חיפוש ששם לו למטרה להבין את העולם כפי שבני אדם מבינים ולהפוך את מנוע החיפוש ל- knowledge engine

לסרטון בנושא

להודעה על גרף הידע

הווב הסמנטי ואתר חדש למפתחים – RDFa.info

היום קיימים הרבה נתונים בווב אבל רובם סגורים במאגרי מידע פרטיים או כתובים בצורה שאינה מובנת ושימושית למחשבים. רוב הנתונים שקיימים היום אינם קשורים אלא חיים ב"איים" מבודדים שאינם קשורים האחד לשני.

מצב זה נוגד את המהות העיקרים של הווב. פתרון בעיית החיבור בין הנתונים יאפשר למחשבים לעשות ביתר קלות שימוש בנתונים לטובת הכלל.

RDFa הוא הרחבה של HTML5 שמסייעת לתייג אנשים, מקומות, אירועים, סקירות, מתכונים, סרטי קולנוע ועוד, ובכך מסיע לפתור את בעיית החיבור בין הנתונים. RDFa ניתנת ליישום לא רק ב- HTML5 בלבד אלא במגוון שפות תיוג אחרות שכן היא טכנולוגיה כללית לתיוג נתונים מקושרים .

תיוג דפי ווב באופן זה יגדיל את הנראות שלהם במנועי חיפוש

אתר חדש RDFa.info שם לו למטרה לרכז כלים שיסיעו למפתחים במשימה זו של הפיכת טקסט לנתונים מובנים ומקושרים. האתר מספק מקורות מידע וכלים למפתחים הוא דינמי ומפתחים מוזמנים גם לתרום לאתר.

לאתר

המידע ברשת לאן? – מנועי חיפוש, רשתות חברתיות והנייד – ביחד או לחוד?

הווב שבעיקרו מורכב מאוסף דפי html מהווה רק חלק מרשת האינטרנט. מאז שנת 2000 הווב נמצא בנסיגה וחלקיו האחרים של האינטרנט מהווים מקור למידע . אחד ממקורות המידע העולים הם יישומי המובייל. יישומים אלה שמכונים אפליקציות נייטיב הן אפליקציות סגורות שמורידים למכשירים הניידים.

השימוש בטלפונים חכמים ומחשבי לוח נמצא בעלייה ועמו גם השימוש באפליקציות. על פי תחזיות חברת המחקר גרטנר מדצמבר 2011 ,בשנת 2014 ימכרו מִילְיַארְד טלפונים חכמים – מספר כפול מתחזיות המכירה של מחשבים אישיים באותה שנה . יש לכך השלכות על השימוש באפליקציות לעומת השימוש בווב. עם גידול השימוש במכשירים ניידים גדל השימוש באפליקציות נייטיב סגורות שמספקות שירותים קלים למשתמשים על חשבון השימוש בווב הפתוח – המשתמשים משתמשים ברשת האינטרנט אך לא בווב . מספר האפליקציות היום גדול , וחוזים ששנת 2013 תהיה שנת השיא מבחינת המכירות של האפליקציות .על פי תחזיות גרטנר מדצמבר 2011 בשנת 2015 פיתוח אפליקציות ייעודיות לסמרטפונים ולמחשבי לוח יעלה על פיתוח פרויקטים למחשבים אישים ביחס של 4 ל- 1.

במקביל לגידול בשימוש בטלפונים ניידים אנו עדים לשימוש הולך וגובר ברשתות חברתיות שאף הן סגורות למחצה. על פי גרטנר עד 2014 יחליפו הרשתות החברתיות את שירותי הדוא"ל ככלי העיקרי למטרות תקשורת בין-אישית עבור 20% מהמשתמשים העסקיים

כל זה מוביל לכאורה למצב של נסיגה בווב הפתוח לטובת מערכות סגורות או סגורות למחצה ולכך יכולות להיות השלכות שליליות על מנועי חיפוש ומעמדם בווב על כל ההשלכות שיש לכך לגבי המידע למשתמש. מעמדם של מנועי החיפוש תלוי במעמדו של הווב שכן עיקר הטכנולוגיה שלהם מתבססת על הזחלנים שסורקים את הווב הפתוח שרובו כולל דפי html.

לאור מצב זה והמפנה החשוב בעולם הדיגיטלי מווב פתוח לפלטפורמות סגורות שמשתמשות ברשת האינטרנט לתעבורה אך לא בדפדפן לתצוגה אין פלא שכתבת שער ב- Wired magazine in 2010 בשם "The Web Is Dead. Long Live the Internet" חוזה נסיגה במעמדו של הווב .

אזהרה דומה נשמעה מפיו של ממציא הווב עצמו Tim Berners-Lee בגיליון דצמבר 2010 של Scientific American :

, “The Web as we know it is being threatened,” adding that it “could be broken into fragmented islands.”2

מאז נושא זה שנוי במחלוקת ומעורר ויכוחים ודיונים על מעמדו של הווב ברשת האינטרנט וההשלכות לגבי מנועי חיפוש., והיום מומחים רבים סבורים שהיתרונות של הווב רק גדלים.

פיתוח המובייל ווב (לעומת יישומי המובייל) הוא צעד בכיוון חיזוק מעמדו של הווב ,    ו-HTML5 CSS3 הם אמצעים לכך וגם פתרון לבעיות נגישות אחרות של מנועי חיפוש למידע ….הנראות של המידע מרשתות חברתיות למשתמש גדלה אף היא עם שילוב מידע מרשתות חברתיות במנועי חיפוש.

לצד מגמה זו של שילוב ותעבורה בין האיים השונים בווב אנו עדים היום גם למספר מגמות חיוביות נוספות מבחינת המידע בווב והמשתמש – תנועת הגישה הפתוחה נמצאת בעלייה מתמשכת , רשתות חברתיות מאפשרות את שיתוף המידע כולל מידע אקדמי ברשתות חברתיות אקדמיות, וחזון הנתונים המקושרים הולך וקורם גידים – כל אלה יהפכו את המידע לא רק לפתוח יותר אלא גם לחופשי, משותף ומקושר יותר ואין ספק – המשתמש הוא הנשכר העיקרי.

למאמר המלא

ליום העיון "המידע  ברשת לאן? הנייד, רשתות חברתיות ומנועי חיפוש – לחוד או יחדיו" שיתקיים    בכנס טלדן מידע 2012.  ביום העיון ידון נושא זה עם דגש על המידע וטיפים למשתמש.

למאמר שפורסם  בדה מרקר

New Pubmed search – השילוב בין Pubmed ו- Hakia

בזמנו כתבתי בבלוג על מנוע החיפוש הסמנטי Hakia. Hakia משתמש בשיטה המיוחדת לו לאחסון וניתוח סמנטי של מסמכים אלו לצורך אחזורם.

מנוע החיפוש HAKIA מחפש בסגמנטים שונים: ווב, חדשות, בלוגים וידאו תמונות ועוד . בחלק מהסגמנטים הוא משתמש בשיטה שנקראת QDEX – Query Detection and Extraction ואשר מחליפה את השיטה המקובלת ליצירת אינדקס. על פי השיטה המקובלת ליצירת אינדקס שמכונה קובץ מהופך –inverted file – האינדקס כולל את המונחים המופיעים בטקסט, ומצביעים אל מונחים אלה מהווים בתהליך אחזור המידע שערי גישה למסמכים. אם נשתמש בשיטת הקובץ המהופך גם להוספת קשרים סמנטיים ייווצר מבנה שיכביד מאוד על הביצועים. בשיטה החדשה של מנוע החיפוש Hakia, לעומת זאת, שערי הגישה לדפי ה-Web אינם מצביעים למלים אלא לשאילתות. המנוע מנתח באמצעות אלגוריתם מתוחכם את כל השאילתות האפשריות בדפי ה- Web והשאילתות מהוות שערי גישה לדפי ה- Web. באופן זה בעת אחזור המידע המנוע עובד על סטים קטנים יחסית של דפי Web ורק עליהם הוא מבצע את הניתוח הסמנטי. בכך נפתרת בעיית המשאבים הרבים שנדרשים לביצוע ניתוח סמנטי על מספר רב של דפים. על פי התיעוד באתר ביצוע הניתוח הסמנטי ודירוג התוצאות מתבצע באמצעות אלגוריתם מתוחכם SemanticRank שעושה שימוש גם באונטולוגיות.

טכנולוגיה סמנטית זו מיושמת על מאגר המידע הביורפואי Pubmed הולידה את מנוע החיפוש New Pubmed search. מנוע זה הוא מנוע חיפוש חופשי וכפי שנכתב באתר מחפש בלמעלה מ- 20 מיליון תקצירים של המאגר הרפואי PUBMED ובזכות הטכנולוגיות הסמנטיות בהן הוא משתמש אפשר לקבל תשובות רלוונטיות יותר לשאילתות שמבקשות לתת מענה על קשרים בין משתנים שונים. דוגמאות אפשר למצוא באתר.

בדוגמאות אלו אפשר לקבל גם את התוצאות במנוע זה בהשוואה לאותן שאילתות ב- Pubmed .

הטכנולוגיה בה משתמש המנוע ומכאן מאפייניו הייחודיים שלו כגון: טיפול בוריאציות מורפולוגיות, במילים נרדפות, טיפול בהכללה בצורה נכונה, הבנת המשמעות של המילים, טיפול נכון בשאילתות בשפה טבעית ואפשרות להזנת השאילתה באופן חופשי ללא צורך באופרטורים מיוחדים הם אחראים על פי מפתחי המנוע להבדלים.

moodיישום נוסף שמוזכר באתר של Hakia הוא MoodTRADE .- כלי להשקעות שמאפשר למשתמשיו לעקוב בזמן אמת אחרי חדשות של חברות. שלא כמו New Pubmed search יישום זה אינו חופשי.

ל- New Pubmed search

ספריות, מדיה והווב הסמנטי

BBC ACADEMY אירחה ב-28 במרץ 2012 מפגש בנושא ספריות , מדייה והווב הסמנטי שאורגן על ידי Lotico London Semantic Web Group.

סקירה מקיפה של הכנוס וקובצי וידאו של חלק מהרצאות הכנוס פורסמה ב- 2 באפריל .

במפגש זה הוצגו מגוון נושאים בהקשר של הווב הסמנטי ביניהם:

מחויבותו של ה-BBC לטכנולוגיות של הווב הסמנטי. מחויבות זו נמשכת ו- 20% מהתקציב הדיגיטלי של ה-BBC מוקצה לפעילויות שקשורות לטכנולוגיה זו.

נתונים מקושרים בספריות בארכיונים ובמוזיאונים ברחבי העולם ותכניות עתידיות, אחד הפרויקטים שצוין הוא פרויקט Historypin שמאמץ את עקרונות של הווב הסמנטי כדי לאפשר את העמקת העיון בארכיב.

פרויקטים שונים אחרים בהקשר של הווב הסמנטי כגון : rNews של New York Times והטמעת סטנדרטים חדשים לחדשות , Google Rich Snippets , hRecipe, ופרויקט Schema.org של גוגל., בהקשר זה מפיו של נציג חברת גוגל אפשר היה לשמוע על ההיסטוריה של החיפוש והנתונים המובנים במשך 100 שנה ….

 

 

ספריות ונתונים מקושרים

לאחרונה שומעים יותר ויותר על פרויקטים שתומכים בווב הסמנטי ובנתונים מקושרים. מטרת הנתונים המקושרים היא לאפשר שיתוף בין נתונים מובנים בווב באותה קלות שניתן היום לשתף מסמכים.

גם ספריות בעולם נרתמות לנושא. מספר פרויקטים לדוגמה הם פרסומה של ה- British National Bibliography כנתונים מקושרים על ידי British Library , גם Library of Congress הצהירה על כך שהנתונים המקושרים נכללים במפת הדרכים שלה . אוניברסיטת סטנפורד יצאה בהצהרה דומה.

יזמות נוספות של ספריות בתחום הנתונים המקושרים הם היוזמה הספרדית והיוזמה של Europeana הספרייה הדיגיטלית של אירופה. כמו כן גופים ייעודיים בודקים כיצד להגדיל את האינטראופרביליות של המידע המיוצר בספריות ולהגדיל את השיתוף של הספרייה בתקינה של הווב הסמנטי, וכיצד לפתח תקנים של ספרייה שתואמים את הנתונים המקושרים.

מה המשמעות של המעבר של הספריות לנתונים מקושרים ? על כך אפשר לקרוא בכתבה מעניינת שהתפרסמה לאחרונה. בכתבה נטען שהספריות עסוקות בשאלה כיצד להמיר פורמטים של MARC ל- RDF . אבל מסתבר שיש הרבה מעבר לכך. העניין מחייב שינויים בדרך בה ספרנים עובדים, מעבר מיצירת רשומות ליצירת נתונים, שימוש במערכת מזהים גלובלית, שיתוף בין ספריות ולא די בכל אלה אלא יש צורך בשינויים בתוכנות לניהול ספריות וזהו תפקידם של ספקי התוכנות ..

לכתבה

Sehrch – מנוע חיפוש סמנטי חדש

מנועי חיפוש מסורתיים הם מנועי חיפוש של מסמכים – דפים, תמונות או קובצי וידאו שמובנים לבני אדם אך לא למחשבים. מסמכים אינם מתארים זהויות באופן שמובן למכונות – מחשבים.

Sehrch לעומת זאת כולל אובייקטים. אובייקטים יכולים להיות מגוון דברים אמיתיים – אדם, עיר, אירוע . לאובייקטים יש תכונות כך למשל לאדם יש שם ותאריך לידה, למוסד יש תאריך ייסוד. לאובייקטים יש יחסי שייכות – כך למשל אדם אחד יכול להיות הורה של אדם אחר.

Sehrch  הוא מנוע חיפוש סמנטי חדש שהחיפוש בו  באובייקטים הוא חיפוש מובנה . המסמכים הרלוונטיים נדלים בעזרת יצירת תבניות שמושתתות על התכונות של האובייקטים. מאחר שחיפוש אובייקטים אינו מתאים לכל השאילתות המנוע משלב בין חיפוש אובייקטים ומסמכים על פי הצורך.

באתר יש הוראות כיצד ליצור חיפוש מובנה. ונכון להיום הוא כולל רשימה של 130342 תכונות של אובייקטים ו- 249777 סוגי אובייקטים שניתן באמצעותם לבנות שאילתות מובנות. כמו כן אפשר למצוא באתר דוגמאות לחיפוש לא מובנה, חיפוש מובנה למחצה וחיפוש מובנה על פי שדות , כך למשל החיפוש name:Justin type:Person הוא חיפוש מובנה, לעומת זאת החיפוש Justin הוא חיפוש לא מובנה והחיפוש Justin type:person הוא חיפוש מובנה למחצה.

במעט החיפושים שערכתי במנוע קיבלתי תוצאות מבטיחות , אך יש לזכור שהמנוע עדיין בגירסת אלפא וניסיון המשתמשים ומשוב מהם יסייע בפיתוחו.

 

 

Europeana ונתונים פתוחים מקושרים

לאחרונה שומעים יותר ויותר על פרויקטים שתומכים בווב הסמנטי ובנתונים מקושרים. מטרת הנתונים המקושרים היא לאפשר שיתוף בין נתונים מובנים בווב באותה קלות שניתן היום לשתף מסמכים.

פרויקט WikiData שכתבתי עליו בפוסט קודם הוא פרויקט עתידי מבטיח בתחום.
לאחרונה גם ספריות מאמצות את נושא הנתונים המקושרים. הספרייה הלאומית בצרפת, באנגליה ובגרמניה מאמצות את הרעיון, ולאחרונה שמענו גם על היוזמה הספרדית. עתה גם Europeana הספרייה הדיגיטלית של אירופה – מצטרפת ליזמות אלה.

במסגרת יוזמה זו Europeana בשלב ראשון פרסמה מידע ל- 2.4 מיליון אובייקטים במסגרת רישיון מידע פתוח – CC0 . מידע פתוח ניתן לשימוש חוזר לכול. המידע מועשר בקישורים למידע חיצוני כמו ל- GeoNames ואף הם ניתנים לשימוש חוזר.

האסטרטגיה העסקית של Europeana מאפשרת מידע פתוח לסקטור הציבורי והפרטי כאחד, באופן שהם יכולים לפתח יישומים לטלפונים חכמים ומחשבי לוח וליצור שירותי ווב ופורטלים חדשים.

יוזמה זו ותמיכתה של Europeana בנתונים פתוחים מסבירים את הסכם חילופי המידע החדש של Europeana עליו מחוייבים ספריות, מוזיאונים וארכיונים שמידע העל שלהם נמצא ב- Europeana . על הסכם זה חתומות ספריות לאומיות ומוזיאונים לאומיים מובילים. הסכם זה מייעד את מידע העל לרשות הציבור ויכנס לתוקפו ב- 1 ליולי 2012 אחרי שכל מידע העל ב- Europeana יהיה זמין כמידע פתוח.

לכתבה בנושא