חיפוש מידע רפואי בגוגל וגרף הידע

היום כאשר מחפשים בגוגל מצב רפואי מסוים מקבלים מידע אודות, סימפטומים וטיפול,  לעתים המידע מלווה גם באילוסטרציה.   המידע לקוח מגרף הידע של גוגל , היום המידע זמין למצבים רפואיים שכיחים וגוגל ממשיכה  להגדיל את כמות המצבים הרפואיים. דוגמה לערך כזה אפשר לראות בתוצאות החיפוש בדף   https://www.google.com/search?q=concussion

על פי מה שכתוב בדף העזרה של גוגל  בנושא מידע רפואי זה  הוא תוצאה של קומבינציה של אלגוריתמים ואנשי מקצוע ברפואה . בשלב ראשון האלגוריתמים של גוגל מאתרים ומנתחים מידע רפואי מאתרים איכותיים בווב. לאחר מכן צוותות של רופאים בגוגל ומ- Mayo Clinic סוקרים ובודקים בזהירות את המידע הטקסטואלי והגרפי.

יש לציין שהחיפושים נשמרים בהיסטורית החיפושים של המשתמש אם הוא במצב של כניסה לחשבון וניתנים למחיקה מההיסטוריה של המשתמש בכול עת .

העובדה ש- 1 מתוך 20 חיפושים בגוגל הוא למטרות רפואיות  וחשוב לקבל מידע מהיר ואמין עמדה אף היא מאחורי יזמה חדשה זו של גוגל.

גוגל בפוסט הרשמי שלה מ- 10 בפברואר 2015 מציינת  שמידע רפואי בסיסי זה כמובן אינו מייתר התייעצות עם רופא אך הוא מאפשר למשתמש לאתר ביתר קלות מידע נוסף ממקורות אחרים אמינים ולדעת איזה שאלות להפנות לרופא.

מידע רפואי זה שגוגל מציג הוא במסגרת המאמצים של גוגל להגיע לתשובות ישירות לשאלות בתוצאות החיפוש  ופיתוח פטנטים לצורך כך.

מנוע החיפוש Blekko נסגר

בדצמבר 2010   כתבתי פוסט על מנוע החיפוש Blekko   והטכנולוגיה הייחודית שלו לפילוח הווב תוך שימוש ב-Slashtags  שמאפשרים למשתמש למקד את החיפוש על ידי שימוש בהגבלות מסוימות בהתאם למה שמופיע אחרי ה- /

בשנים  20122013 ו- 2014 הוא נמנה על מנעי החיפוש הפופולריים יותר על פי דרוג eBizMBA

ב- 27  במרץ 2015  המנוע נסגר וטכנולוגיה מסוימת שלו נרכשה  על ידי  IBM Watson – טכנולוגיה שתוארה כמתקדמת :

Blekko brings advanced Web-crawling," categorization and intelligent filtering technology.  Its technology crawls the Web continually and  gathers information from the most highly relevant and most credible Web pages. It uses classification techniques to create thousands of "topical categories, making that data more useful and insightful

ובאופן מטפורי:

Blekko’s technologies are like oil exploration and production teams that locate the" "high-quality oil, drill, and deliver it to the refinery.

סגירת המנוע הוא הפסד למשתמשיו  . נקווה שהטכנולוגיה שלו תתרום לתחום ה- big data  כפי שצופים ב- IBM Watson .

לכתבה בנושא

הודעה IBM Watson  על הרכישה

אתר מאגרים החדש של האקדמיה ללשון העברית

אתר מאגרים מציג את מאגר הטקסטים של מפעל המילון ההיסטורי של האקדמיה  ללשון העברית.

מאגר זה כולל    טקסטים עבריים וקונקורדנציות מדעיות לספרות העתיקה ולספרות החדשה, מן התקופה שלאחר המקרא ואילך.

הטקסטים מגוונים : תעודות מדבר יהודה; כתובות וקמעות; משנה, תלמוד, מדרש ופרשנות; ספרות הגאונים; התפילה והפיוט; ספרות הקראים; ספרות מדעים ובלשנות; איגרות וספרות השו"ת; ספרות ההשכלה והתחייה.

האתר, פתוח לקהל הרחב ללא תשלום בתמיכת תכנית מורשת במשרד ראש הממשלה והוא מציע מגוון אפשרויות חיפוש ועיון. אפשר לעיין בטקסט שלם ואפשר לחפש מילה או צרוף בחתכים של תקופה , סוגה ומחבר.

לצפייה בסרטוני הדרכה על האתר והשימוש בו

לאתר מאגרים

LouisvilleLectures.org ו- FOAMED – השכלה רפואית בגישה פתוחה

הפקולטה לרפואה באוניברסיטת  Louisville   השיקה את מה שהיא מאמינה שתהיה הקהילה המקוונת בגישה פתוחה הראשונה בארה"ב להוראת הרפואה הפנימית.

LouisvilleLectures.org מספקת סדרת הרצאות ברפואה פנימית שזמינות לכול.   המרצים הם אנשי סגל מהפקולטה לרפואה של האוניברסיטה.

למעלה מ- 40 הרצאות נמצאות כבר בצורה מקוונת עם למעלה מ- 25000 צפיות מ- 100 ארצות.

הפרויקט  הוא חלק מהתנועה הבינלאומית  FOAMED –   Free Open Access Meducation – Medical education for anyone, anywhere, anytime  שמטרתה לקדם את שיתוף המידע הרפואי.

באתר של התנועה יש   קישורים  ל-  GoogleFOAM – מנוע חיפוש ייעודי שמחפש במקורות מידע של  FOAM,  וקישור ל-    FOAM Guidelines – מאגר קישורים ל- guidelines  קליניים מקוונים .

לאתר  סדרת ההרצאות ברפואה פנימית

לאתר התנועה FOAM

יתרונות פרסום מאמרים בגישה פתוחה – תוצאות מחקר

מחקר  שבדק את האימפקט  של פרסום מאמרים בגישה פתוחה פורסם ב- 12 במרץ 2015  ב- scientometrics  והוא זמין כעת חופשי  ב-  Arxiv

במסגרת המחקר נבדקו 1761 מאמרים מכתב העת האלקטרוני Nature Communications   שפורסמו בתקופה 1 בינואר 2012 עד 31 באוגוסט 2013  מתוכם 587 מאמרים בגישה פתוחה ו- 1174  מאמרים שלא בגישה פתוחה.

נתוני השימוש והציטוט של המאמרים נלקחו ישירות מהפלטפורמה של nature.com . ככל כתבי העת של Nature  ,  Nature Communication מספק נתונים סטטיסטיים על כול מאמר מחקרי והנתונים כוללים נתוני ציטוטים, נתוני צפייה ונתוני דיונים  במדיה החברתית –  altmetrics מטוויטר ופייסבוק.

ממצאי המחקר:

נמצא יתרון  של המאמרים בגישה פתוחה בכול הקשור למספר הציטוטים, מספר הצפיות במאמרים והאזכורים במדיה חברתית  כלומר היתרון הוא לא רק במספר הציטוטים אלא גם בשימוש במאגר.

יתירה מזאת לא זאת בלבד שלמאמרים בגישה פתוחה יש יתרון מבחינת מספר הורדות אלא שיתרון זה  נשמר לאורך זמן  בניגוד לתקופה קצרה של הורדות של מאמרים שלא בגישה פתוחה.

אחת ממגבלות המחקר היא שנתוני השימוש משקפים רק את השימוש בפלטפורמה של nature .com    ולא בשירותי צד שלישי כגון גוגל סקולר  (קיימת סבירות שמאמרים שנמצאים באתרי בית או ב- Arxiv נסרקו על ידי גוגל)

למאמר המלא

Tangent מנוע מתמטי ייעודי

במנועי חיפוש המסורתיים חיפוש מסמכים בהם מופיעים ביטויים מתמטיים ונוסחאות הוא לא יעיל. לאחרונה חוקרים  ב-  Rochester Institute of Technology   פתחו מנוע חיפוש מתמטי ייעודי   -Tangent      שמסוגל לעשות זאת .

.השאילתות במנוע חיפוש זה הם ביטויים מתמטיים  ומנוע החיפוש מאחזר  מסמכים בהם ניתן  למצוא ביטויים מתמטיים. אתר דמונסטרציה של המנוע נמצא בכתובת  http://saskatoon.cs.rit.edu/tangent/random

את הנוסחאות אפשר להזין בתיבת החיפוש בשפת Latex   או על ידי רישום הנוסחאות עצמן.

האינדקס של המנוע כולל הרבה אוספים ובתוכם גם Wikipedia וחלק מאוסף המאמרים במאגר החופשי arXiv . המנוע כמנועי החיפוש המסורתיים משתמש לאחסון הנתונים בקובץ מהופך אלא שהמידע המאוחסן בו שונה

פירוט נוסף על אופן פעילותו של מנוע החיפוש ומידע נוסף ניתן למצוא בכתבה המלאה

לאתר הדמונסטרציה של המנוע

מקורות מידע בתחום הביורפואי ומקצועות הבריאות

רשימה מעודכנת  (אפריל 2015)  מקיפה שמשתרעת על פני 36 עמודים של מקורת מידע בתחום הביורפואי  ומקצועות הבריאות

הרשימה מסווגת על פי קטגוריות עיקריות :

מנועי חיפוש

מדריכים נושאיים , אנציקלופדיות ומקורות נוספים

פורומים לתמיכה של מומחים

הרשימה פותחה ומתוחזקת על ידי  Marcus P. Zillman

פרסומים נוספים שלו ובהם מקורות מידע במגוון נושאים כגון: מנועי  חיפוש ומקורות אקדמיים , בלוגים ואגרגטורים, מודיעין עסקי, הרשת העמוקה, חיפוש אנשים, כלי  מחקר ועוד  זמינים באתר http://www.zillman.us/white-papers/

לרשימת המקורות בתחום הביורפואי

יישומי הנתונים המקושרים – תוצאות סקר של OCLC

OCLC     ערך סקר בינלאומי  בתאריכים 7 ביולי – 15 באוגוסט 2014   בנושא יישומי הנתונים המקושרים.  מטרת הסקר הייתה לקבל מידע על פרויקטים ספציפיים ושירותים  שיוצרים מידע על כנתונים מקושרים  ומשתמשים בו.   וזאת מטרה ללמוד ולהפיק לקחים מהניסיון של ספריות/ארכיונים/מוזיאונים .

ענו על הסקר 122 נחקרים מ- 15 ארצות . תוצאות הסקר כללו תיאורים של 76 פרויקטים /שירותים  בתחום הנתונים המקושרים – 25 מהם צרכו נתונים מקושרים, 4 פרסמו נתונים מקושרים, 47 צרכו וגם פרסמו נתונים מקושרים.

ממצאיו העיקריים של הסקר:

הסיבה  העיקרית ליישום פרויקטים בתחום הנתונים המקושרים היא להעשיר את הנתונים של  המיישמים  על ידי צריכה של נתונים מקושרים ממקורות אחרים ולספק חווית משתמש עשירה יותר.

4 המקורות לנתונים מקושרים שבהם נעשה שימוש על ידי רוב המשתמשים הם:  id.ioc.gov , DBpedia , GeoNames ,  VIAF

הסיבה העיקרית לפרסום נתונים מקושרים היא לחשוף את המידע לקהל רחב יותר בווב ולהראות מה ניתן לעשות עם הסטים של הנתונים שלהם כנתונים מקושרים.

4 הסטים הגדולים של הנתונים המקושרים  הם :  WorldCat.org  ,  WorldCat.org Works, Europeana  ,  The European Library

פירוט  והסבר על תוצאות הסקר  ניתן למצוא באתר  בנושאים הבאים:

מי עושה זאת?  כולל רשימה של משתתפי הסקר

נתונים מקושרים – דוגמאות

נתונים מקושרים – מדוע ואיזה מוסדות צורכים נתונים מקושרים

נתונים מקושרים – מדוע ואיזה מוסדות מפרסמים נתונים מקושרים

נתונים מקושרים – פרטים טכניים

נתונים מקושרים – עצות  מהמיישמים

קובץ אקסל  עם תשובות הנחקרים (להוציא מידע אישי)  זמין בכתובת  http://oc.lc/0bglX7 .  מידע נוסף  על פעילותו של OCLC        בתחום זמין בכתובת  http://www.oclc.org/research/themes/data-science/linkeddata.html

לכתבה בנושא

Agriprofiles וניצול הפוטנציאל של VIVO בתחום החקלאות

Vivo הוא יישום וובי סמנטי חופשי בקוד פתוח שמאפשר גילוי ידע מחקרי ברמת המוסד ומעבר לו. היישום פותח כבר ב- 2003  על ידי אוניברסיטת קורנל. . היישום מספק מידע מקושר באמצעות RDF     ובכך הופך את המשתתפים בו לחלק מהווב הסמנטי.

רשת VIVO      בווב היא  רשת לאומית בה משתתפים מוסדות  בעלי התקנה מקומית של VIVO    או בעלי יישומים עם יכולת  לספק מידע סמנטי . כיום חברים בה 7 מוסדות  בארה"ב  והיא פתוחה למוסדות נוספים שירצו להצטרף..

לאחרונה נעשה ניסיון לנצל את הפוטנציאל של vivo  לסקטור המחקר בתחום החקלאות . ניסיון  זה הוליד את Agriprofiles – כלי לגילוי ידע  בתחום החקלאות

למידע נוסף

נתונים מקושרים וספריות – מבחר מצגות

מטרת הנתונים המקושרים היא לאפשר שיתוף בין נתונים מובנים בווב באותה קלות שניתן היום לשתף מסמכים ולאחרונה אנו שומעים על  ספריות שנרתמות לנושא. ב- 10 בפברואר 2015  התקיים  מפגש /כינוס   בספרייה הציבורית בסאן פרנסיסקו – Library Data [R]evolution: Applying Linked Data Concepts  . המפגש התקיים   גם בחסותו  של OCLC      במסגרת סדרת הדיונים    “Collective Insight"

סדרת ההרצאות עסקה  ביישום הנתונים המקושרים בספריות.  5 מצגות וידאו מהכינוס זמינות כעת ב-YouTube. ארבע מהן זמינות גם כקובצי pdf. ההרצאות  הן:

Walk Before You Run: Prerequisites to Linked Data

BIBFRAME Update – Why, What, When

Making Library Collections Discoverable on the Web

Linked Data in the Library Workflow Ecosystem

BIBFLOW: Linked Data in the Not-So-Wild

כמה מסרים מההרצאות:

יישומי נתונים מקושרים  לא יהיו  ברי עניין אם מנועי חיפוש לא ימצאו את אתרי הספריות והמאגרים יסרקו ויבינו את מידע העל שלהם .  הגדלת נגישות האוסף בגוגל   תעשה באמצעות יישום כללים שנוגעים לאופטימיזציה של מנועי חיפוש  כולל   נוכחות הספרייה בויקיפדיה, ב-freebase, ב- wikidata , ב- google places/google my business  .  נוכחות כזו חשובה לנראות  ב- knowledge graph של גוגל.  שימוש ב- schema.org שבה תומכים מנועי חיפוש  מרכזיים גוגל , בינג יאהו וינדקס   יגדיל  אף הוא את נראות האתרים והאוספים.

עוד דובר על ה- BIBFRAME כמודל שמטרתו לספק למנועי  חיפוש תיאור באופן שניתן לניצול יעיל.

הגדלת הנראות של הספרייה בווב  קשורה גם לקטלוג  ישויות  ויישום כללי RDA

מידע נוסף במצגות ובקובצי ה- pdf

גידול דרמטי בגישה הפתוחה –31 דצמבר 2014

החל משנת 2005 מתפרסמים מדי רבעון נתונים ניתוח ופרשנות על הגידול במשאבי הגישה הפתוחה ב- The Imaginary Journal of Poetic Economics  בסדרה Dramatic Growth of Open Access .

ציוני דרך עיקריים על פי דוח 31 בדצמבר 2014:

  • במאגר  arXiv  למעלה ממיליון מסמכים
  • גידול של 89%  במספר כתבי העת החופשיים שמספרם מגיע ל- 82,363  . שיתוף הפעולה של הספריות עם  Electronic Journals Library הוסיף 38,865  כתבי עת חופשיים ב- 2014 .
  • גידול  של 53%  במספר הספרים האלקטרוניים החופשיים ב-  Directory of Open Access Books . נוספו 863   ספרים בגישה פתוחה  שמספרם הכולל מגיע ל- 2,482  ספרים. גידול של 46%  במספר המו"לים.  נוספו 25  ומספרם הכולל הוא 79

גידול ניכר נרשם גם במקורות המידע הבאים:

פריטי המידע השונים בארכיון האינטרנט, Highwire Pressמנוע החיפוש למאגרים מוסדיים  BASE,  PubMedCentral ,   DOAJ, RePECSocial Sciences Research Network (SSRN) , OpenDOAR

למידע נוסף בכתבה

לנתונים המלאים

מקורות מידע אקדמיים – רשימה מוארת

רשימה מוארת מעודכנת לפברואר 2015 של מקורות מידע אקדמיים אפשר למצוא בכתובת:

http://whitepapers.virtualprivatelibrary.net/Scholar.pdf . הרשימה ארוכה ומשתרעת על פני 68 עמודים .

מקורות המידע  כוללים; מנועי חיפוש בתוכם מנועי חיפוש מותאמים אישית, , מקורות על הרשת העמוקה, מקורות למדריכים,קורסים מקוונים, מאגרים מוסדיים, כתבי עת בגישה פתוחה, חיפוש אנשים,  תזות ועוד. ברשימת המקורות אפשר למצוא קישורים לרשימות דומות ספציפיות יותר של  אותו מחבר כגון רשימה מעודכנת  מה-2 במרץ  2015 שכוללת מקורות מידע על הרשת העמוקה ועוד.

התיאור של כול אחד ממקורות המידע ברשימה מקל על הבחירה. סיווג מקורות המידע על פי סוגי  מקורות/ כלים  יכול היה לתרום לניווט ברשימה.

לרשימת מקורות המידע