ארכיון חודשי: אפריל 2012
המידע ברשת לאן? – מנועי חיפוש, רשתות חברתיות והנייד – ביחד או לחוד?
הווב שבעיקרו מורכב מאוסף דפי html מהווה רק חלק מרשת האינטרנט. מאז שנת 2000 הווב נמצא בנסיגה וחלקיו האחרים של האינטרנט מהווים מקור למידע . אחד ממקורות המידע העולים הם יישומי המובייל. יישומים אלה שמכונים אפליקציות נייטיב הן אפליקציות סגורות שמורידים למכשירים הניידים.
השימוש בטלפונים חכמים ומחשבי לוח נמצא בעלייה ועמו גם השימוש באפליקציות. על פי תחזיות חברת המחקר גרטנר מדצמבר 2011 ,בשנת 2014 ימכרו מִילְיַארְד טלפונים חכמים – מספר כפול מתחזיות המכירה של מחשבים אישיים באותה שנה . יש לכך השלכות על השימוש באפליקציות לעומת השימוש בווב. עם גידול השימוש במכשירים ניידים גדל השימוש באפליקציות נייטיב סגורות שמספקות שירותים קלים למשתמשים על חשבון השימוש בווב הפתוח – המשתמשים משתמשים ברשת האינטרנט אך לא בווב . מספר האפליקציות היום גדול , וחוזים ששנת 2013 תהיה שנת השיא מבחינת המכירות של האפליקציות .על פי תחזיות גרטנר מדצמבר 2011 בשנת 2015 פיתוח אפליקציות ייעודיות לסמרטפונים ולמחשבי לוח יעלה על פיתוח פרויקטים למחשבים אישים ביחס של 4 ל- 1.
במקביל לגידול בשימוש בטלפונים ניידים אנו עדים לשימוש הולך וגובר ברשתות חברתיות שאף הן סגורות למחצה. על פי גרטנר עד 2014 יחליפו הרשתות החברתיות את שירותי הדוא"ל ככלי העיקרי למטרות תקשורת בין-אישית עבור 20% מהמשתמשים העסקיים
כל זה מוביל לכאורה למצב של נסיגה בווב הפתוח לטובת מערכות סגורות או סגורות למחצה ולכך יכולות להיות השלכות שליליות על מנועי חיפוש ומעמדם בווב על כל ההשלכות שיש לכך לגבי המידע למשתמש. מעמדם של מנועי החיפוש תלוי במעמדו של הווב שכן עיקר הטכנולוגיה שלהם מתבססת על הזחלנים שסורקים את הווב הפתוח שרובו כולל דפי html.
לאור מצב זה והמפנה החשוב בעולם הדיגיטלי מווב פתוח לפלטפורמות סגורות שמשתמשות ברשת האינטרנט לתעבורה אך לא בדפדפן לתצוגה אין פלא שכתבת שער ב- Wired magazine in 2010 בשם "The Web Is Dead. Long Live the Internet" חוזה נסיגה במעמדו של הווב .
אזהרה דומה נשמעה מפיו של ממציא הווב עצמו Tim Berners-Lee בגיליון דצמבר 2010 של Scientific American :
, “The Web as we know it is being threatened,” adding that it “could be broken into fragmented islands.”2
מאז נושא זה שנוי במחלוקת ומעורר ויכוחים ודיונים על מעמדו של הווב ברשת האינטרנט וההשלכות לגבי מנועי חיפוש., והיום מומחים רבים סבורים שהיתרונות של הווב רק גדלים.
פיתוח המובייל ווב (לעומת יישומי המובייל) הוא צעד בכיוון חיזוק מעמדו של הווב , ו-HTML5 CSS3 הם אמצעים לכך וגם פתרון לבעיות נגישות אחרות של מנועי חיפוש למידע ….הנראות של המידע מרשתות חברתיות למשתמש גדלה אף היא עם שילוב מידע מרשתות חברתיות במנועי חיפוש.
לצד מגמה זו של שילוב ותעבורה בין האיים השונים בווב אנו עדים היום גם למספר מגמות חיוביות נוספות מבחינת המידע בווב והמשתמש – תנועת הגישה הפתוחה נמצאת בעלייה מתמשכת , רשתות חברתיות מאפשרות את שיתוף המידע כולל מידע אקדמי ברשתות חברתיות אקדמיות, וחזון הנתונים המקושרים הולך וקורם גידים – כל אלה יהפכו את המידע לא רק לפתוח יותר אלא גם לחופשי, משותף ומקושר יותר ואין ספק – המשתמש הוא הנשכר העיקרי.
ליום העיון "המידע ברשת לאן? הנייד, רשתות חברתיות ומנועי חיפוש – לחוד או יחדיו" שיתקיים בכנס טלדן מידע 2012. ביום העיון ידון נושא זה עם דגש על המידע וטיפים למשתמש.
New Pubmed search – השילוב בין Pubmed ו- Hakia
בזמנו כתבתי בבלוג על מנוע החיפוש הסמנטי Hakia. Hakia משתמש בשיטה המיוחדת לו לאחסון וניתוח סמנטי של מסמכים אלו לצורך אחזורם.
מנוע החיפוש HAKIA מחפש בסגמנטים שונים: ווב, חדשות, בלוגים וידאו תמונות ועוד . בחלק מהסגמנטים הוא משתמש בשיטה שנקראת QDEX – Query Detection and Extraction ואשר מחליפה את השיטה המקובלת ליצירת אינדקס. על פי השיטה המקובלת ליצירת אינדקס שמכונה קובץ מהופך –inverted file – האינדקס כולל את המונחים המופיעים בטקסט, ומצביעים אל מונחים אלה מהווים בתהליך אחזור המידע שערי גישה למסמכים. אם נשתמש בשיטת הקובץ המהופך גם להוספת קשרים סמנטיים ייווצר מבנה שיכביד מאוד על הביצועים. בשיטה החדשה של מנוע החיפוש Hakia, לעומת זאת, שערי הגישה לדפי ה-Web אינם מצביעים למלים אלא לשאילתות. המנוע מנתח באמצעות אלגוריתם מתוחכם את כל השאילתות האפשריות בדפי ה- Web והשאילתות מהוות שערי גישה לדפי ה- Web. באופן זה בעת אחזור המידע המנוע עובד על סטים קטנים יחסית של דפי Web ורק עליהם הוא מבצע את הניתוח הסמנטי. בכך נפתרת בעיית המשאבים הרבים שנדרשים לביצוע ניתוח סמנטי על מספר רב של דפים. על פי התיעוד באתר ביצוע הניתוח הסמנטי ודירוג התוצאות מתבצע באמצעות אלגוריתם מתוחכם SemanticRank שעושה שימוש גם באונטולוגיות.
טכנולוגיה סמנטית זו מיושמת על מאגר המידע הביורפואי Pubmed הולידה את מנוע החיפוש New Pubmed search. מנוע זה הוא מנוע חיפוש חופשי וכפי שנכתב באתר מחפש בלמעלה מ- 20 מיליון תקצירים של המאגר הרפואי PUBMED ובזכות הטכנולוגיות הסמנטיות בהן הוא משתמש אפשר לקבל תשובות רלוונטיות יותר לשאילתות שמבקשות לתת מענה על קשרים בין משתנים שונים. דוגמאות אפשר למצוא באתר.
בדוגמאות אלו אפשר לקבל גם את התוצאות במנוע זה בהשוואה לאותן שאילתות ב- Pubmed .
הטכנולוגיה בה משתמש המנוע ומכאן מאפייניו הייחודיים שלו כגון: טיפול בוריאציות מורפולוגיות, במילים נרדפות, טיפול בהכללה בצורה נכונה, הבנת המשמעות של המילים, טיפול נכון בשאילתות בשפה טבעית ואפשרות להזנת השאילתה באופן חופשי ללא צורך באופרטורים מיוחדים הם אחראים על פי מפתחי המנוע להבדלים.
יישום נוסף שמוזכר באתר של Hakia הוא MoodTRADE .- כלי להשקעות שמאפשר למשתמשיו לעקוב בזמן אמת אחרי חדשות של חברות. שלא כמו New Pubmed search יישום זה אינו חופשי.
Knol – המערכת עוברת ל- Annotum
בזמנו כתבתי על knol – יישום של גוגל עליו הצהירה ב- 23 ביולי 2008 שהוא פתוח לכול. המטרה של פיתוח כלי כזה היה לעודד אנשים שמכירים נושא מסוים לכתוב מאמר סמכותי בנושא, ובאופן זה יתרמו מהידע שלהם לכלל קהיליית האינטרנט. כל מאמר כזה נקרא אף הוא כשם הפרויקט בשם Knol.
בתחילת מאי 2012 היישום עומד להפסיק את שירותיו, אך הכותבים יוכלו להמשיך לחבר ולפרסם מאמרים ב- Annotum – פלטפורמה מבוססת wordpress שתומכת בעריכה ובפרסום מדעי , אליה גם ניתן יהיה לייבא את המאמרים מ- knol , כפי שנכתב באתר:
" Knol יופסק כשירות, אך עבדנו יחד עם Solvitor ועם Crowd Favorite כדי ליצור את Annotum, פלטפורמת מקור פתוח, המבוססת על WordPress ומאפשרת לך להמשיך לחבר ולפרסם מאמרים אקדמיים. תוכל להעביר את ה-Knols שלך ל-WordPress ולהמשיך בעבודתך עם Annotum. לאחר ה-1 במאי, לא תוכל יותר ליצור, להציג, להזין או לערוך Knols אך תוכל לייצא את ה Knols שלך לאתר WordPress.com ולהוריד אותם לקובץ עד ה-1 באוקטובר, 2012."
ל- knol
ל-Annotum
DOAB – מדריך לספרים אקדמיים בגישה פתוחה
DOAB – היא פלטפורמה חדשה שהושקה ב- 12 באפריל 2012 ושמה לה למטרה לרכז ספרים בגישה פתוחה כדי להגדיל את הנראות שלהם.
מדריך זה הוא שירות של קרן OAPEN – יוזמה בינלאומית להוצאה לאור של מונוגרפיות בגישה פתוחה שמקום מושבה בספרייה הלאומית בהאג.
מו"לים אקדמיים מוזמנים לספק את מידע העל של הספרים שלהם בגישה פתוחה ל- DOAB . לצורך זה , מדריך זה יהיה פתוח לכל המו"לים שמוציאים לאור ספרים שפיטים שעונים על סטנדרטים אקדמיים בגישה פתוחה. אגרגטורים יוכלו לשלב את הרשומות בשירותים המסחריים שלהם. DOAB תומך בפרוטוקול OAI-PMH. ספקי השירות וספריות יכולים להשתמש בפרוטוקול כדי לאסוף מידע על מ- DOAB ולכלול אותו באוספים ובקטלוגים שלהם.
DOAB מאפשר חיפוש באינדקס של מידע על על הספרים וקישורים לטקסט המלא של הספרים באתרי המו"לים או במאגרים המוסדיים/נושאיים.
כיום עם השקת הפרויקט משתתפים ב- DOAB עשרים מו"לים עם 750 ספרים בגישה פתוחה וכבר בימים הקרובים יצטרפו מו"לים נוספים. למו"לים המעוניינים להצטרף יש מידע באתר .
אפשר לחפש וגם לדפדף באתר. החיפוש כולל חיפוש בסיסי ומתקדם עם אופציות להגבלת החיפוש על פי מספר שדות כולל שנה, כותר מחבר תקציר ומו"ל.
הדפדוף אפשרי על פי כותר, נושא ומו"ל.
סרגיי ברין המייסד של גוגל בראיון על הסכנות האורבות לווב
בראיון ל-The Guardian סרגיי ברין מייסדה של גוגל מדבר על הסכנות האורבות לווב והמתקפות על רשת האינטרנט הפתוחה.
מנועי חיפוש מסתמכים בעיקר על טכנולוגיות של סריקת הווב הפתוח ומנוע החיפוש של גוגל נוסד באווירה של פתיחות זו.
היום כמה גורמים מהווים מתקפה על הווב הפתוח: צמיחתם של יישומים סגורים כמו פייסבוק, ואפליקציות סגורות של אפל שהמידע בשניהם חסום בפני בשרתים של גוגל.
גורם נוסף שפוגע בפתיחות המידע הוא הצנזורה של ממשלות מסוימות כגון סין ואירן על המידע וגם היבטים שונים שקשורים לתחיקה בארה"ב כמו SOPA ו-PIPA מהווים "ירייה עצמית ברגל".
גורלם של מנועי החיפוש כולל גוגל נקשר באופן טבעי לגורלו של הווב הפתוח וגוגל בנסיונה לחלץ עצמה מן המשוואה אינה עוד רק חברה לחיפוש וסריקה של מידע בווב .
גידול דרמטי במשאבי הגישה הפתוחה – דוח מ- 31 במרץ 2012
החל משנת 2005 מתפרסמים כל שנה מדי רבעון ( מרץ, יוני, ספטמבר ודצמבר) נתונים, ניתוח ופרשנות על הגידול במשאבי הגישה הפתוחה ב- The Imaginary Journal of Poetic Economics בסדרה Dramatic Growth of Open Access Series
על פי נתוני 31 במרץ 2012 :
כתבי עת:
ב- DOAJ יש 7607 כתבי עת ומדי יום מתווספים 2.6 כתבי עת חדשים.
ב- Electronic Journals Library שכוללת כתבי עת בגישה פתוחה ולא בהכרח שפיטים יש 33984 כתבי עת , קצב הגידול ברבעון זה הוא 18 כותרים ביום
ארכיבים, מאגרים מוסדיים ונושאיים:
ב- OpenDOAR יש 2,186 מאגרי מידע מוסדיים
BASE מחפש ב-34 מיליון מסמכים במאגרי מידע מוסדיים
ב- Social Sciences Research Network קרוב ל- 400000 ניירות עבודה .
חל גידול ניכר גם בחומרים השונים החופשיים ב- Internet Archive – . הארכיון כולל למעלה מ- 600000 moving images, 1.2 מיליון קבצי אודיו ו- 3.3 מיליון חומרים טקסטואליים.
ספריות, מדיה והווב הסמנטי
BBC ACADEMY אירחה ב-28 במרץ 2012 מפגש בנושא ספריות , מדייה והווב הסמנטי שאורגן על ידי Lotico London Semantic Web Group.
סקירה מקיפה של הכנוס וקובצי וידאו של חלק מהרצאות הכנוס פורסמה ב- 2 באפריל .
במפגש זה הוצגו מגוון נושאים בהקשר של הווב הסמנטי ביניהם:
מחויבותו של ה-BBC לטכנולוגיות של הווב הסמנטי. מחויבות זו נמשכת ו- 20% מהתקציב הדיגיטלי של ה-BBC מוקצה לפעילויות שקשורות לטכנולוגיה זו.
נתונים מקושרים בספריות בארכיונים ובמוזיאונים ברחבי העולם ותכניות עתידיות, אחד הפרויקטים שצוין הוא פרויקט Historypin שמאמץ את עקרונות של הווב הסמנטי כדי לאפשר את העמקת העיון בארכיב.
פרויקטים שונים אחרים בהקשר של הווב הסמנטי כגון : rNews של New York Times והטמעת סטנדרטים חדשים לחדשות , Google Rich Snippets , hRecipe, ופרויקט Schema.org של גוגל., בהקשר זה מפיו של נציג חברת גוגל אפשר היה לשמוע על ההיסטוריה של החיפוש והנתונים המובנים במשך 100 שנה ….
הטכנולוגיה בספריות היא ההשקעה הטכנולוגית האפקטיבית ביותר
2 סקרים שנערכו על ידי Inside Higher Ed מצאו שנושאי משרות בכירות באקדמיה והעומדים בראשי המכללות והאוניברסיטאות שניהם כאחד – רואים בהשקעה הטכנולוגית בספריות את ההשקעה הטכנולוגית האפקטיבית ביותר.
סקר אחד –Presidential Perspectives – נערך בינואר ופברואר 2011 בקרב נשיאי וראשי 3100 מכללות ואוניברסיטאות בארה"ב. מתוכם 956 ענו על שאלון הסקר. מטרתו של הסקר הייתה לזהות אתגרים ונושאי מפתח שעומדים בפני המוסד שלהם בשנתיים שלוש הקרובות בניסיון להתמודד עם מצוקות כלכליות ולהיחלץ מהן.
השאלות בסקר כיסו 8 קטגוריות אחת מהן הייתה – כיצד תעריך את יעילות השקעות המוסד בטכנולוגית מידע . ראשי האוניברסיטאות דרגו את היעילות של ההשקעה בטכנולוגיות הספרייה ב- 51%, אך עדיין ההשקעה בשירותי הספרייה ומשאביה היו הקטגוריה היחידה שרוב הנשיאים דרגו אותה כיעילה ביותר.
הסקר השני של בכירים באקדמיה –Chief Academic Officers – נערך בדצמבר 2011 בקרב 2542 מכללות ואוניברסיטאות בארה"ב . 1081 ענו על שאלון הסקר . כמו בסקר של נשיאי האוניברסיטאות אחת הקטגוריות שכוסו בשאלון הסקר הייתה הערכת ההשקעה בטכנולוגיות מידע במוסד.
בסקר זה היעילות של השקעת המוסד בטכנולוגיות הספרייה דורגה במקום גבוה יותר 58.8% – אחוז הגבוה ביותר מבין הדרוגים להן זכו השקעות בטכנולוגיות אחרות כגון הוראה והוראה מקוונת.
כתבה בנושא התפרסמה ב-17 במרץ 2012 ב- library journal . פרטים מלאים אפשר למצוא בטקסט המלא של 2 הסקרים – סקר ראשי האוניברסיטאות וסקר בכירים באקדמיה.
Research and Markets – דו"ח הספריות האקדמיות – מהדורה 2012- 2013
סקר הספריות האקדמיות מהדורה 2012 2013 של Research and Markets התפרסם. הדו"ח כולל נתונים מ- 110 ספריות אקדמיות בארה"ב במגוון נושאים: שימוש בספרים אלקטרוניים וקוראים אלקטרוניים, פיתוח מקורות אור קוליים , דיגיטציה של אוספים מיוחדים, השתתפות בכנסים והדרכה לספרנים, עמדות ביחס לגישה פתוחה, מאגרי מידע, כתבי עת, שימוש במחשוב עננים ועוד
הדוח מסייע לספרנים לעקוב אחרי מגמות שקשורות לאיוש וסגל הספרייה, שכר, ורכש , שיווק , הדרכה ועוד
נתונים בולטים מהדוח :
ספריות של מכללות שמספר המשתמשים שלהן קטן מ- 1000 סטודנטים מוציאות בממוצע 24298 דולר על מידע מקוון.
בשנה החולפת ספריות במדגם הוציאו בממוצע 8142 דולר על רכש של ספרי לימוד textbooks
25% מהספריות במדגם רכשו קוראים אלקטרוניים, מחשבי לוח ומכשירים נוספים לקריאת ספרים אלקטרוניים
בשנת 2012-2013 ספריות במדגם צופות גידול ממוצע של 1.62% ברכש חומרים שונים
בשנים הבאות 68.75% מהספריות במדגם צופות שהקצאת משאבים לספריות תשמור על הקצב של שאר המחלקות במכללה.
הדוח המלא הוא לא חינמי אבל בתקציר/תיאור אפשר למצוא יותר פרטים. כמו כן אפשר לראות את התוכן של הדוח ורשימה מפורטת של הטבלאות בו ולהוריד חינם 8 עמודים מהדוח ובהם טבלאות נתונים על הוצאות הספריות
zuula ו- Silobreaker – מנועים שכדאי לזכור
לעתים נרצה לקבל תוצאות מכמה מנועי חיפוש מבלי ל"טייל" בין האתרים השונים. במקרה כזה כדאי לזכור את zuula – רב מנוע שמחפש במספר רב של מנועי חיפוש ומציג ממסך אחד את תוצאות החיפוש מכול אחד ממנועי החיפוש על פי בחירת המשתמש. מנועי החיפוש בהם מחפש המנוע הם:
Google, Bing, Yahoo, Gigablast, Exalead, Alexa, Entireweb, Mahalo, Mojeek
מבחינת חומרים אפשר מראש להגביל את תוצאות החיפוש לאתרי ווב, תמונות, וידאו, חדשות בלוגים וגם לסנן את תוצאות החיפוש על פי מנוע מסוים.
מנוע שימושי חופשי נוסף לחדשות ומקורות מידע חברתיים הוא Silobreaker.com . אפשר להגביל את החיפוש לחדשות, דוחות, הודעות חדשותיות, בלוגים, וידאו ו- fact sheets