יריד הספרים הדיגיטלי העולמי מציע ספרים אלקטרוניים חינם

יריד הספרים הדיגיטלי העולמי הוא פרויקט שבמסגרתו מוצעים ספרים חינם לציבור, החל מ- 4 ביולי ועד 4 באוגוסט מדי שנה בשנים 2006-2009. רוב הספרים ביריד מוצעים חינם, חלק קטן מהספרים מוצע לרכישה בהנחה.
היריד נערך בחסותו של פרויקט גוטנברג, שחוגג השנה 35 שנים לקיומו, ונוטלים בו חלק גורמים נוספים שמציעים ספרים אלקטרוניים לציבור הרחב כמו:
World Public Library
Internet Archive
eBooks About Everything
ו- International Music Library Project

השנה מוצעים לציבור הרחב למעלה ממיליון ספרים ב-100 שפות. הספרים המוצעים להורדה לציבור הם בפורמטים שונים: קבצי טקסט וקבצי PDF , קבצי MP3 וספרים להורדה לטלפונים סלולרים.

בכתבתה של Paula. J. Hack ב- NewsLink בנושא, מאוזכרים אתרים נוספים של ספרים אלקטרוניים, חלקם בחינם, שכדאי להכיר כמו:
Google Book Search
The Online Books Page -University of Pennsylvania
Free-eBooks.net
LibriVox: free audiobooks
The Internet Classic Archive
Digital Book Index

אל אתר יריד הספרים
לכתבה מתוך NewsLink

Hakia – מנוע חיפוש סמנטי מסוג אחר, והשימוש בשירות BOSS של Yahoo

מנוע החיפוש Hakia מוגדר על ידי מפתחיו כמנוע סמנטי כללי ששם לו למטרה לאחזר תוצאות איכותיות באמצעות טכנולוגיה סמנטית. תוצאות איכותיות על פי התיעוד באתר עונות על הקריטריונים הבאים:
• מקורות מהימנים סמכותיים מומלצים על ידי ספרנים
• כוללים מידע מעודכן
• ורלוונטיים לשאילתה
תוצאות רלוונטיות כאלה משתדל המנוע להשיג באמצעות טכנולוגיה סמנטית כלומר טכנולוגיה שמאפשרת הבנה סמנטית של דפי ה-Web. 

בפוסט קודם, בהסתמך על כתבה מ-Themarker מ- 15.5.2008, תיארתי מנוע סמנטי אחר – Powerset אשר בניגוד למנועי החיפוש המסורתיים שמתייחסים אל דפי ה-Web כאסופת מלים, מנוע חיפוש זה מייצר ייצוג סמנטי של הדף על ידי ניתוח כל משפט המופיע בו, והבנת המשמעות שלו. באופן זה המנוע יכול לתת בתוצאות החיפוש אוסף של עובדות הקשורות לשאילתה, לתמצת את המידע, ולספק תשובות ישירות לשאלות עובדתיות. אלא שעל פי דברי האנליסט גרג סטרלינג מחברת Sterling Market Intelligence “אין ספק שיש כאן פוטנציאל, אבל ליישם את מה ש Powerset עשתה על הרשת כולה הוא אתגר עצום שיצריך זמן רב ומשאבים עצומים”. ואכן Powerset הצטמצם בחיפושים בוויקיפדיה. 

Hakia שקדם ל-Powerset מבחינה כרונולוגית, אימץ לו טכנולוגיה מיוחדת שבאה להתמודד עם בעיה זו. הוא מצא לו דרך חדשה לאחסון דפי Web לצורך אחזורם – שנקראת QDEX – Query Detection and Extraction. שיטה חדשה זו מחליפה את השיטה המקובלת ליצירת אינדקס. על פי השיטה המקובלת ליצירת אינדקס שמכונה קובץ מהופך –inverted file – האינדקס כולל את המונחים המופיעים בטקסט, ומצביעים אל מונחים אלה מהווים בתהליך אחזור המידע שערי גישה למסמכים. אם נשתמש בשיטת הקובץ המהופך גם להוספת קשרים סמנטיים ייווצר מבנה שיכביד מאוד על הביצועים. בשיטה החדשה של מנוע החיפוש Hakia, לעומת זאת, שערי הגישה לדפי ה-Web אינם מצביעים למלים אלא לשאילתות. המנוע מנתח באמצעות אלגוריתם מתוחכם את כל השאילתות האפשריות בדפי ה- Web והשאילתות מהוות שערי גישה לדפי ה- Web. באופן זה בעת אחזור המידע המנוע עובד על סטים קטנים יחסית של דפי Web ורק עליהם הוא מבצע את הניתוח הסמנטי. בכך נפתרת בעיית המשאבים הרבים שנדרשים לביצוע ניתוח סמנטי על מספר רב של דפים. על פי התיעוד באתר ביצוע הניתוח הסמנטי ודרוג התוצאות מתבצע באמצעות אלגוריתם מתוחכם שעושה שימוש גם באונטולוגיות.

ב-10 ביולי 2008 צוות מנוע החיפוש Hakia הודיע שהוא ישתמש בשירות החיפוש החדש שמציעה Boss – Yahoo. שירות חדש זה של Yahoo מאפשר למפתחים להשתמש בתוצאות החיפוש של Yahoo, לשלבם עם נתונים ממקורות אחרים, לדרג אותם מחדש ולהציגם באופן שונה. צוות Hakia מתכוון באמצעות השימוש בשירות זה של Yahoo להשתמש בתוצאות החיפוש של Yahoo ולהפעיל עליהם את הטכנולוגיה שלו לאחר סינון התוצאות. שיתוף פעולה זה אמור לשפר את המערכת כי הוא למעשה מאפשר ל-Hakia שימוש במאגר ובתשתיות של Yahoo. 
שיתוף פעולה זה הוא במסגרת הפתיחות של מנועי החיפוש הגדולים לחידושים. גם רכישת Powerset על ידי Microsoft היא במסגרת מגמה זו שיש לברך עליה. 

מנוע החיפוש Hakia נמצא עדיין בשלב ביתא. אשר לביצועיו – מבדיקת המנוע היום עולה שהמנוע תומך גם בעברית והתוצאות לשאילתות שבדקתי היו בדרך כלל טובות, ובד"כ הכותר בראש כל תוצאה היה אינפורמטיבי כך שהיה קל לדעת במה היא עוסקת. למונחים שגויים בשאילתה באנגלית המנוע מציע הצעות למונח הנכון. כדאי לנסות. .

אל אתר מנוע החיפוש
להודעה של צוות Hakia על השימוש בשירות BOSS של Yahoo

מדיוני הכנס השנתי 2008 של ALA – עתיד הספריות, Open Access ועוד

הכנס השנתי של  American Library Association נערך השנה באנהיים, קליפורניה בימים  26.6 – 2.7 בנוכחות למעלה מ-20,000 משתתפים. בכנס נידונו נושאים אקטואליים ובעיות שעימן מתמודדות הספריות.

בנושא ה-Open Access נסקרו מאמציה ותלאותיה של אוניברסיטת קליפורניה ליישום מדיניות Open Access מאז 2004. במסגרת מאמצים אלו הוקמה וועדת סנט ייעודית לקידום הנושא, גובשה מדיניות שלא זכתה לתמיכה ב-2007, וכיום הסגל האקדמי, ספרנים ואנשי אדמיניסטרציה שוקדים על גיבוש גרסת מדיניות חדשה, בהשראת הניסיון שהצליח באוניברסיטת הרווארד. הומלץ לקחת בחשבון את הצרכים המיוחדים והייחודיים של הדיסציפלינות השונות ולשקול ערוצים נוספים שקשורים במו"לים, ספרי לימוד וקורסים פתוחים.
הייתה התייחסות בדיונים לאוניברסיטת הרווארד – שם הניסיון הצליח, החלוצה הייתה הפקולטה לאומנויות ומדעים, הפקולטה למשפטים הלכה בעקבותיה, ובית הספר לרפואה כנראה הוא הבא בתור. המפתח להצלחה הוא שמדיניות ה-Open Access תתפרש כאינטרס של אנשי הסגל.

מעניין במיוחד היה המושב שעסק בעתיד הספריות. הועלו הצעות שונות להתמודדות הספריות עם המציאות החדשה. נאמר שהספרייה צריכה להפוך מ"חנות מכולת" ל"מטבח" כלומר על הספרייה להפוך ממקום שבו ניתן למצוא חומר למקום שבו ניתן ליצור חומר.
הודגש הצורך בשיתוף פעולה בין הספריות כמו הקמת מאגר מידע משותף לשאלות יעץ, התמודדות משותפת עם המצב והקמת wiki משותף לכל התוכניות והרעיונות כדי שלא יצטרכו להמציא את הגלגל מחדש, הקצאת דומיין מיוחד – a.lib משותף לכל הספריות ושיתוף פעולה של הספריות בתחום התשתיות. כמו כן דובר על הצורך להבין יותר את צורכי משתמשי העתיד ולהתאים את שירותי הספרייה בהתאם, ולגלות פתיחות לאנשי מקצוע אחרים ולמשתמשי הספרייה.

בכנס נידונו גם נושאים נוספים כמו תפקידם המכריע של הספריות בשמירת הפרטיות של המשתמשים, גמישות בשימוש בתקציבים שנועדו לתמוך בספריות והפנית משאבים גם להדרכה ולשיווק ולא להתמקד רק בטכנולוגיה ועוד…

הדיונים בנושא Open Access
המושב בדבר עתיד הספריות
תפקיד הספריות בשמירת הפרטיות
דרישת הספריות לגמישות בהקצאת משאבים
סיקור כללי של הכנס, לפני הכנס, בזמן הכנס  ואחריו 

Amit Singhal על הפילוסופיה מאחורי שיטת דרוג תוצאות החיפוש של גוגל

Amit Singhal העומד בראש הצוות שעוסק בפתוח שיטת דרוג התוצאות בגוגל, כתב בתאריך 9.7.2008 פוסט בנושא, ובו שם את הדגש על ההיבט הפילוסופי של השיטה.
שיטת דרוג התוצאות בגוגל מורכבת מאוסף של אלגוריתמים שמטרתם למצוא את החומר הרלוונטי ביותר לשאילתה מסוימת. האלגוריתמים בהם נעשה שימוש בחיפוש הרגיל בגוגל מיושמים בשינויים קלים גם בשירותים אחרים של Google כמו תמונות, חדשות, מפות, ספרים ועוד.
שלושה עקרונות עיקריים עומדים מאחורי שיטת הדירוג:
1. שאיפה לרלוונטיות של תוצאות בכל ארץ ובכל שפה
2. פשטות
3. העדר התערבות ידנית

אשר לעיקרון הראשון – השאיפה היא שכל משתמש בכל שפה ובכל ארץ יקבל את התוצאות הרלוונטיות ביותר, מה שמכונה לעתים "no query left behind". כל שאילתה שמניבה תוצאות לא רלוונטיות מדרבנת את הצוות להכניס שיפורים עתידיים.

אשר לעיקרון השני – גוגל משתדלת לשמור על פשטות מבלי להתפשר על איכות התוצאות. פשטות זו מאפשרת למהנדסי התוכנה של גוגל להבין בדיוק מדוע דף מסוים דורג באופן בו הוא דורג בתשובה לשאילתה מסוימת, והבנה זו מאפשרת את שיפור המערכת. במסגרת מאמץ מתמשך זה נעשים מדי שבוע כעשרה שינויים בתחום דרוג התוצאות.

אשר לעיקרון השלישי – גוגל דבקה בעיקרון של אי התערבות ידנית בדרוג התוצאות משתי סיבות:
א. גוגל מאמינה שה-Web נוצר על ידי אנשים שיוצרים דפים וקישורים לדפים. גוגל משתמשת בתרומה אנושית זו של קהיליית האינטרנט באלגוריתמים שלה ואינה מתערבת ידנית בדרוג התוצאות, שכן כל התערבות תהיה סובייקטיבית. גוגל מאמינה שהידע של קהיליית האינטרנט שבא לידי ביטוי בדפי ה-Web והקישורים שבהם טובה מכל החלטה והתערבות סובייקטיבית.
ב. לעתים בעיה בתוצאות שאילתה מסוימת כרוכה בבעיה כללית, ופתרונה על ידי שיפור האלגוריתמים תפתור לא רק את הבעיה בשאילתה מסוימת זו, אלא גם בעיות אפשריות בשאילתות אחרות ולעתים בכל השפות.
יחד עם זאת יש לזכור שלגוגל מדיניות כתובה בכל הקשור לאיכות אתרים והיא באה לידי ביטוי בתוצאות החיפוש.

לכתבה המקורית

המאמרים המצוטטים ביותר בתחומי דעת שונים ומדוע?

 TopCited הוא שירות חדש של Scopus אשר מציג את 20 המאמרים המצוטטים בשנים האחרונות ב-26 תחומי דעת שונים. במנשק החיפוש שתי תיבות חיפוש בצורת רשימות גלילה – מהן ניתן לבחור את תחום הדעת הרצוי, ואת טווח השנים הרצוי – 2004-2008, 2005-2008, 2006-2008. בתוצאות החיפוש בנוסף לפרטים הביבליוגרפיים של המאמרים (כולל תקציר) מוצגת גם מפה גיאורפית של הפרסומים על פי המוסד של המחבר הראשון שלהם. אפשר גם להתעדכן באמצעות RSS .
המידע המוצג ב-TopCited מתבסס על מאגר המידע Scopus והוא חופשי לכל. מעניין לדעת מהו סוד ההצלחה של המאמרים המצוטטים ביותר. את ההסבר להצלחה מפי ארבעה מחברים מתחומי דעת שונים, שמאמריהם נכללו ב- TopCited, אפשר לקרוא בכתבה שפורסמה בעלון Research Trends. מהדברים עולה שמאפיינים כמו חדשנות, שימושיות וייחודיות מהווים סוד להצלחה.

אל האתר
לכתבה הכוללת את דעתם של ארבעה מחברים על סוד ההצלחה

Open Library – קטלוג חופשי פתוח לציבור, בחלקו בטקסט מלא, בעל מנשק וויקי

 Open Library הוא פרויקט שלא למטרות רווח של ארכיון האינטרנט, שממומן בחלקו על ידי ספריית קליפורניה. הפרויקט שם לו למטרה לקטלג את כל הספרים שאי פעם יצאו לאור – בין אם הם print או out of print, קבצי טקסט או קבצים סרוקים. בכך שונה הוא מפרויקט גוטנברג שכולל טקסטים של ספרים אשר זכויות היוצרים שלהם פקעו. כיום המאגר כולל 13,439,320 ספרים, מהם 234,857 בטקסט מלא. הספרים בטקסט מלא הם ספרים ששייכים לרשות הכלל (public domain) כלומר אינם כבולים בזכויות יוצרים.

שדות החיפוש האפשריים בחיפוש המתקדם הם: כותר, מחבר, נושא, ISBN, מ"ול, ותיאור, עם אפשרות להגביל את החיפוש לטווח מסוים של תאריכים ולספרים סרוקים בלבד. במנשק תוצאות החיפוש ניתן לקבל את כל הפרטים הביבליוגרפיים של כל אחד מהספרים, בד"כ גם תוכן עניינים ותצלום של הכריכה של הספר, גישה לטקסט המלא אם הוא קיים וקישורים למקורות מהם ניתן לרכוש את הספר או להשאילו. אם הספר קיים בטקסט מלא ניתן לחפש בתוך הטקסט המלא של הספר. ניתן לעדן את החיפוש על פי פילטרים שונים: גרסאות טקסט מלא (אם קיימות), מחברים, נושאים, מהדורות ומו"לים.
לדוגמה כאשר חיפשתי "Canterbury tales" קבלתי 757 ספרים, מתוכם 68 ספרים בטקסט מלא. המהדורות של הספרים נעו בטווח תאריכים מלפני 1920 ועד 1999 והם היו מ- 5 מו"לים שונים. יכולתי לעדן את השאילתה על פי הפילטרים שנמנו לעיל. צמצמתי את החיפוש לטקסט מלא. בחרתי באחת המהדורות בטקסט מלא (1860) וקבלתי את הטקסט המלא הסרוק של הספר. ניתן לדפדף בספר עמוד אחר עמוד, לקפוץ לעמוד מסוים או לתחילתו ולסופו של הספר. ניתן גם לחפש בתוך הספר, להוריד אותו ולהדפיסו.  

המנשק הוא מנשק וויקי והציבור הרחב, ספריות, אנשי מקצוע, מו"לים ומתכנתים נקראים לתרום. יש באתר מידע רב על הפרויקט – מידע כללי, הייחודיות של הפרויקט בהשוואה לפרויקטים דומים ושיטות המיון בהם נעשה שימושהטכנולוגיה בה השתמשו, מידע שקשור להיבט  הספרני של הנושא, מידע על הגופים המשתתפים בפרויקט כולל ספריות ומו"לים  והאופן בו ניתן לתרום.
בשל אופיו של הפרויקט שפתוח לציבור הרחב, מקווים מפתחיו שהוא יעודד את השימוש בספרים ובספריות, ותרומתן של הספריות לפרויקט חיונית.

לאתר הקטלוג 

WikiSlice – מנוע ייעודי לחיפוש בוויקיפדיה

WikiSlice מאפשר חיפוש יעיל בוויקיפדיה האנגלית. הוא מאפשר יצירת אשכולות נושאיים. כאשר נחפש נושא מסוים נקבל את כל הדפים בוויקיפדיה הקשורים לאותו נושא. בסרגל צדדי מוצגים כל תתי הנושאים הקשורים לנושא. ניתן לחפש באותם דפים שמהווים נתח נושאי מהוויקיפדיה. ניתן גם להוריד את כל הדפים הקשורים לנושאים/תתי נושאים השונים בתנאי שמספר הדפים באשכול אינו עולה על 1000. במסך התוצאות מוצגים בצורת ענן תגיות דפים הקשורים לנושא שנבחרו באקראי. כמו כן בסרגל צדדי מוצגים "נתחים" נושאיים קרובים.
מאפיינים אלה הופכים את החיפוש בוויקיפדיה ליעיל יותר.
כך למשל חיפוש במנוע החיפוש בוויקיפדיה בנושא open access מציג  את הערך המרכזי בנושא בלבד, לעומת זאת חיפוש ב- Wikislice הניב 44 דפים שקשורים לנושא – בראשם הדף שכולל את הערך המרכזי בוויקיפדיה בנושא, ודפים נוספים שכוללים ערכים בנושאים רלוונטיים לנושא כמו:
Open access journal ,Open access publishing ,Public Library of Science, Institutional repository ועוד.. במסך התוצאות מוצגת פסקה או כמה פסקאות פותחות של כל אחד מהערכים. לחיצה על more תציג  את הערך המלא. כמובן שהמאפיינים הנוספים שהוזכרו לעיל מייעלים עוד יותר את החיפוש. מבחינה זאת מנוע זה מצטרף למנוע הסמנטי powerset שבשלב זה מצטמצם לחיפוש בוויקיפדיה.

קישור לאתר המנוע
אודות המנוע ושאלות נפוצות

MetaGlossary – מנוע-על להגדרת מונחים

 MetaGlossary הוא מנוע–על ייעודי ברוח ה- Web2 להגדרת מונחים. ההגדרות נלקחות מה-Web עם קישורים למקור. מסממני ה-Web2 – למשתמש אפשרות להוסיף הגדרות למאגר ההגדרות ולהביע דעתו על ההגדרות המתקבלות, כמו כן הוא יכול ליצור חשבון אישי ולהכניס את ההגדרות המתקבלות לקטגוריות משלו. ליד כל הגדרה יש אופציה לשלוח אותה במייל או לשמור אותה בclipboard- (שטח זיכרון לאחסון זמני) לצורך הדבקתה ביישום כלשהו. הכלי שמבוסס על ה-Web מתאפיין באופיו הדינמי. כיום המנוע עדיין בגרסת ביתא ועל פי מה שמוצהר באתר הוא מכסה למעלה מ-2 מיליון מונחים, ביטויים וראשי תיבות.
בדקתי את הכלי בהשוואה לאופציה לחיפוש מונחים בגוגל. כידוע, בגוגל ניתן לקבל הגדרות למונחים על ידי שימוש באסטרטגית החיפוש –  define:מונח . כך למשל על ידי שימוש באסטרטגיית החיפוש Define:xml ניתן לקבל הגדרות למונח xml . מהבדיקה שערכתי עולה שהיתרון הבולט של MetaGlossary על פני גוגל הוא הצגת המונחים מסווגים על פי המשמעויות השונות של המונח. כך למשל חיפוש המונח Ajax הניב 39 הגדרות מסווגות על פי ארבע משמעויות שונות של המונח. לעומת זאת חיפוש המונח Ajax בגוגל תוך שימוש באסטרטגיית החיפוש define: Ajax הניב 37 תוצאות שונות ברשימה אחת לא מסווגת. כמובן שסיווג ההגדרות של המונח על פי המשמעויות השונות של המונח מהווה יתרון מבחינת השימושיות. ההגדרות בשני המנועים לא חופפות בדרך כלל כך ששני המנועים יכולים מבחינה זאת להשלים זה את זה.

לאתר מנוע החיפוש
אודות המנוע
AltSearchEngines על המנוע

Open Access ומאגרים מוסדיים -עבר, הווה והחזון

 Open Access משמעותו גישה חופשית לפרסומים מקוונים מחקריים. העמדה התומכת ב-Open Access מתחזקת נוכח העלות הגבוהה של כתבי עת מדעיים ובעיות תקציביות לרכישתם. בדיעבד נמצא שהחוקרים יוצאים נשכרים מפרסום מחקריהם ב-Open Access מאחר שפרסומים ב-Open Access מצוטטים יותר. ממצאים אלה עשויים לתרום אף הם לעידוד המגמה.

היוזמה הבינלאומית המשמעותית הראשונה בנושא Open Access הייתה יוזמת בודפסט בשנת 2002. היוזמה התמקדה במטרה לאפשר גישה חופשית לכתבי עת שפיטים ולשם כך קבלה שתי המלצות בהם ראתה את הדרכים להשגת המטרה והן:
 • Self-Archiving – אספקת כלים ועזרה לחוקרים להפקיד את המאמרים שלהם שעברו שיפוט, במאגרי ארכיון פתוחים. כאשר מאגרים אלה יעמדו בסטנדרטים של OAI Open Archives Initiative אזי מנועי חיפוש יוכלו לראות בהם מאגר אחד . באופן זה המשתמשים לא יצטרכו לדעת אילו מאגרים קיימים ומהו מיקומם על מנת להשתמש בהם. 
• Open Aceess Journals – הקמת דור חדש של כתבי עת פתוחים. ממשלות, אוניברסיטאות ספריות מו"לים וגופים אחרים נקראו להירתם למשימה. מאז היו יוזמות נוספות חשובות בתחום ה- Open Access ובהן ההצהרה של IFLA בנושא. 

הקמת מאגרי מידע מוסדיים ואספקת הכלים לחוקרים להפקיד את מחקריהם ויצירותיהם במאגרים כאלה היא פעולה חשובה במסגרת השגת מטרת ה-Open Access. בדרך כלל המאגרים נמצאים בשרת המוסדי, ולשם כך פותחו מספר תוכנות חופשיות כמו EPrints , ו-Fedora. לאחרונה גופים חיצוניים דוגמת BioMed Central מציעים את שירותיהם לאחסון מאגרים מוסדיים בשרתים שלו ופיתוח מנשקי חיפוש מתאימים.. באתר http://www.eprints.org/openaccess/self-faq/#self-archiving ניתן למצוא תשובות לשאלות רבות הקשורות בהיבטים שונים הקשורים להקמתם של מאגרים מוסדיים – היבטים טכניים, תקציביים, זכויות יוצרים, תפקיד הספריות בנושא ועוד.

נושא המאגרים המוסדיים מתפתח ומאגרים מוסדיים נוספים בקצב מואץ. באתר http://roar.eprints.org/?action=browse ניתן למצוא נתונים סטטיסטיים על מאגרים מוסדיים בעולם, ומידע מפורט על כל אחד מהמאגרים ובאילו כלים נוצר. הוקמו ארגונים ששמו להם למטרה לקדם את הנושא, וממשלות ומוסדות אקדמיים תומכים בו. דוגמה בולטת לפרויקט ששם לו למטרה לקדם את נושא המאגרים המוסדיים הוא SHERPA (Securing a Hybrid Environment for Research Preservation and Accessׂ)ׁ– שכיום חברים בו 26 מוסדות מחקר בבריטניה בעלי ניסיון בתחום, ובתוכם הספרייה הלאומית של בריטניה. באתר של SHERPA יש מידע על שירותיו השונים, בהם גם שירות חיפוש בכל המאגרים המוסדיים של בריטניה. שירותי חיפוש-על דומים במאגרים מוסדיים הם: CASSIR– בחסותה של ממשלת הודו,ו- DAREnet בהולנד (מאז אפריל 2008 הוא משולב בפורטל NARCIS). המגמה של מנועי–על ייעודיים למאגרים המוסדיים צוברת תאוצה. לאחרונה נוסף שירות ARROW – Australian Research Repositories Online to the World – שירות חיפוש במאגרי המחקר המוסדיים של אוסטרליה ו- hprint – שירות חיפוש ראשון מסוגו בסקנדינביה שמתמקד במדעי הרוח ואמנויות.

הנושא מככב גם בחדשות. שומעים על יזמות של אוניברסיטאות בכיוון ה- Open Acess כמו זו של אוניברסיטת ברקלי מינואר 2008 לכסות את ההוצאות של המחברים הכרוכות בפרסום מאמרים ב-Open Access, הצעתה של אוניברסיטת הרווארד שאושרה ב- 12.2.2008 לחייב את אנשי הסגל להפקיד את מחקריהם במאגר חופשי (Open Access Repository ), שינוהל על ידי הספרייה ויהיה נגיש לכל דרך האינטרנט, או הפצרתו של European University Association-EUAבאוניברסיטאות באירופה לפתח אסטרטגיות ומדיניות ברורה לקידום הנושא של מאגרים מוסדיים. כמו כן שומעים על גופים מממנים שמתנים את מימון המחקר בהפקדתו ב-Open Access . הגופים העוסקים בתחום מדברים גם על החזון. על החזון בבריטניה לשנת 2010 ניתן לקרוא במפת הדרכים בכתובת:- http://www.ukoln.ac.uk/repositories/publications/roadmap-200604/rep-roadmap-v15.pdf

ניצנים ראשונים למאגרים מוסדיים ניתן למצוא גם בארץ – Wisdom Archive לדוגמה הוא מאגר מוסדי של מכון וייצמן. התוכנה בה הם משתמשים לפיתוח המאגר היא Eprints – תוכנה חופשית שפותחה על ידי אוניברסיטת Southampton, ומוסדות נוספים נקראים להצטרף ליוזמה תוך שימוש בתוכנה לפיתוח מאגרים משלהם. יוזמות מסוג זה מבליטות את מעמדם של הספרנים והספריות בתחום לא רק כמשתמשים אלא גם כמפתחים, שכן בפיתוח מאגרים אלה תפקיד חשוב לא רק לחוקרים אלא גם לספריות ולספרנים. .

ISIHighlyCited.com – שער גישה לאנשי המידע והמחקר המשפיעים ביותר בתחומם

ISIHighlyCited הוא שירות חופשי של Thomson Scientific שמספק מידע על החוקרים המצוטטים ביותר בתקופה 1981-1999 ב-21 תחומי מחקר בדיסציפלינות שונות: מדעי החיים, רפואה, פיסיקה, הנדסה ומדעי החברה. מאגר המידע של החוקרים ממשיך להתעדכן ואמור לכלול את 250 החוקרים המובילים בכל אחד מ-21 תחומי המחקר.
המידע על כל חוקר כולל :
• מידע ביוגרפי – השכלה, תחומי מחקר ואתרי בית אישיים
• רשימה מלאה של פרסומים
• ביבליוגרפיה עם קישורים לרשומות הביבליוגרפיות המלאות ב- ISI Web of Science

ניתן לחפש את החוקרים המובילים על פי השדות הבאים: שם, תחום מחקר, ארץ והמוסד אליו שייך החוקר.
כלי זה שהוא חלק מהפלטפורמה של ISI Web of Knowledge מאפשר בנוסף לאיתור קולגות ומומחים מובילים בתחום גם מעקב אחר מגמות מחקר והתפתחות רעיונית מדעית.

קישור לאתר
קישור למאמר המתאר את האופן בו מאותרים החוקרים המצוטטים ביותר 

ARROW Discovery Service – שירות חיפוש במאגרי המחקר המוסדיים של האוניברסיטאות באוסטרליה

ליותר ממחצית האוניברסיטאות באוסטרליה מאגרי מחקר מוסדיים (Institutional Repositories) וקרוב לודאי שתוך שנתיים כל האוניברסיטאות באוסטרליה יקימו מאגרי מחקר מוסדיים. כל חוקר מפקיד במאגר עותק דיגיטלי של עבודתו ומידע מתאר. באופן זה מאגרי המחקר מאפשרים לחוקרים להפוך את מחקריהם לנחלת הציבור ושני הצדדים יוצאים נשכרים.
ARROW – Australian research repositories Online to the World – הוא פרויקט לאומי בחסותו של משרד החינוך באוסטרליה ששם לו למטרה לאפשר בצורה אופטימלית את השימוש במאגרים אלה. במסגרתו פותח מנוע חיפוש שמחפש סימולטנית בכל המאגרים. שירות חיפוש זה ARROW Discovery Service מסופק על ידי הספרייה הלאומית של אוסטרליה והוא מאפשר כיום חיפוש ב- 161,790 פריטים – כולל תיזות, מאמרים, פרקים מספרים, תמונות וקטעי מוסיקה. לרוב פריטי המידע המאוחזרים עותק דיגיטלי מלא.
באופן זה שירות זה מהווה מקור נוסף לאיתור חומר איכותי בטקסט מלא.

לשירות החיפוש
מידע על ARROW
קישור ל- OpenDOAR – מדריך כללי למאגרי מחקר מוסדיים

"מועדון קריאה" – אנו קוראים ספרים חדשים – שירות עדכונים חינם למשלוח קטעי קריאה בדואר אלקטרוני

אין ספק שבעולם הטכנולוגי בו אנו חיים ובקצב המטורף של החיים רבים נטשו או צמצמו את הקריאה של ספרות יפה מחוסר זמן. רבים היו רוצים להתעדכן ב"מה חדש" בספרות העברית, מקורית או מתורגמת, ולדפדף בספרים החדשים לפני רכישתם, אך שוב אין מספיק זמן גם לכך.
עבורם "מועדון קריאה" הוא הפתרון. "מועדון הקריאה" היא יוזמה של זוהר עמיהוד מאז שנת 2002. ניתן להירשם חינם לאחד מערוצי הקריאה המוצעים במועדון – "רומן מקור" או "רומן תרגום" ולקבל בדואר אלקטרוני קטעי קריאה קצרים מהספרים רבי המכר. על פי מה שכותב זוהר עמיהוד באתר:
"בכל יום יישלח אליכם בדואר האלקטרוני קטע קריאה קצר: ביום א' תקבלו קטע קריאה מתחילת הספר, ביום ב' תקבלו את הקטע הבא אחריו, ביום ג' תקבלו קטע נוסף וכך עד וכולל יום ה'. שישי ושבת נחים וביום א', מתחילים לקרוא ספר חדש.
להערכתי, תוכלו לקרוא כל קטע בלא יותר מ- 5 דקות. מכל ספר נקרא ביחד כ- 30 עמודים. "
ובכל זאת כיצד שירות כזה מתאפשר חינם? – היכן המלכוד ? ומהו המודל העסקי ? הכול מוצהר בצורה גלויה וישרה באתר:
"בכל דבר דואר תמצאו קישור לרכישת ספר בחנויות ספרים באינטרנט. אתם רוכשים ספר וחנות הספרים הוירטואלית ממנה רכשתם (סטימצקי, בוקמי…) משלמת עמלה לאתר מועדון קריאה. כך ניתן להמשיך לתת לכם שירות חינם!"
בנוסף לשירות האלקטרוני של קטעי קריאה, באתר "מועדון קריאה" יש לוח אירועים ספרותיים מקיף, כולל האירועים הספרותיים של אוניברסיטת תל אביב. בלוח אירועי תרבות ספרות ניתן לקבל מידע עדכני על אירועים שונים כמו: סיורים בעקבות ספרים, סיורים בעקבות סופרים, אירועי השקה, הרצאות של סופרים, הרצאות על ספרים, דיונים בעקבות ספר, מפגשי סופרים וכדומה
באתר "מועדון קריאה" ניתן גם לקבל מידע קצר על סופרים ישראליים ולא ישראליים שספריהם תורגמו לעברית. המידע לקוח מהספרים שלהם או מאתרי הבית שלהם.
אין ספק שהאתר מעניין והשירות נשמע מבטיח…

אל האתר "מועדון קריאה"

Google Doctype – אנציקלופדיה חופשית למפתחי Web על ידי מפתחי Web

ב-14 במאי 2008 הצהירה Google על גרסת ביתא של Google Doctype – אנציקלופדיה חופשית – מעין וויקיפדיה, בנושאים הקשורים לפיתוח יישומים ב-Web. האנציקלופדיה מכילה שורות קוד רבות ב- javascript בנושאים שחשובים למפתחי Web – נושאי אבטחת מידע, CSS, הטמנה (Caching), טיפים ועוד. שורות הקוד פתוחות לשימוש במסגרת ה- creative commons, האנציקלופדיה כולה ניתנת להורדה ולהפצה, ומפתחי Web נקראים לתרום לאנציקלופדיה זו… מטרתה של האנציקלופדיה  מעשית – לענות למפתחי Web על השאלה "כיצד" ? והתרומה צריכה להיות בהתאם.
כיום היא נמצאת עדיין בשלב ביתא והיקפה מצומצם יחסית, אך אין ספק שזו יוזמה חשובה של Google עבור מפתחי Web שיוכלו למצוא במקום אחד ריכוז של שורות קוד חופשיות לשימוש ולהפצה מחודשת בנושאים חיוניים לפיתוח, וככל שירבו התורמים כן תגדל תרומתה.

לאתר האנציקלופדיה 

פותחים דלתות לאנשים עם מוגבלות – הנגשת אתרי אינטרנט

ספרניות האינטרנט מהספרייה למדעי החברה ולניהול, הספרייה המרכזית והספרייה למדעי החיים ולרפואה השתתפו ב- 2.6.2008 ביום פתוח שערכו חברת מיקרוסופט, איגוד האינטרנט הישראלי ועמותת נגישות ישראל בנושא הנגשת אתרי אינטרנט לאנשים עם מוגבלות ובני הגיל השלישי.
ישנם כמה סוגים של מוגבלויות שמשפיעים על הגלישה באינטרנט: ליקויי ראיה, שמיעה, מוטוריקה, וליקויי למידה.
הנגשת אתרי אינטרנט לאנשים עם מוגבלות משמעותה התאמת אתרי האינטרנט לשימושה של אוכלוסיה זו, שצריכה לרוב להשתמש בטכנולוגיה מסייעת ובציוד עזר כמו קוראי מסך כדי לגלוש באינטרנט. יש לדאוג לתאימות האתרים לטכנולוגיה מסייעת באופן שיתאפשר למשתמש לעבוד עם קורא מסך ומקלדת. ההנגשה כרוכה באספקת חלופות טקסט לתצוגה הגרפית, בעיצוב צבעוניות מתאימה ומתן אפשרות למשתמש לשלוט בתצוגה של צבעים, פונטים, זמן תגובה ועוד.
קיימות כמה רמות של הנגשה. סטנדרטים לנגישות במישור הבינלאומי פותחו על ידי ארגון ה- W3C ואלה תורגמו על ידי איגוד האינטרנט הישראלי לשפה העברית. בשנת 2002 נוסדה קבוצת משימה שמטרתה קידום הנגשת האינטרנט בישראל לאנשים עם מוגבלות. לקבוצה זו אתר אינטרנט ייעודי http://www.nagish.org.il ובו מידע שימושי, מאמרים וסטנדרטים להנגשת אתרי אינטרנט.

בישראל כ- 25% מהאוכלוסייה סובלים ממוגבלות קשה ו-37% ממוגבלות מתונה. המטרה בהנגשת אתרי האינטרנט היא לאפשר לכולם לגלוש באינטרנט.
השגת מטרה אתית זו כרוכה גם ביתרונות כלכליים שכן הנגשת אתרי אינטרנט מעלה את השימושיות באתר, משפרת משמעותית את קידום האתר במנועי חיפוש, מעלה את כמות הגולשים באתר ומוזילה את עלויות התפעול של הארגון מאחר שגלישה באתר זולה יותר ממענה פרונטלי או טלפוני.
להנגשת אתרים גם היבט משפטי. בחודש מרץ 2005 התקבל בכנסת תיקון לחוק שוויון זכויות לאנשים עם מוגבלות, התשנ"ח – 1998, על פיו הנגישות היא תנאי הכרחי לשוויון וחובת הנגשת השירות והמידע חלה על כל מספקי השירותים לכלל הציבור – מגזר פרטי וציבורי כאחד. מאחר שקיים פער בין המצב כיום, למצב הנדרש על פי החוק, נקבעה החלה הדרגתית של החוק.

היום הפתוח בו השתתפנו היה בהנחיתה של הגב' גילה גרטל מרכזת נושא הנגישות באיגוד האינטרנט הישראלי, וההרצאות בו דנו במגוון נושאים: היתרונות בהנגשת אתרי אינטרנט, בדיקת נגישות, כיצד מנגישים אתרי אינטרנט – כללים וטכניקות, הנגשת אתרים ב- Moss 2007 , וגידי אהרונוביץ, גולש עיוור – איש תמיכת לקוחות בזק בינלאומי, הדגים כיצד הוא גולש באינטרנט בעזרת קורא מסך…
היה מעניין … ונוכחנו לדעת שעוד רבה העבודה שעומדת בפנינו..
מן הראוי לציין שמסכי ה-Web Opac בגרסת אלף 18 כבר תומכים בהנגשה.

קישור למצגות של הכנס

TinEye – מנוע חדש לחיפוש תמונות, מסוג אחר

TinEye הוא מנוע לחיפוש תמונות באופן שונה. מספקים למנוע תמונה מסוימת והמנוע אמור לאתר את כל האתרים ב-Web בהם נמצאת התמונה, גם אם עברה שינוי או ליטוש כלשהו באמצעות תוכנה גרפית כמו חיתוך, שינוי צבע, קול ועוד. מנוע חיפוש זה משתמש בטכנולוגית זיהוי מיוחדת ומאחוריו עומד אלגוריתם מתוחכם של זיהוי תבניות (pattern recognition) ללא שימוש בסימני מים (watermarks ) או במטא-נתונים (metadata). המנוע מנתח את התמונה שסופקה לו יוצר מעין "טביעת אצבעות" דיגיטלית לתמונה ומשווה אותה ל"טביעות האצבעות" של התמונות שבאינדקס שלו. כיום האינדקס שלו כולל כ-487 מיליון תמונות מה-Web. ככל שהאינדקס שלו יגדל הביצועים שלו ישתפרו.
האלגוריתם פותח על ידי חברה בטורונטו בשם Idée שהציעה את השירות לסוכנויות חדשות כדי לגלות אם נעשה שימוש בתצלומים שלהם בעיתון או במגזין כלשהו.
מנוע חיפוש מסוג זה יש בו כדי להרתיע מביצוע עבירות כמו הצגת תמונות לא אמיתיות ברשתות חברתיות והפרת זכויות קניין רוחני וזכויות יוצרים. יש להניח שהוא יעודד אימוץ תמונות מורשות על ידי ה-creative commons . המנוע נמצא עדיין בשלב ביתא ויש להירשם כדי לקבל הזמנה להשתמש בו. נרשמתי וקבלתי הודעה שאני נמצאת ברשימת המתנה, כך שלא יכולתי להעריך אותו אבל מהודעות שקראתי ב-Web של משתמשים שניסו אותו הוא עובד היטב….

כתבה ב-TechCrunch בנושא

ראיון בנושא

פרויקטים לדיגיטציה בעולם ובארץ

הכתבה "ישראל, עם הספר? לא באינטרנט" שהתפרסמה ב"קפטן אינטרנט" סורקת את מצב הדיגיטציה בארץ ובעולם. הפרויקט המוביל בעולם לדיגיטציה של ספרים ללא ספק הוא  Google books . גוגל סורקת מיליוני ספרים ב-19 ספריות – בארצות הברית, אירופה, יפאן והודו. היא גם משתפת פעולה עם הוצאות ספרים שמאפשרות צפייה מוגבלת בספרים שברשותם. עד כה נסרקו במסגרת הפרויקט יותר ממיליון ספרים ביותר מ-100 שפות.
במסגרת פרויקט דומה לסריקת ספרים של מיקרוסופט נסרקו כ-750 אלף ספרים ומאמרים, אלא שמיקרוסופט הודיעה שהפסיקה לסרוק ספרים חדשים, ככל הנראה מתוך הבנה שגוגל שולטת באופן בלעדי גם בתחום זה.
מדינות אירופה החלו אף הם לסרוק את הספרים בספריותיהן ועל פי דברי פרופ' אלחנן אדלר, ראש האגף לטכנולוגיות מידע בבית הספרים הלאומי בירושלים "מה שדירבן את האירופאים זה גוגל".
גם עיתונים שונים בעולם מעלים לרשת את הארכיונים שלהם והם זמינים לחיפוש ב-Google News. ה"ניו יורק טיימס", למשל, השיק בסוף השבוע את הפרויקט "TimesMachine", שבו הועלו לרשת גיליונות של העיתון מן השנים 1851-1922.

לעומת שפע הפרסומים המקוונים בשפה האנגלית מצאי הספרים המקוונים בעברית הוא דל יחסי. פרויקט בן יהודה, שהחל ב-1999, הוא חלוץ הדיגיטציה של הספרות העברית. זהו פרויקט מרשים אך הוא מתקיים בהתנדבות ולכן גם באטיות.
בית הספרים הלאומי סרק עד כה 897 ספרים , כמעט כולם כתבי יד נדירים ועתיקים מאוד של ספרי קודש וספרות תורנית, וכן כמה אטלסים, ספרי מסעות וספרי מוסיקה.
על פי דברי פרופ' אלחנן אדלר המדינה לא מספיק פעילה בנושא , הפרויקט ממומן מתרומות פרטיות ולכן הכל מתנהל על אש קטנה . מגעים שנעשו עם גוגול למען שיתוף פעולה עם בית הספרים הלאומי למען הטמעת הספרים שבו ב-Google Books עד כה לא נשאו פרי .
והפרויקט האחרון פרויקט  פאר "פתיחת אוצרות רוח" של האוניברסיטה הפתוחה, שמעלה את ספרי הלימוד שלה לרשת, רק מדגיש עד כמה דל מצאי הספרים המקוונים בעברית.
למרות זאת, ד"ר אורה נבנצאל, ראש המגמה ללימודי מידע במכללה האקדמית בית ברל, מגלה אופטימיות….

לכתבה המלאה של עפרי אילני שהתפרסמה ב"קפטן אינטרנט" 27.5.08
קרדיט לד"ר אריאל פרנק שהפנה את תשומת לבי לכתבה

כלים אקדמיים לחיפוש מידע כנגד "אפקט גוגל"

כתבה ב- EducationGuardian.co.uk בשם Academia's big guns fight Google effect מתמקדת בסקירת כלים אקדמיים לחיפוש מידע שממומנים ברובם על ידי JISC
(Joint Information Systems Committee).
בכתבה נסקרים כמה כלים שיכולים להיות שימושיים כמו Intute שירות חופשי של רשת האוניברסיטאות באנגליה שמספק גישה למקורות מידע איכותיים מבוקרים בטקסט מלא. המקורות מתחומי מחקר שונים: אומנויות, מדעי החיים ורפואה, טכנולוגיה ומדעי החברה.
כמו כן מאוזכרים בכתבה אתרי מו"לים אקדמיים שחלקם תומכים בגישת ה-OpenAccess כמו Blackwell Synergy.
כלים אקדמיים לחיפוש מידע יכולים לתרום למלחמה בנטייה לבינוניות שכונתה על ידי Tara Brabazon במאמרה The Google Effect: Googling, Blogging, Wikis and the Flattening of Expertise – "אפקט גוגל". אלא שלעתים כלים אלה אינם ידידותיים למשתמש ובכך חסרונם. הקטלוגים של הספריות האוניברסיטאיות, במיוחד, סופגים בקורת על היותם קשים לניווט, ונראה שלכל אלה ששוקדים על הנגשת חומר איכותי לסטודנטים יש מה ללמוד מאתרים כמו אמזון -אתר שמאפשר עיון בספרים, מספק חוות דעת של קוראים על הספרים והצעות לספרים דומים בנושא.

קרדיט לד"ר אריאל פרנק שהפנה את תשומת לבי לכתבה

לכתבה המלאה

איתור חוקרים בתחום מחקר מסוים ועמיתים למחקר – ResearcherID – מאפיינים חדשים

ResearcherID הוא אתר שירות של Thomson Scientific שמהווה למעשה קהיליית מחקר רב-תחומית. חוקרים יכולים להירשם באתר, ולכל אחד מהחברים יש מזהה אלפאנומירי ייחודי שכולל בתוכו גם את שנת הרישום, ופרופיל שכולל פרטים כמו: תחומי עיסוק, מוסד ועוד שמתעדכן על ידי החוקר. החוקר יכול ליצור את רשימת הפרסומים שלו תוך שימוש בWeb of Sciences- או להעלות קובץ משלו. כמו כן הוא רשאי לבחור לשמור את הפרופיל שלו כפרטי או כציבורי. השירות מאפשר לחוקר לקבל נתונים סטטיסטיים על רשימת הפרסומים שהעלה לאתר מה-Web of Sciences. הנתונים כוללים התפלגות הציטוטים על פי שנים, מספר ממוצע של ציטוטים לכל אחד מהפריטים ברשימה ו- h-index

לאחרונה נוספו לשירות זה מספר מאפיינים חדשים שמספקים לחוקרים כמה כלים סטטיסטיים ויזואליים שמתבססים על רשימת הפרסומים שלהם שנוספו מה-Web of Science
· Citing Articles Network – רשת מאמרים מצוטטים בעזרתה החוקר יכול לראות מי המחברים שהרבו לצטט את מאמריו (20 מחברים) . רשת המאמרים המצוטטים מוצגת גם על פי קטגוריות, ארצות,מוסדות ושנים.
· Collaboration Network – רשת שיתוף פעולה שמציגה את עמיתיו בתחום של החוקר,  מרחבי העולם כולו (20 מחברים שעומדים בראש רשימת השותפים למחקרים שלו). רשת שיתוף הפעולה מוצגת גם על פי קטגוריות, ארצות,מוסדות.
הכלי חשוב לחוקרים כי מעבר לנתונים הסטטיסטיים ואיתור עמיתים לתחום הוא משמש לחוקרים הרשומים גם במה להכרה ואמצעי לקידום .

כל משתמש, גם מי שאינו רשום לאתר יכול לראות את אותו מידע סטטיסטי שתואר לעיל, בתנאי שזה הוגדר על ידי החוקרים המנויים על השירות, כציבורי . מידע שהוגדר כפרטי לא יוצג.
באופן זה כלי זה הוא מקור טוב לחפש חוקרים בתחומי מחקר שונים, לראות את הפרופיל שלהם כפי שהוגדר על ידם, ולגלות עמיתים פוטנציאליים. שדות החיפוש האפשריים הם מלות מפתח, מוסד, שם או מספר מזהה. ניתן גם לבחור באחד מנושאי המחקר המוצגים בסרגל צדדי כדי לקבל רשימות חוקרים בתחום.
פיתוח זה הוא ברוח המגמה לכרית מידע שימושי ממאגרי מידע. דוגמה נוספת במסגרת מגמה זו הוא היישום Authoratory.com שכורה מידע מה-Pubmed ובכך מאפשר אף הוא לאתר מחברים מרכזיים ובולטים, והפעם בתחום ביו-רפואי מסוים.
קישור לדף שאלות נפוצות של האתר

דוגמאות  לנתונים סטטיסטיים שניתן לראות באתר:
נתונים סטטיסטיים על רשימת הפרסומים
נתונים סטטיסטיים מרשת שיתוף הפעולה
נתונים סטטיסטיים מרשת המאמרים המצוטטים

מידע כללי על המאפיינים החדשים
  

Page2RSS – שירות שמאפשר לקבל עדכונים לקורא RSS מכל אתר Web

לא אחת נתקלנו בבלוג או באתר שהיינו רוצים לקבל ממנו עדכונים לקורא ה-RSS שלנו אך לא יכולנו לעשות זאת מכיוון שלאתר לא היה ערוץ RSS .
הבעיה נפתרה באמצעות שירותי Page2RSS . Page2RSS מאפשר לקבל עדכונים לקורא ה-RSS גם מאתרים שאינם מציעים תכנים באמצעות ערוצי RSS.


כל מה שצריך לעשות הוא להזין את כתובת האתר הרצוי בתיבת החיפוש וללחוץ על הכפתור to RSS . בעמוד שהתקבל להעתיק את כתובתו ולהוסיפה לתוכנת ה-RSS בה משתמשים, או להוסיפה אוטומטית לאחד מקוראי ה-RSS המוצעים באותו דף .

מנוע החיפוש של הסטארט-אפ Powerset הוא מנוע חיפוש מסוג אחר – האם יתחרה בגוגל?

כתבה מ- TheMarker מ-15.5.2008.

Powerset השיקה השבוע גרסה ניסיונית של מנוע חיפוש חדשני שמשתמש בטכניקות חיפוש מתקדמות, שמאפשרות הבנה סמנטית של דפי ה-Web. מנועי החיפוש המסורתיים, כולל גוגל משתמשים בשיטת החיפוש הקונבנציונלית שמתייחסת אל דפי ה-Web כאסופת מלים. בניגוד למנועי החיפוש המסורתיים מנוע חיפוש זה הוא מנוע חיפוש סמנטי אשר מייצר ייצוג סמנטי של הדף על ידי ניתוח כל משפט המופיע בו, והבנת המשמעות שלו. באופן זה המנוע יכול לתת בתוצאות החיפוש אוסף של עובדות הקשורות לשאילתה, לתמצת את המידע, ולספק תשובות ישירות לשאלות עובדתיות.
האם בזכות שיטת החיפוש יוכל מנוע החיפוש של Powerset להתחרות בגוגל? היתרון העצום של גוגל בנוסף לאלגוריתם המתוחכם שלו הוא האינדקס העצום שלו . על פי דברי מריסה מאייר, סגנית נשיא בגוגל האחראית על מוצרי החיפוש וחוויית משתמש, "עם כמויות מידע כל כך גדולות, בסופו של דבר מתקבלות תוצאות שנראות אינטליגנטיות, למרות שהן נאספו באמצעות כוח-גס ותו לא".
האינדקס של Powerset לעומת זו מוגבל ביותר, וכולל רק כמיליון דפים מוויקיפדיה וממסד הנתונים האינטרנטי Metaweb Technologies' Freebase. עם זאת, מנהל המוצר של Powerset סקוט פרווסט מבטיח שהאינדקס יתחיל לגדול בתוך חודש מרגע ההשקה, ובסופו של דבר יוכל להתחרות מבחינת גודלו מול גוגל, יאהו ואחרים.
בעתיד Powerset תצטרך להוכיח שמנוע החיפוש שלה יכול להתמודד עם אינדקס של מיליארדים רבים של דפי אינטרנט, ולשרת מיליוני משתמשים במקביל. "אין ספק שיש כאן פוטנציאל, אבל ליישם את מה ש-Powerset עשתה על הרשת כולה הוא אתגר עצום שיצריך זמן רב ומשאבים עצומים",אומר האנליסט גרג סטרלינג מחברת Sterling .Market Intelligence
אשר לגוגל אין ספק שהיא שוקדת על פיתוח טכנולוגיות סמנטיות ומנוע החיפוש שלה יהיה בעתיד חלק מה- Web הסמנטי . מי יקדים את מי? ימים יגידו…

ובינתיים, כדאי להשתמש במנוע חדש וחדשני זה לחיפוש מאמרים מה-wikipedia

לכתבה המלאה ב-TheMarker
קרדיט לד"ר אריאל פרנק שהפנה את תשומת לבי לכתבה