DeepDyve – מנוע חיפוש מחקרי חדש – דולה מידע מה"רשת הלא-נראית"

ב-11 בנובמבר 2008 חברת Infovell שנתה שמה ל- DeepDyve והצהירה על השקת המנוע שלה לדלית מידע מ"הרשת הלא-נראית" – שנקרא כשם החברה DeepDyve. "הרשת הלא-נראית" היא הרשת שרובה אינה כלולה מסיבות טכנולוגיות או מסיבות שקשורות למדיניות באינדקסים של מנועי החיפוש המסורתיים. בדרך כלל מדובר על חומר ממאגרי מידע, שמנועי חיפוש מגיעים לשעריהם אך לא נכנסים לתוכם.
על פי כתבה שהתפרסמה בנושא ב- infotoday האינדקס של המנוע כולל מקורות כמו:
MEDLINE, CRISP, Clinical Trials, VAERS, World Health Organization Model List of Essential Medicines, כתבי עת מדעיים מהמו"לים: Annual Reviews; BioOne; Mary Ann Liebert,  SAGE Publications, Oxford University Press, MIT Press, Hindawi. הטקסט המלא של המקורות חלקו חופשי וחלקו מוצע למשתמש תמורת תשלום..

המנוע חופשי  בגרסת ביתא סגורה – ניתן להירשם ולקבל אישור מהחברה להשתמש בו. החברה מציעה בתשלום גם את המוצר DeepDyve Pro שכולל מאפיינים מתקדמים יותר כמו אפשרויות רבות יותר לעידון התוצאות, אשכול וויזואלי ועוד.. כיום המנוע מתמקד בתחומים: מדעי החיים, פטנטים וויקיפדיה אבל הוא מתכוון להרחיב את האינדקס שלו לתחומי ידע נוספים.

מתוך המידע באתר אודות המנוע ניתן ללמוד שהחברה נוסדה על ידי שני מדענים בתחום הביואינפורמטיקה שעבדו בפרויקט הגנום האנושי, ומתוך הכרת צורכי המחקר ומגבלות מנועי החיפוש הנוכחיים נולד המנוע. ב"אודות המנוע" מדובר עוד על טכנולוגיה שמהווה פריצת דרך ועל אלגוריתם שמיישם שיטות מפתוח מתחום הגנומיקה. האלגוריתם מזהה תבניות ודפוסים ולא מלים. אופן זיהוי זה שונה ממנועי חיפוש מסורתיים ומתאים לתכנים של ה"רשת הלא נראית". מעבר למידע כללי זה אין ב"אודות המנוע" מידע על האלגוריתם והטכנולוגיה. בכתבה ב-infotoday ניתן למצוא פרטים נוספים על הטכנולוגיה מהם עולה שהאינדקס כולל את כל המונחים והמלים מהטקסטים ושהטכנולוגיה היא סטטיסטית גרידא ללא סמנטיקה, מלים נרדפות או מידע-על ומתבססת בעיקרה על זיהוי והתאמת תבניות.

כמובן שההצהרה על המנוע זכתה לתגובות רבות – מהן חיוביות ומהן חיוביות פחות.
כדי להתנסות באתר נרשמתי וקבלתי אישור להשתמש בגרסה החופשית. בחיפושים שביצעתי קבלתי תוצאות רלוונטיות מכתבי עת שונים. התוצאות מוצגות בפורמט דומה לזה של מאגרי מידע. ניתן לעדן את השאילתות על פי תחומי ידע שונים. ליד כל תוצאה ישנו המאפיין "more like this".

מכל מקום, המודל של המנוע מעניין וחשוב למחקר,   ואם מו"לים נוספים וגדולים ישתפו פעולה עם המנוע יעילותו תגדל לטובת המשתמשים, ומי יודע אולי בעתיד האופציה של מנוי למנוע מסוג זה תהווה תחליף למנויים היקרים למו"לים.

לאתר המנוע

מנועי חיפוש אקדמיים חדשים: RefSeek ו- Hakia

רציתי לכתוב על מנוע חיפוש אקדמי חדש בשם  , RefSeek  אבל אחרי בדיקה גיליתי שהמנוע לא מציע שום דבר מעבר למה שגוגל כבר עושה. הוא בעצם מסיר את כל האתרים המסחריים מתוצאות החיפוש, אבל לא מוסיף שום דבר שלא היינו מקבלים לפני עידן ה- RefSeek .
מצד שני, מנוע חיפוש אחר בשם Hakia הוא מנוע סמנטי המבוסס על איכות ולא על כמות. בדיקת איכותם של אתרים מבוססת על שלושה מרכיבים:
1. האם האתרים מומלצים ע"י ספרנים
2. האם האתרים מעודכנים
3. האם האתרים רלוונטיים לשאילתא
המרכיב החשוב ביותר במנוע זה היא שיטת הצגת התוצאות, אשר מבדילה בין אתרים מומלצים, תמונות וחדשות.
לדוגמה: Why did Enron collapse?

להבהרת הדברים, אני מצרפת קישור להשוואת תוצאות חיפוש של אותו נושא ב-Hakia ובגוגל

 

Europeana

ב- 20.11.08, אמורה להיפתח לקהל הרחב  Europeana – הספריה הדיגיטלית של אירופה, שהיא גם מוזיאון וארכיון והכל באתר אחד. זהו פרויקט של שנתיים שהחל ביוני 2007 ומטרתו לאפשר גישה חופשית ליותר מ-2 מיליון פריטים דיגיטליים, כגון: סרטים, תמונות, ציורים, יצירות מיסיקאליות, מפות, כתבי יד, ספרים, עיתונים ומסמכי ארכיון שונים ובשנת 2010, להגיע אף ל- 6 מיליון פריטים דיגיטליים.

חשוב לציין כי האתר יתן מענה ל-23 שפות אירופאיות רשמיות, כגון: אנגלית, צרפתית, הולנדית, גרמנית ועוד.

התוכן הדיגיטלי נלקח מאוספים דיגיטליים קיימים של ספריות ומוזיאונים באירופה. זהו פרויקט מאוד מעניין ומומלץ לעיון.

לצפייה והתרשמות מאתר הספריה