SenseBot – מנוע חיפוש סמנטי – תקצירים וקישורים

SenseBotSensebot הוא מנוע חיפוש סמנטי חופשי, אמנם לא חדש (מאז סוף  2007 ), אבל כדאי לזכור/להכיר.  המנוע  משתמש בטכנולוגיה סמנטית כדי להציג למשתמש תמצית מתוצאות החיפוש במקום אוסף של קישורים לאתרי ווב בלבד.
התקציר הינו עיבוד של תוצאות החיפוש וכולל אספקטים שונים של תוצאות החיפוש.
הוא מורכב למעשה מרצף של משפטים שמהווים תמצית סמנטית של כל אחד מהאתרים המוצגים. קיימת אופציה להצגת תמונות רלוונטיות בראש התקציר.

על פי מה שנכתב באתר המנוע- בעיבוד התוצאות לתקציר, SenseBot משתמש בטכנולוגיה של כריית טקסט ועיבוד שפה טבעית על מנת לאתר את מונחי המפתח בעמודי הווב, ולאחר מכן הוא מעבד מעמודי הווב תקציר קוהרנטי. ענן סמנטי בראש התקציר מאפשר למשתמש לראות במה מתמקד התקציר. לחיצה על אחת מהתגיות בענן תמקד את החיפוש לנושא התגית. מעבר לתמונה הכללית על נושא החיפוש שמספק התקציר, SenseBot חושף למשתמש את המקורות שאליהם כדאי לו להיכנס לעיון מעמיק יותר בנושא. בשל אופיו זה הוא מתאים לכל אותם חיפושים שקשורים למידע כללי על נושא מסוים ופחות לשאילתות ספציפיות שעונות על מידע עובדתי .

כיום המנוע מתבסס על תוצאות שלושת המנועים הגדולים על פי בחירת המשתמש. בעתיד הכוונה היא להרחיב את מקורות החיפוש גם למנועים ייעודיים ומקורות נוספים.

התקנת רכיב תוכנה (plugin) חופשי לדפדפן תאפשר שילוב אוטומטי של SenseBot עם החיפושים בגוגל. חיפוש רגיל בגוגל יציג את התקציר בתחתית תוצאות החיפוש.

sentimentלאותה חברה שעומדת  מאחורי מנוע החיפוש יש אתר שמאפשר לבצע ניתוח סנטימנט בנושאים שמעניינים את המשתמש. התוצאות מוצגות בצורת גרף המצביע על המגמה – חיובית שלילית ניטרלית. כמו כן מוצגות חדשות אחרונות בנושא החיפוש. .

לאתר המנוע

מנועי חיפוש בעידן הווב החברתי והסמנטי – כלים, מגמות וחידושים עם מבט לעתיד

ביום רביעי 5.5.2010 התקיים במסגרת "2010 Info" – כנס המידע שעורכת חברת טלדן זו השנה ה-25 ,יום עיון בנושא: "מנועי חיפוש בעידן הווב החברתי והסמנטי – כלים, מגמות וחידושים עם מבט לעתיד" .

יו"ר: ד"ר יפה אהרוני, אוניברסיטת תל אביב, מכללת בית ברל
ד"ר נדב דפני, איש פיתוח אינטרנט. מומחה ליישומי מוסיקה

יום העיון עסק במגוון נושאים שקשורים למנועי חיפוש בעידן הווב החברתי והסמנטי. הדגש היה על חידושים במנועי חיפוש:
• היבטים שונים – טכנולוגיים וחברתיים של הווב החברתי, וחיפושי מידע ברשתות חברתיות בזמן אמת.
• חידושים בגוגל וכיצד המנוע מצליח להגיע לרלוונטיות של תוצאות למרות האתגרים הרבים שכרוכים בדבר
• החיפוש הויזואלי וראיה ממוחשבת –עד כה חיפוש תמונות התבסס בעיקרו על מאפיינים טקסטואליים. היום מפתחים את היכולת של המחשב "לראות" תמונות , מי וכיצד?
• טכניקות וכלים חדשים לחיפוש מדיה ומולטימדיה
• מודלים שונים של מנועי חיפוש לאיתור חומר בווב האקדמי:
– מנועים עם נגיעה אנושית – מדריכים, רשתות חברתיות, מנועים מותאמים אישית
– מנועי אינדקס – מסחריים ומנועי חיפוש של ספריות מבוססי פרוטוקול OAI-PM
– מנועי-על מהדור השני
– מנועי חיפוש סמנטיים שמוסיפים רובד סמנטי למאגרים קיימים אם על ידי שימוש באונטולוגיות או כריית טקסט

כמו כן הוצגו מספר נושאים שקשורים למשתמש – מערכות המלצה, ולוגים של מנועי חיפוש – יתרונות וחסרונות והיבטים שקשורים למשתמש

הוצגו גם כלים לשימוש בספרייה – סקירה כללית בנושא כלים לגילוי ידע ומערכת Athens להזדהות משתמשים לצורך גישה מרחוק למשאבים האלקטרוניים.

בעוד שהדגש ביום העיון היה על חיפוש מידע בווב החופשי – הוצג ביום העיון גם נושא מנועי חיפוש ארגוניים וקריטריונים לבחירה.

ההרצאות השתרעו על פני 4 מושבים. לבקשת משתתפי יום העיון, אני מפרסמת בפוסט זה את המצגות של ההרצאות שאושרו לי לפרסום על ידי המרצים. אם אקבל מצגות/הרצאות נוספות בהמשך, אעדכן את הפוסט בהתאם. להלן תוכנית היום על פי סדר המושבים השונים וקישורים להרצאות.

ההרצאות במסגרת יום העיון:

מושב א' – מנועי חיפוש – מגמות וחידושים, חיפוש חברתי

היה מנוע ? – מגמות וחידושים במנועי חיפוש
ד"ר אריאל פרנק – המחלקה למדעי המחשב, אוניברסיטת בר-אילן. טלי שרון Sharon-IT
למצגת ההרצאה

"Real Time Search" ומעבר לו: כיוונים בחיפושי מידע ברשתות חברתיות
תמי נויטל, מרכז שה"ם, האוניברסיטה הפתוחה
למצגת ההרצאה

חיפוש חברתי
ד"ר גלעד רביד, המחלקה להנדסת תעשייה וניהול, אוניברסיטת בן גוריון
למצגת ההרצאה

מושב ב' – מנועי חיפוש – מגמות וחידושים, חיפוש ויזואלי, מנועי חיפוש והמשתמש

Innovations in Search
דוד קדוש, מנהל מוצר בכיר בגוגל ישראל

RECOMMENDER SYSTEMS AND SEARCH ENGINES – TWO SIDES OF THE SAME COIN!?
ד"ר ברכה שפירא, ד"ר ליאור רוקח, המחלקה להנדסה וניהול מערכות מידע, אוניברסיטת בן- גוריון
למצגת ההרצאה

לוגים של מנועי חיפוש –יתרונות וחסרונות
פרופ' יהודית בר-אילן, המחלקה ללימודי מידע, אוניברסיטת בר-אילן

מנועי חיפוש ארגוניים –סקירה והמלצות לבחירה
ד"ר עופר דרורי, מנהל אגף מאגרי מידע בשע"ם, יו"ר SIGTRS
למצגת ההרצאה

חיפוש ויזואלי והסיפור של ו"ירא" – תמונת מצב- רקע ומבט לעתיד
אהד גלבוע, "וירא"

מושב ג' – גילוי ידע ואיתור חומר מדעי ואקדמי במשאבי הספרייה

למען הגילוי הנאות
משה עפרון, חברת TDNet

Best Practices in e-Resources Access Management
Tom Edmonds, OpenAthens Product Manager, Eduserv

מושב ד' – מנועי חיפוש ייעודיים בווב החופשי – מולטימדיה וחומר מדעי

מנועי חיפוש אלטרנטיביים בתחום המדיה והמולטימדיה
ד"ר נדב דפני, איש פיתוח אינטרנט, מומחה ביישומי מוסיקה ומחשבים
למצגת ההרצאה

מנועי חיפוש מדעיים חופשיים והווב הנסתר והסמנטי
ד"ר יפה אהרוני, אוניברסיטת תל-אביב, מכללת בית ברל
להרצאה

Base, ScientificCommons , פרוטוקול OAI-PMH וחיפוש חומר אקדמי בווב

החומר האקדמי בווב נמצא בגידול מתמשך , ותנועת הגישה הפתוחה תורמת רבות לתופעה.
בנוסף למנועי חיפוש מדעיים מוכרים של חברות מסחריות כגון: Scirus , Google Scholar, Microsoft Academic Search ו – Q-sensei קיימים מנועי מנועי חיפוש מדעיים של ספריות כגון: BASE – Bielefeld Academic Search של אוניברסיטת בילפלד שבגרמניה ו- ScientificCommons של אוניברסיטת סנט גלן שבשוויץ.

מנועי אינדקס מסחריים דוגמת גוגל סקולר מסתמכים בעיקר על זחלנים שסורקים את הווב.
מנועים מדעיים שפותחו על ידי הספריות כגון Base כוללים באינדקסים שלהם בדרך כלל את מידע העל ממאגרים שמיישמים את פרוטוקול OAI-PMH – Open Archives Initiative Protocol for Metadata Harvesting

פרוטוקול OAI-PMH הושק בשנת 2001 עם החזון לפתח ולקדם סטנדרטים אינטראופרביליים (שיאפשרו למערכות בעלות פלטפורמות שונות מבחינת תוכנה, חומרה ומנשקים, להחליף מידע במינימום אבדן תוכן ופונקציונליות) לצורך הפצה יעילה של מידע.
פותח פרוטוקול לחילופי מידע-על שמבוסס על הפורמט של דבלין קור. הרעיון היה להגיע לתקנון של מידע העל כדי לאפשר יתר גישה ונראות למקורות חבויים שאינם מאונדקסים היטב על ידי מנועי החיפוש הכללים. פרוטוקול זה אומץ על ידי מוסדות שונים ואפשר גישה למקורות מבוזרים.

מודל זה של איסוף המידע מתבסס על 2 שחקנים עיקריים: ספקי המידע וספקי השירות . המידע נאסף מספקי המידע באמצעות פרוטוקול OAI-PMH לאינדקס מרכזי.

מחקרים משנת 2006 ו- 2008 שבדקו את מידת הכיסוי של אוספים במסגרת OAI-PMH במנועי חיפוש כלליים מצאו שהכיסוי חלקי בלבד. יתירה מזו, באפריל 2008 גוגל הודיעה שהיא מצמצמת את תמיכתה בפרוטוקול.לאור העובדות והמחקרים שמלמדים שמנועי חיפוש אינם מכסים או מכסים רק חלקית מאגרים מבוססי פרוטוקול OAI-PMH חשוב לתת את הדעת על אותם מנועי חיפוש ופורטלים מבוססי OAI-PMH כמו OAIster , BASE ו-   ScientificCommons כאשר מחפשים חומר מדעי.

מספר הפרסומים במנועי חיפוש אלה נמצא בגידול מתמשך. על פי דו"ח מרץ 2010 של אוניברסיטת הרווארד, BASE שנחשב למנוע החיפוש הגדול ביותר למאגרים מוסדיים מכסה 1584 ספקי מידע ומחפש בלמעלה מ- 23 מיליון מסמכים, גידול של 1.2 מהרבעון האחרון וגידול של למעלה מ- 13 אלף מסמכים ביום.

ScientificCommons מכסה 1202 מאגרים ומספר הפרסומים בו עולה על 35 מיליון.

BASE
ScientificCommons

חיפוש חברתי – שירותי שאלות ותשובות אנושיים כנגד מנועי החיפוש המסורתיים

לאחרונה קראתי פוסט מעניין של Chris Morrison בנושא מודל חדש של שירותי שאלות ותשובות.

שירותי שאלות ותשובות אינם חדשים. Yahoo החלה את שירותי השאלות והתשובות שלה ב-2005, ואחריו גם גוגל הפעילה שירות דומה. שירותים אלו היו מבוססים על מנועי חיפוש שספקו תשובות תוך שימוש בתכנים מתאימים.

היום מסתמנת מגמה חדשה של שירותי שאלות ותשובות אנושיים. לא מנועי חיפוש שמחפשים באינדקס שלהם אחר תשובות מתאימות, אלא שירותים שיודעים לזהות את האנשים שמתאימים לענות על השאלה ולנתב את השאלה אליהם כדי לקבל תשובות לשאלות.

Aardvark שאותו רכשה גוגל בפברואר 2010 , ושירות השאלות שהחלה facebook לבחון הם שירותים חדשים במסגרת אותה מגמה. Aardvark לדוגמה הוא שירות שמאפשר לשלוח שאלה מהווב, IM , דואר אלקטרוני, טוויטר או IPhone ולקבל עזרה מאדם בעל ניסיון וידע בתחום. Aardvark מנתח את השאלות הנכנסות ומחליט על נושא השאלה, מזהה ברשת החברתית של השואל אנשים מתאימים לענות על השאלה שזמינים ב-IM או בדואל. זיהוי האנשים המתאימים מתבסס על מספר קריטריונים ובראשם הפרופיל שלהם.

Quora שאף הוא מושתת על חיפוש חברתי, הוא מודל קצת שונה עם עיקרון דומה – מאגר של תשובות משתמשים.

שירותים אלה של חיפוש חברתי אמורים לענות של שאלות שמבחינתם של מנועי חיפוש הן מסובכות או לא מספיק חשובות כדי לענות עליהם.

לכתבה בנושא

SimilarSiteSearch – מנוע לחיפוש אתרים דומים

SimilarSiteSearch הוא מנוע לחיפוש אתרים דומים. אפשר להזין URL של אתר מסוים והתוצאות – אתרים דומים לאתר שכתובתו הוזנה .

התוצאות לקוחות מהאינדקס של המנוע שכולל רשימה של אתרים ומידע עליהם, והן מתבססות על דמיון בתגיות ובקטגוריות . הזנת תגיות על ידי המשתמש לתיאור האתר יכולות לסייע בחיפוש.

למנוע מאפיין של ווב 2.0 . הוא מאפשר למשתמש להביע דעה על כל אחת מתוצאות החיפוש. המנוע משתמש במאפיין זה לשיפור תוצאות של חיפושים עתידיים, שכן דעתו של המשתמש נלקחת בחשבון בדירוג התוצאות של חיפושים עתידיים.

במעט החיפושים שערכתי במנוע קיבלתי תוצאות טובות. ערכתי את אותם חיפושים במנוע דומה Siteslike. התוצאות ב- SimilarSiteSearch היו טובות הרבה יותר.

למנוע החיפוש

RankSpeed – כלי לחיפוש ודירוג אתרים ומוצרים תוך שימוש ב"ניתוח סנטימנט " של הבלוגוספירה

ניתוח המידע באתרים של רשתות חברתיות כולל טוויטר נעשה לפעמים באמצעות "ניתוח סנטימנט" – " Sentiment Analysis". שיטה זו מתבססת על הבנת היחס של כותב התוכן לאובייקט מסוים. ניתוח סמנטי כזה, שמכונה לעיתים גם "opinion mining" וגם "emotional polarity computation", מאפשר לנו לדעת מהו יחס הכותבים כלפי אותו אובייקט – מהו אחוז השבחים לעומת התלונות כלפי אותו אובייקט ובכך לקבל רושם כללי על איכותו של האובייקט ומאפייניו – טוב, מצוין , שלילי וכו'

RankSpeed הוא מנוע חיפוש שמסייע לאתר את האתרים והמוצרים הטובים ביותר על ידי ניתוח סנטימנט של הבלוגוספירה / טוויטרספירה.

אסטרטגיית החיפוש כוללת בנוסף למונח/מונחי החיפוש גם מונחים רגשיים סנטימנטליים שהמשתמש בוחר מתוך רשימה מוצעת או מונחים שהוא בוחר להזין כגון: מצוין, קל, שימושי , בעייתי וכו' .

RankSpeed מבצע ניתוח סנטימנט של הבלוגוספירה/טוויטרספירה, מחפש אחרי אזכורים של מונחי החיפוש, מנתח אותם סמנטית כדי להבין את היחס של הכותב כלפי אותו מונח/אובייקט , מדרג את תוצאות החיפוש על פי אזכורים של כל מונח רגשי שהוזן כמילת חיפוש : "מצוין", "שימושי" וכו' ומציג את אחוז המשתמשים שדעתם על המוצר/אתר היא כמונח הרגשי שהוזן בחיפוש "מצוין", "שימושי" וכו' .

מנוע חיפוש זה שמאפשר למשתמש לחוש את המצב ב"שטח", נמצא עדיין בגרסת ביתא ובשלב זה כפי שכתוב באתר המנוע, מאגר המידע של המנוע כולל אתרים ומוצרים פופולריים בלבד. גרסאות עתידיות של RankSpeed ישתמשו במאגר מידע גדול הרבה יותר.

לאתר המנוע
אודות המנוע

Q-Sensei – מנוע מדעי חדש – האם כשמו כן הוא?

Q-Sensei הוא מנוע חיפוש מדעי שנמצא עדיין בגירסת ביתא. נכון להיום על פי מה שמוצהר באתר הוא כולל באינדקס שלו 24 מיליון מאמרים מדעיים ו- 11.5 מיליון ספרים. המטרה המוצהרת של המנוע לאפשר אחזור מידע לא רק מספרים וכתבי עת אלא גם מבלוגים חדשות ויישומי וויקי.

תוצאות החיפוש כוללות תקציר, פרטים ביבליוגרפיים, וקישור למקור – לא תמיד הטקסט המלא חופשי, לעתים אפשר לקבל את הטקסט המלא, במקרים אחרים מוצעת האפשרות לרכוש את המאמר. אפשר לעדן את תוצאות החיפוש על פי סוג מסמך, מילות מפתח נוספות, שנה, ומחבר. המנוע מציע למשתמש נושאים קרובים ומאמרים נוספים של מחברי המאמר. יש במנוע מאפייני וויקי – קיימת אפשרות למשתמשים להוסיף סקירה ולערוך את פריט המידע, לראות את הגרסה המקורית ושאר הגרסאות.

הרשמה חופשית למנוע מאפשרת שימוש בספרייה אישית בה אפשר לשמור את תוצאות החיפוש ואת אסטרטגיות החיפוש.

מאפייניו של המנוע נותנים למשתמש תחושה של חיפוש במאגר מידע ביבליוגרפי עם מאפייני וויקי יותר מאשר במנוע חיפוש רגיל.

שמו של המנוע משקף את חזונו- השם לקוח מהמילה היפנית Sensei שמשמעותה – מדריך, יועץ, מורה רוחני בעל ניסיון שרגיש לצרכים של אלה שאותם הוא מדריך ושואף לפתור את בעיותיהם. מנוע החיפוש כאמור נמצא עדיין בשלב ביתא והמשתמשים מתבקשים להציע הצעות לשיפורים.

למנוע
שאלות נפוצות

2lingual – לחפש בגוגל בשתי שפות בו זמנית

2lingual – אתר המאפשר לחפש בגוגל בשתי שפות במקביל.
האתר מאפשר לחפש ביטויים ב-52 שפות רבות ומגוונות, כולל עברית, אנגלית, רוסית, צרפתית, ערבית, יפנית, סינית, רומנית, פולנית ואפילו יידיש  (לרשימה המלאה). כל מה שצריך לעשות הוא לבחור את שתי השפות הרצויות ולהקליד בתיבה המיועדת לאחת השפות את הביטוי הרצוי. הביטוי מתורגם אוטומטית לשפה השנייה והאתר מציג את התוצאות מגוגל בשתי השפות בשתי עמודות מקבילות. כרגע ניתן לבצע חיפושים ב-2704 קומבינציות של חיפוש  ב-52 השפות.
היתרון של 2lingual הוא שהתרגום מתבצע בזמן אמת, במהלך ההקלדה. התוצאות מגוגל מופיעות גם כן ישירות בזמן ההקלדה מבלי שהמשתמש יצטרך ללחוץ על כפתור כלשהו. דבר זה חוסך זמן ומייעל את תהליך החיפוש.

יש לשים לב, שמכיון שמדובר בתרגום מכונה (באצעות תוכנת מחשב) ולא אנושי, איכות ורמת התרגום רחוקה מלהיות מושלמת ויחד עם זאת זה יכול להיות כלי עזר מצוין ללימוד שפה.

על האתר קראתי ב: האתר הנבחר PicOnline

Samepoint – מנוע חיפוש ייעודי לפלטפורמות חברתיות

Samepoint הוא מנוע חיפוש בזמן אמת ייעודי לפלטפורמות חברתיות. הוא מחפש בפלטפורמות שונות שמסווגות על פי מספר קטגוריות:
• פלטפורמות של מיקרו בלוגים כגון Twitter
• פלטפורמות של וידאו כגון YouTube ו- DailyMotion
• אתרי סימניות כגון Digg ו- Delicious
• בלוגים
• פלטפורמות וויקי
• רשתות חברתיות כגון: facebook , Myspace ו- Hi-5
• רשתות B2B כגון : Linkedin ו- Plaxo
• קבוצות דיון כגון: Google Groups ו- Yahoo Groups
• אתרי שאלות ותשובות כגון: Yahoo Answers ו- Yedda
• אתרי Life Casing כגון DaveTV
• אתרי סקירה כגון Yelp ו- CitySearch
• פודקאסטים
• מסמכים
• תמונות
• חדשות
• ארועים
• אתרי ווב

אפשר להגביל מראש את החיפוש וגם לעדן את תוצאות החיפוש על פי כל אחת מהקטגוריות. מנשק התוצאות של המנוע ידידותי למשתמש.  ליד כול אחת מתוצאות החיפוש אייקון שמלמד מאיזה מקור לקוחה התוצאה. אפשר ממסך התוצאות להגביל את השאילתה רק לאותו מקור. בנוסף לתיאור קצר על האתר, שאליו מובילה כל אחת מתוצאות החיפוש, מוצג ליד כל אחת מתוצאות החיפוש גם מספר לא מבוטל (כ-20) של מילות מפתח.

קיימת אופציה לתרגם כל אחת מתוצאות החיפוש למספר שפות. עברית אינה כלולה ברשימת השפות . קיימת אופציה לשלוח את התוצאה ל- twitter .

באתר יש מדריכי וידאו על המנוע.

UK PubMed Central – שירות חופשי חדש למידע ביו-רפואי

UK Pubmed Central הוא שירות חופשי למידע ביו-רפואי שעדיין נמצא בשלב ביתא.
השירות פותח תוך שיתוף פעולה עם חוקרים בתחום הביו-רפואי באנגליה.
נכון להיום, כפי שכתוב באתר, השירות מאפשר חיפוש ב:
• למעלה מ- 1.7 מיליון מאמרים חופשיים בטקסט מלא בתחום הביו-רפואי
• 19 מיליון תקצירים של Pubmed
• דיסרטציות מאנגליה בתחום הביו-רפואי
• מדריכים קליניים
• מאגרי פטנטים באירופה
• מאגרי מידע – Agricola, Chinese Biological Abstracts ו- Citeseer

בעתיד הכוונה להעשיר את השירות במקורות מידע נוספים ולשפר את החיפוש על ידי שימוש בטכנולוגיות מתקדמות של כריית מידע.

השירות כולל מנשק חיפוש בסיסי לחיפוש בכל מקורות המידע מתיבת חיפוש אחת, ומנשק לחיפוש מידע מתקדם שמאפשר להגביל את החיפוש על פי סוג מקור, כותר, מחבר, כתב עת, MeSH ולמיין את התוצאות על פי רלוונטיות ותאריך.

נשאלת השאלה – במה שונה שירות זה מ- Pubmed ובמה שונה הוא מ- Pubmed Central – תשובה על כך ועל שאלות נוספות שנוגעות לשירות אפשר למצוא בשאלות הנפוצות שבאתר.

אל האתר

BioMedSearch.com – מנוע חיפוש ייעודי מקיף לתחום הביו-רפואי

BioMedSearch.com הוא מנוע חיפוש ייעודי מקיף לתחום הביו-רפואי. המנוע חופשי לכל. הוא מחפש ב-Pubmed ובמקורות מהימנים נוספים, שכוללים גם אוסף של תזות ודיסרטציות . אפשר לחפש בכל המקורות ואפשר להגביל את החיפוש ל-Pubmed או למסמכים מהמקורות האחרים.

המנוע כולל מנשק חיפוש בסיסי ומנשק חיפוש מתקדם.
מנשק החיפוש המתקדם כולל שתי אופציות:
חיפוש מהיר שכולל טופס מובנה עם הרבה מאוד הגבלות כגון: תאריך, כותר, תקציר, מחבר ראשון ואחרון, כתב עת, כרך, גיליון ועמודים, Mesh , סוג מסמך (כ- 60 סוגי מסמכים) ושדות נוספים כמו השתייכות מוסדית, מספר מענק ושפה.
• חיפוש למומחה עם אפשרות לחיפוש מתקדם בשפת פקודות .

באתר מדריך מפורט שכולל מידע מפורט על השימוש במנשקי החיפוש השונים, השימוש בשפת הפקודות, שדות, אופרטורים, מיון התוצאות ועוד..

קיימת במנוע גם אופציה לדפדף על פי אשכולות ותתי אשכולות.

הרשמה חופשית למנוע מאפשרת שימוש במאפיינים נוספים של מנוע החיפוש כגון: אפשרות לקבל שירותי עדכון (alerts ), שמירת חיפושים ומסמכים, הוספת הערות, יצוא לתוכנות ביבליוגרפיות ושיתוף מסמכים עם שאר החברים הרשומים.

בכוונת מפתחי המנוע להתמיד בהשבחתו, וכל מי שיש לו הצעות לשיפורים יוכל לעשות זאת בטופס שמיועד לכך .

 

 

DocJax – מנוע חיפוש ייעודי למסמכים בווב החופשי

docjax מנוע חיפוש שנמצא עדיין בגרסת ביתא לחיפוש מסמכים בווב החופשי . מחפש מסמכים בפורמטים: DOC, PDF, XLS, PPT עם אופציה להורדת המסמכים.

בתוצאות החיפוש מתקבלת רשימה אחת עם כל הקבצים . יש אפשרות לעדן את תוצאות החיפוש על פי סוג אחד של מסמכים.

מאפיין מיוחד שיש למנוע היא האופציה לראות את המסמך לפני שמורידים אותו . ליד כל אחת מתוצאות החיפוש צלם לציון הפורמט של המסמך .המנוע כולל כמה מאפיינים של ווב 2.0 כגון: אפשרות לציין חוות דעת חיובית של המשתמש על התוצאה על ידי לחיצה על הכפתור "love it", דפדוף בענני תגיות, אפשרות לראות את החיפושים האחרונים שנעשו במנוע, חיפושים פופולריים ביותר ועוד..

האפשרות לחפש את כל סוגי המסמכים בו זמנית והאופציה לצפייה מוקדמת במסמך מהווים יתרון על פניי חיפוש קבצים בגוגל או ביאהו . טכנולוגית AJAX בא משתמש המנוע תורמת לידידותיות השימוש בו והיא כנראה העניקה לו את שמו.

במעט החיפושים שערכתי במנוע קיבלתי תוצאות רלוונטיות טובות.

לאתר המנוע

Bookase – מנוע חיפוש להשוואת מחירי ספרים בחנויות ספרים מקוונות

Bookase הוא שירות חופשי בווב שמשווה מחירי ספרים משומשים וחדשים בחנויות מקוונות ברחבי העולם, שכוללות למעלה מ- 150 מיליון ספרים.

במנשק החיפוש הבסיסי אפשר לחפש לפי ISBN , מחבר או מילות מפתח. בחיפוש המתקדם אפשר לחפש גם על פי כותר. אפשר גם לדפדף על פי קטגוריות נושאיות.

במנשק תוצאות החיפוש, לחיצה על הכפתור "compare prices" מציגה רשימה המשווה את מחירי הספרים בחנויות השונות , כולל מצב הספר (חדש, משומש) , דמי משלוח וקישור לחנות המקוונת דרכה אפשר לרכוש את הספר. כפי שמצוין באתר דמי משלוח כדאי לבדוק בחנות עצמה.

רשימת הספרים מחולקת על פי מספר קטגוריות : ספרים זולים ביותר, ספרים שימושיים, ספרים חדשים וספרים להשכרה.

רכישת הספרים מתבצעת דרך חנויות הספרים. Bookase הוא רק שירות מכוון.

לאתר המנוע

Microsoft Academic Search – מנוע חיפוש מדעי חדש /מחודש

מיקרוסופט השיקה לאחרונה מנוע חיפוש מדעי חדש, שנמצא עדיין בשלב ביתא – Microsoft Academic Search.
כאשר נחפש חומר מדעי – מאמרים, חוקרים, כנסים וכתבי עת כדאי לזכור גם אותו.

בחיפוש הבסיסי אפשר לחפש על פי כל אחת מ-4 הלשוניות שמייצגות קטגוריות -אובייקטים: papers, authors, conferences, journals, ולהגביל את החיפוש על פי שנים. על פי מה שכתוב באתר המאגר של המנוע מכסה 3,947,446 papers שלקוחים מכנסים וכתבי עת.

אם נחפש על פי קטגוריה מסוימת נקבל בצד תוצאות החיפוש גם את ה-"related" על פי כל אחת משלושת הקטגוריות האחרות- מאפיין שיכול לסייע בחיפוש חומר נוסף. כך למשל אם נחפש "papers" בצד תוצאות החיפוש יוצגו "related authors" "related conferences " ו- "related journals".

הקלקה על כל אחת מתוצאות החיפוש תציג לנו מידע מפורט על אותו אובייקט. כך למשל הקלקה על המאמר תציג את התקציר של המאמר , קישורים להורדת המאמר וביבליוגרפיה. הקלקה על שם המחבר תציג פרטים על המחבר, חיבוריו והצגה וויזואלית של המחברים השותפים שלו.

בחיפוש המתקדם קיימות אופציות הגבלה נוספות בנוסף למילות מפתח. אפשר לחפש גם על פי כותר, מחבר, כנס, כתב עת ותאריך. אבל , כאשר ניסיתי לחפש בטופס החיפוש המתקדם ביטוי שכולל יותר ממונח אחד קיבלתי הודעת שגיאה.

קיימת גם אופציה לדפדוף על פי 23 קטגוריות נושאיות בתחום מדעי המחשב. נראה שהמאגר של המנוע עדיין מצומצם יחסית לגוגל סקולר למשל, וכפי הנראה הוא מוגבל עדיין לכיסוי תחומי ידע מסוימים, אך מנשק התוצאות שלו מעניין ויעיל.

נקווה שהפעם הוא ישמש אותנו ביעילות, וגורלו יהיה שונה מקודמו Windows Live Academic שהושק באפריל 2006 ונסגר במאי 2008.

למנוע החיפוש

חיפוש מידע בזמן אמת בטוויטר ובווב החברתי בכלל – SearchTastic ו- LeapFish

ההתפתחויות בווב הפכו אותו למקום בו אנשים יוצרים ומשתפים מידע – והמידע הוא מידע חברתי ובזמן אמת. ב- LeapFish מגדירים את הווב החדש כ- Living Web ומנוע החיפוש שהוא מנוע-על עוצב בהתאם, כשירות שבא לסייע לחיות את הווב החדש.

LeapFish מחפש במספר רב של מקורות מסורתיים וחברתיים: Google, Yahoo, Bing, YouTube, Twitter, Image Authorities, Blog Authorities, Wikipedia, Yelp, Digg, CyberHomes, Yahoo Answers, Amazon ועוד. אפשר למקד את החיפוש לחיפושים בזמן אמת על ידי לחיצה על הלחצן "real search" . הרבה תוצאות חיפוש באופציה זו יהיו מ- Twitter. מידע נוסף על האופן בו עובד המנוע אפשר למצוא באתר המנוע

מנוע חיפוש נוסף לחיפוש מידע בזמן אמת הוא SearchTastic
SearchTastic הוא מנוע חיפוש חדש (הושק באוקטובר 2009 ) בגרסת ביתא לחיפוש ב- Twitter. היתרון שלו על פני מנוע החיפוש של Twitter הוא במידת הכיסוי. בעוד שמנוע החיפוש של Tweeter מחפש "ציוצים" מהשבוע או השבועיים האחרונים בלבד, SearchTastic מחפש גם ציוצים "היסטוריים".

כך למשל, במספר חיפושים שערכתי במנוע החיפוש של Twitter קיבלתי תוצאות מ- 8 ימים אחרונים בלבד. לעומת זאת כאשר ערכתי חיפושים זהים ב- SearchTastic קיבלתי תוצאות גם מעשרת החודשים האחרונים, ולעתים זה חשוב למשתמש.

ליד כל אחת מתוצאות החיפוש אפשר לראות את המשתמש ה"מצייץ" ואת האנשים שהוא עוקב אחריהם, באופן זה אפשר לאתר מידע בנושא מסוים, אם מאתרים את המשתמש שמומחה בנושא.

מאפיין נחמד במנשק המנוע הוא הצגת נושאי החיפוש הפופולריים ביותר ב- 24 השעות האחרונות בצורת ענן תגיות.

המנוע מספק גם מידע על 100, 200, 300 ו- 400 המשתמשים בעלי מספר ה"עוקבים" הגבוה ביותר.

בהשוואה בין חיפושים ב-Twitter – שבוצעו במנוע זה, במנוע החיפוש של Twitter ובמנועי החיפוש הגדולים – גוגל, יאהו, ובינג – SearchTastic קיבל את הציון הגבוה ביותר.

ל-SearchTastic
ל- LeapFish

Quertle – מנוע חיפוש סמנטי ביו-רפואי

QuertleQuertle הוא מנוע חיפוש סמנטי ביו-רפואי שמשתמש באונטולוגיה של מונחים מהתחומים: ביולוגיה, רפואה וכימיה. הוא מכסה, נכון להיום, את Medline/Pubmed וכתבי העת של Pubmed Central ובעתיד יכסה מקורות נוספים.

מנוע חיפוש זה מחפש קשרים – כלומר הוא מחפש מסמכים שבהם מונחי השאילתא מופיעים בהקשר מסוים, כך למשל, אם מונחי השאילתא הם מיגרנה וקפה – תוצאות החיפוש יכילו מסמכים ששני המונחים מופיעים בהקשר מסוים כגון "השפעת הקפה על מיגרנה" – באופן זה מאוחזרים המסמכים הרלוונטיים ביותר.

Quertle  מבצע גם חיפוש פשוט שכולל את כל המסמכים בהם מופיעים מלות החיפוש ולאו דווקא את אלה הכוללים קשרים ביניהם, אך תוצאות אלו יופיעו בנפרד.

מאחר שהמנוע משתמש באונטולוגיה של מונחים לא צריך לחשוב על כל המילים הנרדפות של מונח מסוים, שכן מנוע החיפוש מוצא אותם באופן אוטומטי.

מנוע החיפוש תומך ב- "Power Terms " – מונחים שמייצגים קבוצה של אובייקטים. כך למשל proteins $ מיצג כל פרוטאין שהוא ולא את המונח protein.

אפשר להוסיף שם של מחבר מסוים או פרסום מסוים כדי להגביל את החיפוש למסמכים של אותו מחבר או פרסום.

תוצאות החיפוש כוללות קישורים לטקסט המלא , אם הוא חופשי או נגיש במסגרת מנוי.

מנוע החיפוש בשלב זה תומך רק באנגלית, ואינו תומך בשאילתות בוליאניות מורכבות.

מידע נוסף על מאפייניו של המנוע והשימוש בו אפשר למצוא בעזרה שמספק המנוע ובשאלות הנפוצות שבאתר המנוע.

לאתר המנוע

דור שני של מנועי חיפוש תמונות – חיפוש תמונות דומות ב-GazoPa ובגוגל

בזמנו כתבתי על מנוע החיפוש GazoPa – מנוע חיפוש תמונות שמשתמש בטכנולוגיה מתקדמת של ניתוח תמונה כדי לחפש תמונות דומות. טכנולוגיה זו מאפשרת לחלץ מידע מהתמונה כמו צבע וצורה, ועל פי מידע זה המנוע מחפש תמונות דומות ממאגר המידע שלו.

בזמנו המנוע היה בגִּרְסַת בֵּיתָא סגורה. היה אפשר להירשם ולהמתין בתור עד למתן אישור הצטרפות.

ב- 27 באוקטובר 2009, לאחר למעלה משנה מאז השקתו בגרסת ביתא סגורה, הצהירה Gazopa על גרסת ביתא פתוחה של המנוע.

בשל הטכנולוגיה בה משתמש המנוע, למשתמש יש מספר אופציות נוספות לחיפוש בנוסף לחיפוש המקובל על פי מילות מפתח. המשתמש יכול לחפש גם על פי תמונה מקובץ (גודל הקובץ שניתן לטעון הוא עד 4 מגה-בית) או מכתובת ב- WEB, או תמונה שצייר. כמו כן אפשר לבקש הצגה רנדומלית של תמונות ומהן לבחור תמונה, כדי לקבל תמונות דומות לה. חיפוש התמונה הדומה נעשה על פי מספר פרמטרים שמהם בוחר המשתמש פרמטר אחד כמו צבע או צורה. ניתן לחפש תמונה דומה גם מכל אחת מהתמונות שמתקבלות בתוצאות החיפוש.

האינדקס של המנוע נוצר על ידי סריקה קבועה של דפי ווב על ידי הרובוט  GazoPabot.

שלוש שעות בלבד אחרי ש-Gazopa הודיעה על גרסת הביתא הפתוחה של מנוע החיפוש שלה, גוגל הצהירה על שחרורו מהמעבדה של מנוע חיפוש תמונות דומות שלה. חיפוש תמונות דומות הוא מעתה מאפיין קבוע בגוגל תמונות – "find similar images " מתחת לכל תמונה בתוצאות החיפוש.

למנוע החיפוש Gazopa
להצהרה על גרסת הביתא הפתוחה של Gazopa
מנוע חיפוש תמונות דומות של גוגל במעבדה
ההצהרה של שחרורו מהמעבדה של מנוע חיפוש תמונות דומות של גוגל

DiscoverEd – מנוע חיפוש ייעודי למקורות מידע בתחום החינוך

מקורות מידע בתחום החינוך אפשר למצוא בשפע ברשת האינטרנט. הבעיה היא למצוא את המקורות המתאימים.

מנועי החיפוש הפופולריים משתמשים לרוב לצורך אחזור המידע באינדקס שכולל את הטקסט ובקישורים שנמצאים בדפים. זה עובד היטב לגבי מידע כללי, אבל מחנכים זקוקים לחומרים מסוימים בעלי מאפיינים שונים כגון: קהל יעד של החומרים, זמן השיעור, שלב הלימודים לו מתאימים החומרים וכו'. בשל האופן בו מתבצע אחזור המידע במנועים הכלליים לא תמיד התוצאות למטרות אלו הן רלוונטיות.

אחזור ממידע מובנה – כלומר מידע אליו מוצמד מידע-על – תוויות שמסייעות לתוכנה להבין מה הכוונה – יכול להוות פתרון לבעיה. בעיה נוספת היא הבטחת איכות של תוצאות החיפוש.  הכללתם של מקורות מידע איכותיים בלבד באינדקס מהווה פתרון לבעיה זו.

על כך חשבו ב- ccLearn כאשר פיתחו את DiscoverEd – אב טיפוס של כלי חיפוש ייעודי לתחום החינוך שהאינדקס שלו משלב בין שני אינדקסים – אינדקס שכולל טקסט מלא ואינדקס של מידע-על metadata שנאסף ממקורות שונים שתומכים ב- RSS/Atom feeds ,פרוטוקול OAI-PMH וכו' . – שני האינדקסים נוצרו בצורה ממוכנת על ידי זחלן.

כאמור המידע באינדקס לקוח ממקורות מידע איכותיים כגון: NSDL , OER ומוסדות ששייכים ל- OpenCourseWare Consortium.

תוצאות החיפוש מוצגות עם מידע נוסף הנוגע לזכויות היוצרים, מקור, לאיזה רמת חינוך מתאים פריט המידע , שפה ולרוב גם תגיות נושא. מידע זה מוצג בשדות קבועים שמצורפים לתוצאות החיפוש: License, Curator, Education level, Language, Subject area. יש לציין שלא תמיד השדות המוצגים כוללים מידע.

למנוע החיפוש
דו"ח של ccLearn ובו מידע מפורט על ההיבט הטכנולוגי של DiscoverEd

LigerCat – כלי מידעני חדש – תצוגה מעניינת של תוצאות החיפוש ב-Pubmed

LigerCat – Literature and Genomics Resource Catalogue הוא מנוע חיפוש מעניין לחיפוש מידע במאגר הרפואי Pubmed שמתבסס על ה-Mesh.

ה- MESH – Medical Subject Heading – כותרי נושא – היא שפה מבוקרת שפותחה ומתוחזקת על ידי הספרייה הרפואית הלאומית של ארה"ב ומשמשת למפתוח ספרות ביו-רפואית.
LigerCat מציג את תוצאות החיפוש בצורת ענן תגיות של כותרי הנושא Mesh שקיבלו תוצאות החיפוש. ענן התגיות משקף את התכיפות בה הופיעו המונחים המבוקרים השונים בתוצאות החיפוש, כאשר מונח מבוקר עם הרבה מופעים מוצג בגדול. באופן זה המשתמש מקבל תמונה ויזואלית על הקשרים בין מונח החיפוש שלו ומונחים אחרים מתוך ה-MESH.

לחיצה על אחד ממונחי ה- MESH שמופיעים בענן התגיות תציג את תוצאות החיפוש ב- Pubmed של מונח זה בהצלבה עם מונח החיפוש. בחירה ביותר ממונח אחד תציג את כל המאמרים ב- Pubmed שתויגו במונחים אלו, כולל מונח החיפוש.

המנוע מאפשר את הגבלת החיפוש לכתבי עת, מאמרים וגנים.

LigerCat פותח במסגרת פרויקט biology of aging של ספריית MBLWHOI

ולמי שמעוניין לצטט כלי זה- עלפי ההנחיות באתר, הציטוט הנכון הוא:
Schenk R, Sarkar IN. LigerCat. Woods Hole (MA): Biology of Aging, MBLWHOI Library, MBL; 2008. Available from: http://ligercat.ubio.org.

מנוע זה מדגיש את חשיבות אופן הצגת התוצאות במרכיביו של מנוע חיפוש כלשהו.

למנוע
  על פרויקט biology of aging במסגרתו פותח LigerCat ושאר היזמות של ספריית MBLWHOI

WIKI – לחיפוש מידע באנציקלופדיות ואתרי וויקי

Wiki הוא מנוע-על מותאם אישית מבוסס גוגל לחיפוש באנציקלופדיות ואתרי וויקי.
בנוסף לחיפוש הכולל בכל המקורות אפשר למקד את החיפוש לאנציקלופדיות, לאתרי וויקי עצמאיים, ולוויקיפדיה.

אין פירוט באתר של רשימת המקורות בהם מחפש המנוע. תוצאות החיפוש של מספר חיפושים שערכתי כללו מידע מתוך מקורות אנציקלופדיים ידועים כגון: בריטניקה, InfoPlease  ,Encyberpedia ווויקיפדיה, וגם מתוך אתרי וויקי פחות מוכרים שדווקא בהם מצאתי חומר רלוונטי ועדכני.

לאתר המנוע