New Pubmed search – השילוב בין Pubmed ו- Hakia

בזמנו כתבתי בבלוג על מנוע החיפוש הסמנטי Hakia. Hakia משתמש בשיטה המיוחדת לו לאחסון וניתוח סמנטי של מסמכים אלו לצורך אחזורם.

מנוע החיפוש HAKIA מחפש בסגמנטים שונים: ווב, חדשות, בלוגים וידאו תמונות ועוד . בחלק מהסגמנטים הוא משתמש בשיטה שנקראת QDEX – Query Detection and Extraction ואשר מחליפה את השיטה המקובלת ליצירת אינדקס. על פי השיטה המקובלת ליצירת אינדקס שמכונה קובץ מהופך –inverted file – האינדקס כולל את המונחים המופיעים בטקסט, ומצביעים אל מונחים אלה מהווים בתהליך אחזור המידע שערי גישה למסמכים. אם נשתמש בשיטת הקובץ המהופך גם להוספת קשרים סמנטיים ייווצר מבנה שיכביד מאוד על הביצועים. בשיטה החדשה של מנוע החיפוש Hakia, לעומת זאת, שערי הגישה לדפי ה-Web אינם מצביעים למלים אלא לשאילתות. המנוע מנתח באמצעות אלגוריתם מתוחכם את כל השאילתות האפשריות בדפי ה- Web והשאילתות מהוות שערי גישה לדפי ה- Web. באופן זה בעת אחזור המידע המנוע עובד על סטים קטנים יחסית של דפי Web ורק עליהם הוא מבצע את הניתוח הסמנטי. בכך נפתרת בעיית המשאבים הרבים שנדרשים לביצוע ניתוח סמנטי על מספר רב של דפים. על פי התיעוד באתר ביצוע הניתוח הסמנטי ודירוג התוצאות מתבצע באמצעות אלגוריתם מתוחכם SemanticRank שעושה שימוש גם באונטולוגיות.

טכנולוגיה סמנטית זו מיושמת על מאגר המידע הביורפואי Pubmed הולידה את מנוע החיפוש New Pubmed search. מנוע זה הוא מנוע חיפוש חופשי וכפי שנכתב באתר מחפש בלמעלה מ- 20 מיליון תקצירים של המאגר הרפואי PUBMED ובזכות הטכנולוגיות הסמנטיות בהן הוא משתמש אפשר לקבל תשובות רלוונטיות יותר לשאילתות שמבקשות לתת מענה על קשרים בין משתנים שונים. דוגמאות אפשר למצוא באתר.

בדוגמאות אלו אפשר לקבל גם את התוצאות במנוע זה בהשוואה לאותן שאילתות ב- Pubmed .

הטכנולוגיה בה משתמש המנוע ומכאן מאפייניו הייחודיים שלו כגון: טיפול בוריאציות מורפולוגיות, במילים נרדפות, טיפול בהכללה בצורה נכונה, הבנת המשמעות של המילים, טיפול נכון בשאילתות בשפה טבעית ואפשרות להזנת השאילתה באופן חופשי ללא צורך באופרטורים מיוחדים הם אחראים על פי מפתחי המנוע להבדלים.

moodיישום נוסף שמוזכר באתר של Hakia הוא MoodTRADE .- כלי להשקעות שמאפשר למשתמשיו לעקוב בזמן אמת אחרי חדשות של חברות. שלא כמו New Pubmed search יישום זה אינו חופשי.

ל- New Pubmed search

סרגיי ברין המייסד של גוגל בראיון על הסכנות האורבות לווב

סרגיי בריןבראיון ל-The Guardian סרגיי ברין מייסדה של גוגל מדבר על הסכנות האורבות לווב והמתקפות על רשת האינטרנט הפתוחה.

מנועי חיפוש מסתמכים בעיקר על טכנולוגיות של סריקת הווב הפתוח ומנוע החיפוש של גוגל נוסד באווירה של פתיחות זו.

היום כמה גורמים מהווים מתקפה על הווב הפתוח: צמיחתם של יישומים סגורים כמו פייסבוק, ואפליקציות סגורות של אפל שהמידע בשניהם חסום בפני בשרתים של גוגל.

גורם נוסף שפוגע בפתיחות המידע הוא הצנזורה של ממשלות מסוימות כגון סין ואירן על המידע וגם היבטים שונים שקשורים לתחיקה בארה"ב כמו SOPA ו-PIPA מהווים "ירייה עצמית ברגל".

גורלם של מנועי החיפוש כולל גוגל נקשר באופן טבעי לגורלו של הווב הפתוח וגוגל בנסיונה לחלץ עצמה מן המשוואה אינה עוד רק חברה לחיפוש וסריקה של מידע בווב .

 

 

zuula ו- Silobreaker – מנועים שכדאי לזכור

לעתים נרצה לקבל תוצאות מכמה מנועי חיפוש מבלי ל"טייל" בין האתרים השונים. במקרה כזה כדאי לזכור את zuula – רב מנוע שמחפש במספר רב של מנועי חיפוש ומציג ממסך אחד את תוצאות החיפוש מכול אחד ממנועי החיפוש על פי בחירת המשתמש. מנועי החיפוש בהם מחפש המנוע הם:

Google, Bing, Yahoo, Gigablast, Exalead, Alexa, Entireweb, Mahalo, Mojeek

מבחינת חומרים אפשר מראש להגביל את תוצאות החיפוש לאתרי ווב, תמונות, וידאו, חדשות בלוגים וגם לסנן את תוצאות החיפוש על פי מנוע מסוים.

מנוע שימושי חופשי נוסף לחדשות ומקורות מידע חברתיים הוא Silobreaker.com . אפשר להגביל את החיפוש לחדשות, דוחות, הודעות חדשותיות, בלוגים, וידאו ו- fact sheets

MedWorm – מנוע חיפוש לעדכוני RSS בתחום הרפואה

MedWorm הוא מנוע חיפוש לעדכוני RSS בתחום הרפואה, אמנם לא חדש אבל כדאי לזכור אותו. נכון להיום על פי מה שנכתב באתר הוא אוסף עדכוני RSS מלמעלה מ- 6000 מקורות מהימנים בנושאים רפואיים .

הרבה עדכוני RSS לקוחים מכתבי עת רפואיים, אתרי חדשות, ארגונים ממשלתיים ואגודות רפואיות.

המטרה כפי שמוצהרת באתר היא לכלול עדכוני RSS מכל כתבי העת הרפואיים המקוונים.

המנוע כולל גם עדכוני RSS מבלוגים רפואיים אך החיפוש בהם הוא בנפרד.

הכללת עדכוני RSS נעשית על פי הצורך בהתייעצות עם מומחה מקצועי.

אפשר לדפדף באתר על פי קטגוריות נושאיות ואפשר לחפש – בחיפוש פשוט ומתקדם. אפשר לצמצם את החיפוש מראש לחדשות, מחקרים, בלוגים, פודקסטים, וידאו, אירועים, ניסויים קליניים ועוד.

מן הראוי לציין שהמפתח של MedWorm הוא Frankie Dolan שפיתח באותה מתכונת את מנוע החיפוש הספרני – LibWorm שכיום מושבת .

למנוע החיפוש

Sehrch – מנוע חיפוש סמנטי חדש

מנועי חיפוש מסורתיים הם מנועי חיפוש של מסמכים – דפים, תמונות או קובצי וידאו שמובנים לבני אדם אך לא למחשבים. מסמכים אינם מתארים זהויות באופן שמובן למכונות – מחשבים.

Sehrch לעומת זאת כולל אובייקטים. אובייקטים יכולים להיות מגוון דברים אמיתיים – אדם, עיר, אירוע . לאובייקטים יש תכונות כך למשל לאדם יש שם ותאריך לידה, למוסד יש תאריך ייסוד. לאובייקטים יש יחסי שייכות – כך למשל אדם אחד יכול להיות הורה של אדם אחר.

Sehrch  הוא מנוע חיפוש סמנטי חדש שהחיפוש בו  באובייקטים הוא חיפוש מובנה . המסמכים הרלוונטיים נדלים בעזרת יצירת תבניות שמושתתות על התכונות של האובייקטים. מאחר שחיפוש אובייקטים אינו מתאים לכל השאילתות המנוע משלב בין חיפוש אובייקטים ומסמכים על פי הצורך.

באתר יש הוראות כיצד ליצור חיפוש מובנה. ונכון להיום הוא כולל רשימה של 130342 תכונות של אובייקטים ו- 249777 סוגי אובייקטים שניתן באמצעותם לבנות שאילתות מובנות. כמו כן אפשר למצוא באתר דוגמאות לחיפוש לא מובנה, חיפוש מובנה למחצה וחיפוש מובנה על פי שדות , כך למשל החיפוש name:Justin type:Person הוא חיפוש מובנה, לעומת זאת החיפוש Justin הוא חיפוש לא מובנה והחיפוש Justin type:person הוא חיפוש מובנה למחצה.

במעט החיפושים שערכתי במנוע קיבלתי תוצאות מבטיחות , אך יש לזכור שהמנוע עדיין בגירסת אלפא וניסיון המשתמשים ומשוב מהם יסייע בפיתוחו.

 

 

שיעורים וחומרי הוראה והדרכה חופשיים ברשת

מספר מקורות ה- OER – מקורות לימוד והוראה חופשיים לשימוש, שימוש מחודש ושיתוף, הולך וגדל. בזמנו כתבתי בבלוג על מספר אתרים שכוללים מידע כזה ביניהם הרשת לחומרי למידה OER COMMONS – מקור חופשי עשיר לחומרי לימוד והוראה ואתרים נוספים.

מאז נוספו מקורות מידע חדשים ויזמות ומודלים חדשים בתחום. דוגמאות למספר יזמות, פלטפורמות ומודלים אחרונים ומתפתחים בתחום:
Mathematics Coaching Consortium – כולל שיעורים בחשבון, אלגברה וגיאומטרייה, מצגות powerpoint ומקורות מידע כלליים. מודל זה בא לתרום לידע של המורים ולעודד שיתוף פעולה.

חברות סטרט-אפ, בדרך כלל יזמות של מרצים וסטודנטים , שמציעות קורסים חופשיים לדוגמה:
Udacity – פלטפורמה חופשית שראשיתה ב- 20 למרץ 2012 ביוזמתו של פרופסור מאוניברסיטת סטנפורד . הפלטפורמה כוללת קורסים בנושאים שקשורים למדעי המחשב.

Coursera – פלטפורמה שפותחה אף היא על ידי מרצים מאוניברסיטאות בארה"ב – אוניברסיטת מישגן, סטנפורד , ברקלי קליפורניה – הקורסים הם בעיקר בנושאי מחשבים , הנושא אנטומיה נמצא בשלבי פיתוח.

GoodSemester– פלטפורמה שראשיתה בפרוייקט של סטודנט.שמטרתה להוות שירות מקוון בענן ללמידה מסוג חדש , לא רק קורסים חופשיים אלא גם פלטפורמה חופשית לבנית קורסים

Faculty Project של Udemy – פלטפורמה שמציעה קורסים מקוונים וחומרים נוספים, רובם חינם, על ידי מיטב המרצים באוניברסיטאות בארה"ב

בבואנו לאתר חומרי למידה ברשת שמספרם הולך וגדל כדאי לזכור מנועי חיפוש ייעודיים לכך, שגם מספרם גדל.
רשימה כזו של מנועי חיפוש אפשר למצוא ב- WikiEducator. מספר דוגמאות למנועי חיפוש כאלה : OpenCourseWare Finder, OER Recommender, Universal Education Search ואחרים.

מנוע חיפוש חדש לחומרי למידה שנמצא עדיין בגרסת אלפא הוא Gooru.

V like Vintage מנוע חיפוש לתמונות היסטוריות

V like Vintage הוא מנוע חיפוש לתמונות היסטוריות. משלב אוספים פרטיים ואוספים של ספקים מקצועיים כגון: ארכיונים, גלריות בתי הוצאה לאור . בשלב זה החברות והעלאת התמונות לאתר חופשית ואינה כרוכה בתשלום. כמו כן לנרשמים לאתר יש אופציה להעיר הערות על התמונות

על פי מה שנכתב באתר – תיאור התמונות, מילות המפתח והמיון הגיאוגרפי של התמונות מבטיחים אחזור מהיר ורלוונטי. אפשר להגביל את החיפוש על פי שנים, מספר שדות ביבליוגרפיים נוספים כמו כותר ותיאור וקטגוריות נושאיות. בחיפוש תמונות מירושלים וחיפה למשל נמצאו תמונות של המופתי של ירושלים בתקופת המנדט הבריטי אמין אל-חוסייני בברלין, חיילים גרמניים בירושלים, מעפילים מספינת המעפילים "מדינת היהודים" מועברים לספינות גירוש לקפריסין ועוד תמונות היסטוריות מעניינות.

חבל שתיאור התמונות אינו בשפה האנגלית.

משתמשים שיש בידיהם תמונות היסטוריות נקראים להעלותם לאתר.

Koders.com – מנוע לחיפוש קוד פתוח

Koders.com הוא מנוע חיפוש לקוד פתוח. המאגר של המנוע כולל 3.3 מיליארד שורות קוד. מנוע החיפוש תומך במגוון שפות תכנות כגון: Javascript, Asp, Perl, Cobol ועוד. על פי מה שנכתב באתר אפשר לחפש גם מחלקות , שיטות והגדרות – מושגים מתחום תכנות מונחה עצמים. עדיין אי אפשר לחפש ביטויים רגולריים. אפשר להגביל את החיפוש לשפת תכנות מסוימת וגם לפי סוג רישיון.

דירוג תוצאות החיפוש במנוע נעשה על פי מידת השימוש החוזר בקוד- המקום של הקוד ברשימת התוצאות הוא במתאם חיובי עם מידת השימוש החוזר בקוד.

 

Google in Education –ריכוז שירותים וכלים של גוגל בתחום החינוך

לגוגל יש הרבה משאבים ושירותים שתומכים בחינוך ובהוראה . בפוסט בבלוג של גוגל מיום 26 בינואר נכתב על ריכוז כל משאבים אלה באתר אחד Google in Education. המידע באתר מחולק על פי קטגוריות: For teachers, For Organizations, For Students וגם News & Calendar.

באתר זה אפשר למצוא כלים של גוגל לשיתוף, לחיפוש מידע וארגונו ועוד. ריכוז זה של משאבים חשוב שכן הוא חושף את המשתמש לכלים רבים קיימים שלעתים אין לו מידע עליהם, כי לא ניתן לראות אותם ולהגיע אליהם מעמוד הבית של מנוע החיפוש של גוגל..

בבוקלט Google in Education: A New & Open World for Learning" אפשר לקרוא על תרומתה של גוגל לחינוך ואפשר להוריד את כולו או באופן סלקטיבי חלקים שמיועדים לשלבי החינוך היסודי והתיכון, ולחינוך הגבוה.

גוגל סקולר ככלי ביבליומטרי – תוצאות מחקר

Google Scholar  שכולל מאמרים מכתבי עת וגם מציג נתונים על ציטוטים של מאמרים נחשב לעתים כמקור אלטרנטיבי או משלים למאגרי מידע ייעודיים לציטוטים כמו Web of Sciences או Scopus. האם זה כך? מה יעילותו של גוגל סקולר לניתוחים ביביליומטריים ומה יעילותו ככלי להערכה מחקרית /מדעית.

על כך מנסה מחקר חדש שאמור להתפרסם בקרוב בכתב העת Scientometrics לענות. המחקר:
Is Google Scholar useful for bibliometrics? A webometric analysis
התבסס על ניתוח כתובות הדומיין של המקורות ולא על ניתוח של שמות מחברים או מוסדות. איסוף הנתונים התבצע ב- אוגוסט 2010.

בהסתמך על ניתוח זה המחקר הגיע למסקנה שגוגל סקולר חסר את בקרת האיכות של כלי ביבליומטרי. הכיסוי הגבוה שהוא מציע כולל לעתים פריטי מידע שאין להשוותם עם אלה של מאגרי מידע דומים. כך למשל מממצאי המחקר:
אוניברסיטאות מסין, טיוואן , ספרד, ברזיל ואינדונזיה מיוצגות ומדורגות מעבר למצופה.
במקרים מסוימים מאגרי מידע בינלאומיים גדולים או לאומיים או מאגרים מוסדיים אחראים למספר הרב של התוצאות. אך בהרבה פעמים אחרות תכנים מקומיים, כולל נירות בכתבי עת בעלי אימפקט נמוך , ספרות מדעית פופולרית , דוחות שלא פורסמו או חומרים תומכי הוראה מוצגים יתר על המידה.

לאור זאת, המסקנה של המחקר היא שהשימוש בגוגל סקולר למטרות ביבליומטריות והערכה צריך להיעשות בזהירות, במיוחד לגבי פריטי מידע שאינם חופפים עם אלה שקיימים ב- Scopus או ב-Wos .

יחד עם זאת השקתו של Google Scholar Citations והעדכון של Microsoft Academic Search משנים את דרגת המחויבות של מנועי חיפוש אלה לניתוח הציטוטים, בעיקר בכל הקשור לתיאור אישי ומטרות הערכה. ניתנת האפשרות למחברים לתקן טעויות לשנות פרופיל וכו' ברוח הווב 2.0 ובכך כלים אלה הופכים מתחרים רציניים לרשת החברתית הייעודית לאקדמיה – ResearchersID של ISI Thomson או לשירותי זיהוי המחברים של Scopus

 

 

80 search engines for internet ו- WorldFavo – שערי גישה למידע ברשת האינטרנט

בזמנו כתבתי פוסט על search engines for internet explorer 43–  אתר שמהווה שער גישה למידע ברשת בתחומים שונים בכך שהוא מרכז במקום אחד מנועי חיפוש למטרות שונות ומאפשר חיפוש וגם דפדוף .

מאז נוספו מקורות מידע חדשים ואתר בעל מנשק זהה נקרא: 80 search engines for internet explorer . כמו ב-search engines for internet explorer 43 עמוד הבית כולל רשימה של אתרים פופולאריים ואתרים למטרות שונות: אתרי דוא"ל, משחקים, אתרי וידאו, מפות, נסיעות, טלפונים, חדשות בנושאים שונים.

כמו כן הוא כולל מדריך שמאפשר דפדוף במספר רב של קטגוריות: – אמנות, מחשבים, קניות, עסקים, שעות הפנאי, מוסיקה, יעץ, בריאות , מדעים, ספורט, תוכנה, חדשות, משפטים, נסיעות, אינטרנט,משחקים ועוד..

האתר מאפשר גם חיפוש – אפשר להגביל את החיפוש לתמונות, וידאו , חדשות, מזג אויר, מפות, משחקים, דוא"ל, רדיו וחיפוש על פי ארצות. בכל אחד מחיפושים אלה הוא מאפשר חיפוש כללי בכל הרשת כמו כן מציע למשתמש בחירה של מנועי חיפוש שונים לצורך אותו חיפוש. מנשק החיפוש המתקדם מאפשר גם הגבלה על פי פורמטים שונים של קבצים, חיפוש תמונות, וידאו, חדשות בלוגים, תוכנה, קניות, מרשמים, בריאות וגם כאן הוא מאפשר למשתמש בחירה של מקורות שונים לחיפוש.

על תחביר החיפוש אפשר למצוא מידע במסך ה-help. משם אפשר ללמוד שהמנוע תומך בין היתר בהגבלה על פי אתר ודומיין מסוים על ידי שימוש באופרטור site:

gate2שער גישה נוסף למידע ברשת הוא WorldFavo . אתר זה מאפשר ממסך אחד גישה לחיפוש במספר מנועי חיפוש כלליים, גישה לתוכנות דואר ווביות ולאתרים שמאפשרים פונקציות שונות: תרגום, המרת מטבע, מחשבונים, עורכי html , תוכנות לעריכת תמונות, העלאת קבצים לרשת, הורדת תוכנות חופשיות ועוד ..

אל- 80 search engines for internet explorer .

אל WorldFavo

NLMPlus – חיפוש סמנטי ומקיף במשאבי המידע של NLM וכלים נוספים שכדאי להכיר

השימוש בכלים לגילוי ידע צובר תאוצה. כלים אלה מחפשים בו זמנית במספר רב של משאבים אלקטרוניים תוך שימוש באינדקס או במערכת היברידית שמשלבת אינדקס וחיפוש–על (federated).

יישום טכנולוגיות סמנטיות בכלים אלו יכול לייעל את תהליך אחזור המידע.

NLMPlus הוא כלי מסוג זה ייעודי לתחום הביורפואי שמחפש במשאבים האלקטרוניים של NLM תוך שימוש בטכנולוגיות סמנטיות. מתיאור המוצר אפשר להסיק שהוא כלי היברידי שמשלב אינדקס עם חיפוש –על וכל זאת תוך שימוש בטכנולוגיות סמנטיות.

NLMPlus מחפש מידע בלמעלה מ- 60 מאגרי מידע של NLM כולל Pubmed ו- Medlineplus ומגוון מקורות מידע אחרים בתחום הביורפואי שמאפשרים גם חיפוש מידע תרופתי ( NLM’s Drug Information Portal and Medlineplus Drugs & Supplements databases ) , מידע חדשותי (Medlineplus News), וידיאו ומדריכים (Medlineplus Videos and Tutorials) ותמונות (תמונות מ- NLM’s History of Medicine and PubChem databases ) .

NLMPlus משתמש בכלים מבוקרים סמנטיים
NLM’s Unified Medical Language System and the MeSH Medical Subject Headings Thesaurus
וגם בטכנולוגיות של כריית מידע לחילוץ מונחים קרובים, סימפטומים, רפואה אלטרנטיבית , גנים ועוד..

NLMPlus מציע הרבה אופציות לסינון תוצאות החיפוש על פי אשכולות– תוצאות ממאגרי מידע של NLM , מחיפוש סמנטי ב- Pubmed , תוצאות מ- Pubmed Reviews , תרופות , חדשות, תמונות, וידאו וגם מונחים קרובים , טיפול, תרופות, רפואה אלטרנטיבית ועוד..

העברת העכבר מעל לכל אופציה פותחת חלון קטן עם ההגדרה של המונח. נוח מאוד לשימוש אם כי לעתים כאשר בדקתי את הכלי זמן התגובה היה איטי .

המוצר פותח על ידי חברת WebLib LLC וזכה לפרס של NLM "Show Off Your Apps הטכנולוגיה של מנוע חיפוש זה יכולה להיות מיושמת גם בשאר תחומי המחקר.

כדאי גם לציין ולהכיר את שאר היישומים שזכו בפרסים ובאותות הוקרה של NLM "Show Off Your Apps ואשר משתמשים במקורות המידע של NLM

וביניהם:
GLAD4U – כלי חופשי לחיפוש מידע גנטי
Quertle – מנוע חיפוש סמנטי שמחפש ב- medline ובמקורות מידע נוספים
BioDigital Human Platform – כלי ויזואלי לאנטומיה
DailyMedPlus – כלי לחיפוש מידע תרופתי

ל- NLMPlus
על המוצר כולל וידיאו

Voxalead – חיפוש וידיאו באופן שונה

חיפוש וידאו הוא אחד האתגרים הקשים שעומדים בפני מנועי חיפוש.

רוב שירותי חיפוש וידאו עורכים חיפוש במידע על שמוצמד לכל קליפ , מלות מפתח, תאריכים שמתארים את הוידיאו ונוספים באופן נפרד, אך אינם מחפשים בתכנים של קובצי הוידיאו.

חיפוש מסוג זה כמובן מוגבל ביעילותו לעומת חיפוש בתכני הוידיאו עצמם, והדבר ניכר במיוחד במידע חדשותי . חיפוש אחרי וידאו שעוסק ב"ברק אובמה בסין" יכול לאחזר וידיאו שמזכיר בסגמנט אחד את הנשיא ובסגמנט אחר לגמרי את סין. כמו כן חיפוש כזה אינו מאפשר למשתמש גישה ישירה לקטעים ספציפיים בתוך הוידיאו.

מנוע חיפוש חדש בשם Voxalead בא לפתור את הבעיה על ידי שימוש בטכנולוגיה מתקדמת שמעבדת את התכנים של קובצי הוידיאו ומאפשרת יצירה אוטומטית של תעתיק (טְרַנְסְקְרִיפְּצְיָה) של הנאמר ואז אפשר לחפש ישירות מילות מפתח בתכנים של הוידיאו.

מפתחי המנוע מצאו דרך לחלק באופן אוטומטי את שידורי החדשות לקטעים בנושאים ספציפיים שיכולים לפעול בנפרד. זה נעשה באמצעות תוכנה שמנתחת את התעתיק תוך כדי חיפוש אחר מעברים ברורים מסגמנט אחד לשני. הרעיון הכללי של השיטה הוא לחפש באופן הטוב ביותר עד כמה שאפשר אחר סגמנטציה .

לחיפוש מסוג זה מספר יתרונות ובראשם דיוק גבוה של תוצאות החיפוש, יכולת להציג את תוצאות החיפוש על פי חתכים שונים ומתן אפשרות למשתמש להגיע ישירות לקטעים ספציפיים שמעניינים אותו.

כמובן שגישה זו כרוכה גם במספר בעיות ואחת מהן היא הדיוק של התוכנה לזיהוי קול. בעיה כזו יכולה להתעורר במיוחד במידע חדשותי שכולל לעתים מונחים נדירים או חדשים לגמרי.

למפתחי המנוע תוכניות לעתיד. כך למשל בכוונתם להוסיף רובד נוסף לתוצאות החיפוש – תוצאות מתוכנה לזיהוי פנים כדי לדייק יותר ביחס לדובר.

לאור הנאמר אין ספק שהטכנולוגיה של חיפושי וידיאו הולכת ומשתבחת.

 

 

DuckDuckGo – מנוע חיפוש שכדאי להכיר

DuckDuckGo הוא מנוע חיפוש כללי חדש יחסית שזכה על ידי המשתמשים של About.com כמנוע החיפוש הטוב ביותר לשנת 2011 ולסקירות חיוביות במספר אתרים כגון: BusinessWorld, Wired, TimeTechland.com, SearchEngineLand.com,AppAppeal.com

נקודות חיוביות בהערכות להן זכה מנוע חיפוש זה:
הוא אינו שומר היסטוריה של חיפושים ובכך שומר על הפרטיות של המשתמש
מסנן ספאם
מנסה לענות על שאלות ישירות ובכך חוסך למשתמש ניווטים מיותרים
כולל מספר כלים לחישובים ולהמרות

מן הראוי לציין עוד שמנוע החיפוש מאפשר להגביל את החיפוש לחיפוש ישירות באתרים מסוימים או בקטגוריות מסוימות תוך שימוש בתיבת גלילה ליד תיבת החיפוש או בשפת תחביר מיוחדת לו – הוספת סימן קריאה לפני מילת החיפוש במסגרת האתרים והקטגוריות שהוא מאפשר (הכול מתועד באתר), כך למשל images search engines! יחפש תמונות שקשורות למנועי חיפוש,readwriteweb! בצרוף מונח חיפוש מסוים יחפש את מונח החיפוש בבלוג readwriteweb וכו'

תוצאות החיפוש מוצגות בצורה ידידותית למשתמש – בראש התוצאות מוצגת הגדרת המונח , מקורות נוספים להגדרת המונח ומונחים קרובים. כמו כן אפשר לעדן את תוצאות החיפוש על פי אשכולות נושאיים שמוצגים לצד תוצאות החיפוש. בשאלות עובדתיות מקבלים לרוב תשובה ישירה לשאלה.

ducksהמנוע מוגדר כמנוע-על היברידי , מנוע שמשלב זחלן משלו עם מידע ממנועי חיפוש אחרים וסינון התוצאות בהתאם לאלגוריתם משלו. מידע על הארכיטקטורה של המנוע אפשר למצוא בבלוג של מייסדו Gabriel Weinberg
בכתובת:http://www.gabrielweinberg.com/blog/2009/03/duck-duck-go-architecture.html

Chemicalize.org – מנוע חיפוש ייעודי לתרכובות כימיות – עדכונים

Chemicalize.org הוא שירות חופשי בווב של ChemAxon – חברה מובילה לפלטפורמות ויישומים לתעשיות בתחום הביוטכנולוגיה והתרופות.

שירות זה מספק מידע על תרכובות כימיות כולל נוסחאות מבנה מרחביות שלהן. אפשר להזין בתיבת החיפוש שם של תרכובת כימית מסוימת או אתר ווב מסוים. מנוע החיפוש מציג מידע על התרכובת שכולל גם  נוסחת מבנה מרחבית של התרכובת. מנוע החיפוש גם מחפש על פי בחירת המשתמש דפי ווב שבהם מוזכרות תרכובות כימיות והוא מציג את הדף עם נוסחאות מבנה מרחביות של התרכובות.

מאפיינים חדשים נוספים מדי פעם למנוע החיפוש . לאחרונה נוספה האופציה של מנוע החיפוש לזהות תרכובות כימיות לא רק בדפי ווב אלא גם בקובצי PDF .

מידע ועדכונים בהקשר למנוע אפשר למצוא בבלוג של מנוע החיפוש.

למנוע החיפוש
לבלוג של מנוע החיפוש לקבלת עדכונים

 

גידול דרמטי במשאבי הגישה הפתוחה – דוח 30 ספטמבר 2011

במסגרת אחד מהפרויקטים של IQSS – The Institute for Quantitative Social Science שבאוניברסיטת הרווארד מתחקים באופן קבוע מאז 2005 אחר הגידול במשאבי ה"גישה הפתוחה", והנתונים והניתוח מתפרסמים כל שנה מדי רבעון ( מרץ, יוני, ספטמבר ודצמבר) ב- The Imaginary Journal of Poetic Economics בסדרה Dramatic Growth of Open Access Series

על פי נתוני 30 ספטמבר 2011 :

– ב- DOAJ – למעלה מ- 7000 כתבי עת ומדי יום נוספים למעלה מ- 4 כותרים חדשים

– ב- Electronic Journals Library – למעלה מ- 30 אלף כותרים חופשיים

– ב- OpenDOAR – למעלה מ- 2000 מאגרי מידע חופשיים

BASE מנוע חיפוש ייעודי לחומרים בגישה פתוחה מחפש בלמעלה מ- 31 מיליון פריטי מידע

ROARMAP – מונה למעלה מ- 300 מסמכי מדיניות של מוסדות שמחויבים לגישה פתוחה – מנדטים

למידע נוסף בדוח המלא

 

 

 

מנועי חיפוש ייעודיים לאייקונים

בזמנו כתבתי על iconfinder מנוע חיפוש לאייקונים . באתר Design Web שנועד למפתחים ומעצבי אתרים אפשר למצוא מידע על מנועי חיפוש ייעודיים לאייקונים. מנועי החיפוש אינם חדשים אבל כדאי להכירם. להלן מספר מנועים כאלה שמאפשרים הורדה חופשית של אייקונים וכוללים מידע על סוג רישיון.

IconArchive – נכון להיום על פי מה שנכתב באתר כולל קרוב ל- 30000 אייקונים – עם הרבה אופציות לסינון תוצאות החיפוש – על פי קטגוריות נושאיות, רישיון, גודל, צבע ואם אפשרות לשנות את הרקע של האייקונים

IconSeeker – כולל כ- 50000 אייקונים שהשימוש בהם חופשי למטרות לא מסחריות. מאפשר להגביל את תוצאות החיפוש לגודל מסוים וכולל מידע על כל אייקון כולל רישיון . מאפשר את הורדת הקבצים ב- 3 פורמטים : ico, icns ו- png

VeryIcon – כולל כ- 20000 אייקונים חופשיים להורדה. מאפשר דפדוף על פי קטגוריות נושאיות. בחיפוש המתקדם מאפשר את הגבלת החיפוש לקטגוריות נושאיות ולגודל תמונה. כולל מידע על כל אייקון – מחבר, אתר, רישיון ופורמטים של קבצים להורדה

IconsSearch – מציג את האייקונים להורדה בגדלים שונים, כולל מידע על כול אייקון , מאפשר תצוגה של אייקונים דומים.

 

Mr.icons/– כולל כפי שנכתב באתר 125,174 אייקונים. כולל מידע על כול אייקון. המידע כולל גם סוג רישיון. ממעט החיפושים שערכתי הרבה אייקונים חופשיים להורדה למטרות לא מסחריות.

Findicons.- מנוע חיפוש בעל מאגר גדול של אייקונים חופשיים במבחר גדול של פורמטים. המידע על כול אייקון כולל גם מידע על סוג רישיון

.iconspedia – מנוע החיפוש זה הוא בעל מאגר גדול של אייקונים חופשיים. באתר יש אופציה לחיפוש ודפדוף. יש אפשרות לדפדוף על פי קטגוריות נושאיות. החיפוש מאפשר את הגבלת החיפוש מראש על פי סוג של רישיון.

עדכון האלגוריתם של גוגל – תוצאות עדכניות יותר בהתאם לשאילתה

ב- 3 בנובמבר 2011 גוגל הודיעה על שינויים באלגוריתם של מנוע החיפוש שלה שיאפשרו למשתמש תוצאות מעודכנות יותר בשאילתות שמתבקש בהם חומר עדכני.

על סמך מונחי החיפוש האלגוריתם ידע להבחין בין שאילתות שהמשתמש מצפה בהן לקבל חומר עדכני לבין שאילתות אחרות בהן העדכניות לא חשובה למשתמש. חומר עדכני חשוב כאשר המשתמש מתעניין באירועים אחרונים או בנושאים חמים, במידע שמתעדכן לעתים קרובות גם אם אינו נושא חם ובאירועים שמתקיימים על בסיס קבוע כגון כנסים ואירועים דומים. כך למשל אם המשתמש מחפש אוֹלִימְפְּיָאדָה סביר להניח שהוא מתעניין בחומר עדכני על האולימפיאדה הבאה ולכן יוצג לו בראש רשימת התוצאות מידע על האולימפיאדה בשנת 2012.

לעומת זאת בהרבה מקרים חומר עדכני אינו חשוב וגם מידע לא עדכני יכול להיות רלוונטי למשתמש כגון חיפוש מרשמים וכו'
האלגוריתם ידע להתאים את תוצאות החיפוש בהתאם לשאילתה ומידת העדכניות המתבקשת.

מן הראוי לציין שבאוגוסט 2010 גוגל הודיעה על השלמתה של מערכת אינדוקס הווב שלה Caffeine שמאפשרת לסרוק ולאנדקס תכנים עדכניים במהירות. עדכון האלגוריתם הוא צעד נוסף בכיוון שמשפיע על 35% מהחיפושים.

שינויים אלה במערכת של גוגל הם מחויבי המציאות ותוצאה של ההכרה בצרכים של המשתמש במיוחד נוכח הפופולריות ההולכת וגוברת של הרשתות החברתיות כגון פייסבוק וטוויטר.

מן הראוי לציין שגוגל ניסתה כבר בעבר לאפשר חיפוש בזמן אמת כאשר הציגה את השירות google.com/realtime , שירות ששילב ציוצים מטוויטר , במסגרת הסכם של גוגל וטוויטר. אלא שהסכם זה הסתיים ביולי 2011 ולא חודש עד כה. במקביל מנוע החיפוש המתחרה בינג  פיתח דרך לאנדקס אתרים שמתעדכנים לעתים תכופות כגון בלוגים ולנתח ציוצים מטוויטר כדי לזהות נושאים פופולריים

לאור מצב זה נראה שהשינויים שהכניסה גוגל באלגוריתם של מנוע החיפוש שלה הם כורח המציאות ובעתיד מתוכנן צעד נוסף בכיוון- שילוב מידע מגוגל פלוס – הרשת החברתית החדשה של גוגל.

להצהרה של גוגל

לכתבה בניו-יורק טיימס – תודה לד"ר אריאל פרנק על המידע

חיפוש תמונות ב- Compfight וב- PictureSandbox

בזמנו כתבתי על Wylio מנוע לחיפוש תמונות ברישיון גמיש ועריכה מהירה כמנוע חיפוש מומלץ לתמונות לבלוגים. מנוע דומה שמשתמש אף הוא כמו Wylio ב- API של flickr הוא Compfight  .Compfight מאפשר את עידון תוצאות החיפוש על פי מספר קריטריונים כולל תמונות ברישיון הגמיש Creative Commons וחיפוש בטוח.

באתר יש הוראות למשתמש כיצד לתת  קרדיט וליחס את התמונה לבעליה אם נדרשים לעשות זאת במסגרת הרישיון הגמיש.

בתוצאות החיפוש בצד מוצגות גם תמונות רלוונטיות מאתר התמונות בתשלום shutterstock

מנוע חיפוש נוסף שמציג אף הוא תמונות מ- flickr אך במקביל גם תוצאות מ- Fotolia הוא PictureSandbox . בתוצאות מתוך flickr אפשר על ידי העברת העכבר על פני התמונה לקבל מידע מפורט על התמונה. לחיצה על התמונה תציג מידע נוסף ואופציות להורדת התמונה בגדלים שונים .

ל- Compfight

ל- PictureSandbox

Web 2.0 Summit ומגמות בווב

 Web 2.0 Summit הוא כנס שמתקיים מאז 2004 מדי שנה בו נפגשים מומחים בתחומים שנוגעים לעתיד הווב ונציגי חברות מובילות באינטרנט ודנים באסטרטגיות ובנושאים חשובים שקשורים בכלכלת הווב ועתידו.

השנה כנס זה התקיים ב- 17-19 באוקטובר 2011 בסן פרנסיסקו .

ביו הנושאים שנדונו בכנס מגמות באינטרנט, גוגל פלוס, מנועי חיפוש חדשים ועוד..

אחת ההרצאות המעניינות לדוגמה , שזמינה לצפייה , הייתה הרצאה בה הוצג מנוע החיפוש Wirdoo שנמצא כיום בגרסת טרום ביתא אך אפשר להירשם כדי לקבל אליו גישה. . Wirdoo הוא מנוע חיפוש לרשת הלא נראית שמתבסס על קשרים ביו המונחים. המרצה MC Hammer הדגים חיפושים במנוע והראה כיצד תוצאות החיפוש מתבססות על קשרים . כך למשל חיפוש מספר מיקוד מסוים הניב תוצאות שכללו בתי ספר, מידע על הקהילה, קניות, שיעורי פשיעה ועוד.

קובצי וידאו מעניינים נוספים של הנושאים שנדונו בכנס אפשר למצוא באתר. כמו כן אפשר למצוא קישור להרצאות משנה שעברה.