הווב הסמנטי – מנועי חיפוש ומפתחי אתרים

מנועי חיפוש מאמצים בהדרגה טכנולוגיות סמנטיות . כבר בשנת 2003  גוגל רכשה את applied semantic.   מאוחר יותר Microsoft  הלכה בעקבותיה ורכשה  בשנת 2008 את powerset ואת  zoomix שתי חברות   מתמחות בתחום הטכנולוגיה הסמנטית. ההצהרה של גוגל משנת 2012  בדבר אימוץ טכנולוגיות סמנטיות מחזקת את  דבקות ענקיות החיפוש במגמה לאמץ טכנולוגיות סמנטיות

נשאלת השאלה כיצד ישפיע  הדבר על בעלי אתרי הווב בכול הקשור לאופטימיזציה של מנועי חיפוש וכיצד להיערך ?

Michalis 'Big Mike' Kotzakolios  בספרו Web 3.0  Semantic Search (זמין באמזון בגרסת קינדל)  כולל מספר המלצות  לבעלי אתרים.

המשמעות של טכנולוגיות סמנטיות מבחינת מנועי החיפוש הוא הבנת התכנים של דפי הווב בצורה טובה יותר ומעבר לאינדוקס וניתוח מ- text patten matching model  ל-  vector space model

מבחינת אופטימיזציה של מנועי החיפוש המשמעות היא מעבר מאופטימיזציה שמתמקדת במלים מסוימות לתפיסה של המשמעות הרחבה של התכנים ביחס לכול המלים והביטויים שבהם נעשה שימוש,  ואינדוקס דפי ווב באופן  שגם מלים וביטויים שאינם נמצאות בהכרח בתכנים  של הדפים יכללו באינדקס המשויך לאותם דפים וזאת  מפני שהם רלוונטיים למשמעות הרחבה של הדפים.

לאור זאת מומלץ על  שימוש רב ככל האפשר במלים  דומות או נרדפות ששייכות לנושא,  ולהימנע משימוש רב  באותו מונח.   כמו כן מומלץ לקצר  בתכנים  ולהסתפק ב- 350 -400 מלים מכיוון שככול שהדף ארוך יותר כן יקשה להבין  את המשמעות הנכונה שלו

google-wהמלצות נוספות הן  כתיבת הדף ב- HTML5  ושימוש נכון ב-.microdata  לבחינת השימוש הנכון ב-microdata  אפשר להשתמש בכלי הייעודי של גוגל לצורך כך   Structured Data Testing Tool

open-gכמו כן  לאור המגמה של מנועי חיפוש להסתמך בתוצאות החיפוש על המעגלים החברתיים של המשתמש מומלץ לא להתעלם מ- Open Graph Protocol וזאת כדי לאפשר את הכללת דפי הווב בתוצאות החיפוש מבוססות המעגלים החברתיים.

מאחר ומנועי החיפוש כוללים באופנים שונים גם אלמנט אנושי וחברתי בדרוג התוצאות הרי בנוסף לטיפים אלה חשוב לדאוג שהמשתמש ירצה לשוב לדף ולכן חשוב שדפי הווב יהיו קלים לניווט ויכללו אלמנטים אטרקטיביים  תוך שימוש בכלים וווידגטים שיעשירו את חווית המשתמש. כול זה יעשה בתהליך מתמשך ודינמי כווב עצמו.

מנוע החיפוש Zeekly ושמירת הפרטיות

 בזמן האחרון,  לאחר שנודע  שהסוכנות לביטחון לאומי בארה"ב  אספה מידע של משתמשים ישירות מחברות אינטרנט אמריקאיות כגון פייסבוק וגוגל  במטרה לעקוב אחרי אנשים מחוץ לארה"ב, התעוררה בעיית שמירת פרטיות המידע ברשת ביישומיים  שונים כולל  מנועי חיפוש  

 בזמנו כתבתי פוסט בבלוג על מנועי החיפוש StartPage   ו- Ixquick  ששומרים על פרטיותו של המשתמש יותר מאחרים. גם DuckDuckGo  נמנה על מנועים מסוג זה ובעת האחרונה נרשמה עליה בתעבורה של מנועי חיפוש אלה.  

 zeekly מנוע נוסף פחות מוכר שנמצא עדיין בגרסת ביתא  ששייך לקטגוריה זו הוא  Zeekly. על פי מה שנכתב באתר Zeekly  מחפש במקורות מידע שונים בווב – גוגל, יאהו, בינג , אמזון, יוטיוב ובאינדקס עצמאי משלו ומציג את המידע בסביבת מידע  מאובטחת ומוצפנת ששומרת על הפרטיות . הוא אינו שומר היסטוריה של חיפושים ומשתמש בפרוטוקול תקשורת שמאפשר תקשורת מאובטחת ומוצפנת – 2048-bit SSL.  

 העובדה שהוא לא משתמש רק במנועי חיפוש אחרים אלא גם בזחלן ובאינדקס עצמאי משלו מייחדת אותו ממנועי החיפוש האחרים בקטגוריה מנועי החיפוש ששומרים על הפרטיות שהוזכרו לעיל.

 אפשר להגביל את החיפוש מראש לסוגי חומרים שונים – תמונות, וידאו, חדשות, אודיו,ויקי, ספורט, אמזון, בלוגים, PDF   , פורומים ומלונים . יש למנוע  גם מנשק לחיפוש מתקדם שמאפשר גם הגבלה לדומיין מסוים .

 למנוע  

אחזור מידע רפואי – השוואה בין Pubmed ו- Google Scholar

 המאגר הרפואי Pubmed  ומנוע החיפוש המדעי Google Scholar  שניהם  כלים חופשיים. עם גידול  השימוש בגוגל סקולר גם לחיפושים בתחום הרפואה,  מעניין  לערוך השוואה בין שני הכלים.

 jourמחקר שתוצאותיו התפרסמו  בגיליון אוגוסט  2013  של כתב העת  Journal of Medical Internet Research   עשה זאת. המחקר השווה את יעילות אחזור המידע של ספרות רפואית קלינית  בין  גוגל סקולר  ו- Pubmed .

 ההשוואה בוצעה על ידי 100  שאילתות מתחום  הנפרולוגיה שבוצעו בשני הכלים. מילות החיפוש לצורך החיפושים סופקו על ידי מומחים בתחום. ההערכה נעשתה על ידי השוואה של ההחזר והדיוק – 2 מדדים שימושים ומקובלים בהערכת מערכות מידע על פי פרדיגמת המערכת. נבדקו 40 תוצאות ראשונות בכל אחת מהמערכות. בנוסף לבדיקת שיעורי ההחזר והדיוק  נבדק  גם אחוז המאמרים  בטקסט מלא מתוך המאמרים הרלוונטיים שאוחזרו בכול אחת מהמערכות.

המחקר מצא שגוגל סקולר אחזר פי שניים מאמרים רלוונטיים מ- Pubmed ופי שלוש  מאמרים רלוונטיים בטקסט מלא.

 בהתחשב בעובדה שנבדקו 40 תוצאות ראשונות , יתכן שהיתרון בשיעורי הרלוונטיות של התוצאות בגוגל סקולר נבע מהאופן השונה של הצגת התוצאות בשתי המערכות ומהעובדה שגוגל סקולר מדרג את התוצאות על פי מידת הרלוונטיות. כאשר נלקחו בחשבון כל התוצאות ולא רק 40 התוצאות הראשונות שיעורי ההחזר היו דומים בגוגל סקולר ו- Pubmed ,  בעוד ששיעורי הדיוק  היו טובים יותר ב-Pubmed .  ממצאים אלה דומים לממצאי מחקרים קודמים בהם נערכה השוואה בין שני הכלים בתחומי רפואה אחרים. שיעורי ההחזר גדולים יותר בגוגל סקולר לעומת שיעורי דיוק גדולים יותר ב- Pubmed .

 בכל מקרה,  בהתחשב בעובדה שבדרך כלל  המשתמש לא בודק את כול התוצאות,  מסקנת המחקר על פיה מתוך 40 התוצאות הראשונות שיעורי המאמרים הרלוונטיים ואלה שנמצאו בטקסט מלא היו גבוהים יותר בגוגל סקולר, משמעותית  למשתמש.

להכללת התוצאות יש צורך  במחקרים דומים בתחומי רפואה נוספים .

 למאמר  המלא  

Kadaza – עמוד שער ויזואלי לווב

k2Kadaza הוא מדריך ששם לו ליעד  לשמש כעמוד שער  לווב  כפי שהגדיר זאת  באתר : "Let's create world's most reliable website encyclopedie".

האתרים במדריך נבחרים על ידי צוות המפתחים  ומסודרים בקטגוריות נושאיות . אפשר לדפדף בקטגוריות השונות גם על פי רשימה אלפביתית. האתרים בכול אחת מהקטגוריות מוצגים בצורה ויזואלית – מוצג הלוגו של כול אחד מהאתרים. בנוסף למנשק הוויזואלי שמקל על הניווט, createהקטגוריות מוגדרות  בצורה שמקלה על הדפדוף, כולל הגדרת פונקציות פעולה ולא רק שמות. כך למשל באות "c"   אפשר למצוא create a website" " או "create blog"   ובדפים המקושרים אפשר לראות בצורה ויזואלית יישומים רלוונטיים.

כפי שמוגדר באתר, Kadaza  הוא למעשה תוצאה של מחקר  שמצא שרק חלק קטן מאתרי הווב נמצא בשימוש אינטנסיבי   ואת אותם אתרים בחרו מפתחי המנוע להציג כדי להקל על החיפוש.

כפי שצוין לעיל האתרים הם אתרים נבחרים . למפתחי אתרים יש אופציה לשלוח את  כתובות עמודי הבית שלהם כדי להכלילם במדריך.

מאפיין נוסף של  Kadaza  בהתאם למטרה המוצהרת שלו לשמש כדף שער  ויזואלי לווב היא האפשרות בעמוד הבית לחפש בכול אחד ממנועי החיפוש העיקריים – גוגל, יאהו, בינג וגם ב- Youtube  וב-   Wikipedia.  בנוסף אפשר להגביל את החיפוש לאתרי ווב, וידאו  ותמונות .

קיימת אפשרות גם להתאמה אישית של הדף.

Kadaza אמנם אינו יישום חדש אך  הוא גדל ומתחדש מדי יום , הוא לא כל כך מוכר ואולי כדאי להכירו.

לאתר

התפתחויות בחיפוש חברתי – עבר, הווה ועתיד

patentב- 23 ביולי 2013  גוגל  רשמה לזכותה פטנט חיפוש נוסף והפעם בתחום החיפוש החברתי . הפטנט אושר  לחברה  על ידי משרד הפטנטים האמריקאי  והוא תומך בסינון מידע חברתי בתוצאות החיפוש. סינון תוצאות החיפוש נעשה על פי הגרף החברתי והנוכחות החברתית של המשתמש כלומר מתבצע זיהוי תכנים שנוצרו על ידי אחד או יותר ממשתמשי הרשת החברתית של המשתמש –  יוצגו תוצאות חיפוש שמתבססות על תכני ווב שנכתבו, שותפו או צוינו ב-  like על ידי אנשים ברשת החברתית של המשתמש, בהקשר זה מן הראוי לציין שהרשת החברתית גוגל פלוס מנתה  במאי 2013 למעלה מ- 500 מיליון משתמשים רשומים מתוכם 225  מיליון משתמשים פעילים.

פטנט זה הוא רק ציון דרך נוסף במגמה של הדמיון המסתמן בין רשתות חברתיות ומנועי חיפוש. בינג בסרגל החברתי שלו משלב מידע מהרשת החברתית פייסבוק כולל המלצות מחברים, גוגל משתמש במידע מגוגל פלוס לדירוג תוצאות החיפוש, ומנוע החיפוש החדש של פייסבוק דולה מידע  מחברים כולל שמות ותמונות.

מסתבר שהאלמנט של החיפוש החברתי היה קיים כבר מראשית דרכם של מנועי החיפוש. אינפוגרף של חברת  Yext ממחיש את התופעה החל מ- 1990 ועד היום. התופעה החלה ב- 1990 בחיפוש ב-Archie   והמשיכה בפונקציות שונות בהן נטל חלק הגורם האנושי /חברתי במנועי החיפוש השונים: Yahoo, Google, TripAdvisor, Digg, Reddit, Yelp, Foursquare  ולאחרונה פייסבוק עם גרף החיפוש.

נוכח מצב זה סביר להניח שהחברה שתצליח לשלב בהצלחה ובצורה היותר טובה מדיה חברתית בתוצאות החיפוש  תזכה בעתיד בציון הגבוה ביותר במדד  ACSI   – The American Customer Satisfaction Index

שביעות רצון מאתרים חברתיים, מנועי חיפוש ופורטלים על פי מדד ACSI

aACSI   – The American Customer Satisfaction Index  הוא מדד כלכלי לאומי של הערכה ושביעות רצון הצרכנים האמריקאים ממוצרים ושירותים. מדד ACSI מיולי 2013 מבוסס על סקר שביעות רצון של 70000   צרכנים מ-230 חברות ב- 43 תעשיות ו-10 מגזרים כלכליים , למעלה מ- 130 משרדי ממשלה, סוכנויות ואתרי ווב. המדד משתמש בסולם של 100 נקודות.

 על פי מדד יולי 2013  האתרים החברתיים הפופולריים ביותר ממשיכים לקבל את הציונים הנמוכים ביותר. Facebook   ו- LinkedIn קיבלו את הציון הנמוך ביותר –  62  נקודות. נראה שנושא שמירת הפרטיות היה בעוכריה של פייסבוק. Pinterest זכתה לציון הגבוה ביותר בין הרשתות החברתיות – 72 נקודות ואחריה Google+      ו- YouTube עם ציון של 71 נקודות. Twitter  עלה בנקודה אחת יחסית לשנה החולפת וזכה לציון של 65 נקודות – ציון שהוא עדיין נמוך מהממוצע בקטגוריה זו. נראה שבעיות יכולת ודיוק בחיפוש  עומדים בעוכריו של טוויטר

 גם השנה וויקיפדיה זכתה בציון הגבוה ביותר מבין האתרים החברתיים – 78 נקודות .

 באופן כללי מנועי חיפוש זכו לציונים גבוהים יותר מהאתרים החברתיים. אך גם כאן המגמה היא של ירידה  . בשביעות הרצון ממנוע החיפוש גוגל נרשמה ירידה של 5 נקודות והציון שקיבל- 77 הוא הנמוך ביותר שלו בהיסטוריה של ACSI  . אך עדיין הציון שלו גבוה משאר מנועי החיפוש והפורטלים- בינג ויאהו – 76 , MSN – 74, AOL – 71  .   באופן כללי הציון לו זכו מנועי החיפוש והפורטלים הוא הנמוך ביותר מאז 2007 . נראה שהתסכול של המשתמשים מאיכות הפרסומות ומהירות תגובה היו אחראים לירידה זו

 לממצאים נוספים ומידע נוסף

מעבר לגוגל – 10 מנועי חיפוש שכדאי לזכור

ב- 8 ביולי יאהו  הורידה את מנוע החיפוש בן 18 השנים ALTAVISTA  .  לכבודו של מנוע וותיק זה ולזכר הימים בהם  היו שחקנים רבים  במגרש החיפוש התפרסמה כתבה  שיכולה להיות שימושית ובה סקירה קצרה על 10 מנועי חיפוש ייעודיים שמתוארים כמנועי חיפוש שעדיין מסוגלים לעשות את מה  שגוגל אינו יכול.

wol2המנועים אינם חדשים ורובם מוכרים אבל בכול זאת אולי כדאי לצרכים מסוימים לזכור גם אותם. הבולטים בהם:  The Wayback Machine  ארכיון הווב , Wolfram Alpha  The "computational knowledge engine" שגוגל החל לשלב תוצאות ממנו במנוע החיפוש שלו, Creative Commons Search  לחיפוש  פריטי מידע  במסגרת הרישיון הגמיש של creative commons  , Duck Duck Go שאינו שומר היסטוריה של חיפושים ובכך שומר על הפרטיות של המשתמש, מסנן ספאם, מנסה לענות על שאלות ישירות ובכך חוסך למשתמש ניווטים מיותרים , Giphy ו- TinEye מנועי חיפוש ייעודיים ובעלי מאפיינים ייחודיים לתמונות ועוד 

מידע נוסף בכתבה

Webicine – מנוע לחיפוש מידע חברתי רפואי איכותי בווב

הרבה  חומר רפואי נמצא היום ברשתות חברתיות.   לעתים החומר שנמצא ברשתות אלה חשוב ויכול לסייע הן לחולים והן לרופאים כי הוא בדרך כלל מידע עדכני ודינמי שמושתת לרוב על הניסיון וההתנסות  של החולים והרופאים, אבל  לעתים הוא יכול להיות גם מידע שגוי , לא מהימן ומטעה. לכן חשוב שהמידע יעבור בקרת איכות .

webicineזוהי מטרתו של מנוע החיפוש – Webicine.

על פי מה שנכתב באתר, מנוע החיפוש כולל מקורות מידע איכותיים ומהימנים מיישומי ווב 2.0  – בלוגים, קבוצות בפייסבוק, טוויטר וערוצי יוטיוב. המנוע מכסה נכון להיום 5000   מקורות מידע,  140 נושאים ב- 20 שפות.  אפשר לעדן את תוצאות השאילתה על פי אשכולות – קטגוריות נושאיות, סוגי מקורות ושפות

cuהיעד של המנוע כפי שאופיין על ידי ארגון הבריאות העולמי וכפי שהוצג ב- Yale-, Stanford, Harvard  הוא לאפשר לחולים ולאנשי המקצוע שימוש בטוח ויעיל ברשת האינטרנט. הצוות האחראי על המנוע כולל אנשי מקצוע ויועצים שנחשבים  גּוּרוּאִים ב- e-health בתחומם curation2sוארצותיהם. מיסדה של Webicine  הוא ד"ר  Bertalan Meskó שידוע גם בשם  Dr. Twitter or Dr. House on Twitter ומראיון עימו שפורסם ב- 17 ביוני 2013 אפשר ללמוד על תהליך  העבודה ב-Webicine – תהליך שמטרתו להבטיח איכות.

לאתר

iSEEK -Education – מנוע חיפוש ייעודי לתחום החינוך

iseekiSEEK -Education כפי שכתוב באתר הוא מנוע חיפוש שכולל אתרים איכותיים ומיועד לסטודנטים, מורים  ולקהל הרחב. אפשר להגביל מראש את החיפוש למקורות מתחום החינוך על ידי בחירה בלשונית Education , להרחבת החיפוש אפשר לבחור בלשונית Web.ממעט החיפושים שערכתי נראה שהוא מיועד יותר ל-K-12 .

למנוע החיפוש יש מספר מאפיינים ייחודיים שהופכים את החיפוש לאיכותי ונוח יותר. הוא תומך בחיפוש בשפה טבעית, בתהליך החיפוש הוא יוצר on the fly  אשכולות  בהם אפשר לעדן את שאילתת החיפוש. האשכולות כוללים אשכולות נושאיים, מקומות, ארגונים, תאריך, ואשכולות ייחודיים לתחום החינוך:  מערכי שיעורים, רמות חינוך ועוד. כמו כן אפשר לעדן את תוצאות השאילתה על פי מקור – iSEEK Authoritative ו- General Web . מקורות המידע בקטגורית ה- Authoritative הם מקורות שנבחרו ידנית על ידי אנשי חינוך ומתעדכנים מדי שבוע. יש לציין שבמעט החיפושים שערכתי, בניגוד למצופה, התוצאות בקטגוריה  General Web היו רלוונטיות יותר .

הרשמה חופשית למנוע מאפשרת יצירת חשבון אישי בו אפשר ליצור ספרייה אישית של  אתרים מועדפים ומנוע החיפוש מאפשר לחפש רק בה, דרך לשונית החיפוש MySeek  שמתווספת לשתי  לשוניות החיפוש הקיימות: education   ו- Web . אפשר ליצור גם פורטל אישי ולהוסיף לו מבחר יישומים וגדגטים – Portlets מוצעים.

למשתמשים יש גם אפשרות להמליץ על אתרים להוספה למנוע. , האתרים המומלצים  ייבחנו לצורך הכללתם במנוע על פי קריטריונים מוגדרים  לאיכות

למנוע החיפוש

StartPage, Ixquick , Startmail ושמירת הפרטיות

 בזמן האחרון נודע  שהסוכנות לביטחון לאומי בארה"ב  אספה מידע של משתמשים ישירות מחברות אינטרנט אמריקאיות כגון פייסבוק וגוגל  במטרה לעקוב אחרי אנשים מחוץ לארה"ב .  בעקבות מידע זה  מתעוררת בעיית אבטחת המידע ושמירת הפרטיות ביישומים השונים ברשת בהם אנו משתמשים כולל מנועי חיפוש ושירותי דואר.

 iqבהקשר זה כדאי לזכור לטובה את מנועי החיפוש StartPage   ו- Ixquick  שמכנים עצמם  " the world's most private search engines"   וזאת בזכות המאפיינים שמטרתם להגן על הפרטיות של המשתמש. במנועי חיפוש אלה אין רישום של  כתובות ה-IP   והחיפושים שעורכים המשתמשים , אין מעקב אחר cookies  וקיימת הצפנה – HTTPS  .

 startמבחינה מסוימת שני מנועי החיפוש משלימים זה את זה –   Ixquick הוא מנוע-על וותיק שמספק תוצאות חיפוש שאינן כוללות תוצאות חיפוש של גוגל ו- StartPage  הוא למעשה שילוב של תוצאות החיפוש של גוגל ושמירת הפרטיות של Ixquick.  

 ומה בדבר שירותי דואר שמבטיחים פרטיות? 

פלטפורמת דואר עם מערכת הצפנה חזקה מאותו בית startהיוצר שתוצג לקראת סוף השנה היא StartMail.  מי שמעוניין להתנסות בגרסת ביתא של מערכת זו יכול להירשם בכתובת http://www.Startmail.com .

 מסתבר שהחשש לפרטיות  בעקבות המידע שפורסם לאחרונה על איסוף המידע על ידי הסוכנות לביטחון לאומי בארה"ב  החל לתת אותותיו  – התעבורה במנועי  החיפוש  StartPage ו- Ixquick    גדלה  לאחרונה באופן דרמטי.

 לכתבה בנושא

 

VirtualLRC – מנוע ייעודי לחומרי לימוד ומידע אקדמי

LCRVirtual Learning Resources Center- VirtualLRC  הוא מנוע חיפוש מותאם אישית של גוגל לחומרי לימוד ומידע אקדמי  בתחומים שונים. האינדקס של המנוע כולל אלפי אתרים נבחרים שכוללים מידע אקדמי  .

על פי מה שנכתב באתר מנוע החיפוש משלב אינדקס של למעלה מ- 10000 דפי ווב שמתוחזקים על ידי אדם ומנוע –על שתוצאות החיפוש שלו כוללות מידע ממדריכי נושאיים מומלצים  בפורטלים ובאתרי  אוניברסיטאות,  וספריות ציבוריות.

הכיסוי הוא רב תחומי .    

באתר יש קישור לדף  מנועי חיפוש שמושתתים על אותה טכנולוגיה ומאותו בית היוצר:

Alphamarks, MagBot , MagSearch , NewsBot , Academic Index ו- Infotopia

 

למנוע החיפוש  

נוף המחקר הגלובלי – מקורות מידע

מאמר שהתפרסם בגיליון מאי 2013 של College & Research Libraries News כולל רשימה ותיאור של מקורות מידע חופשיים. הרשימה כוללת מקורות מידע כלליים, קטלוגים מאוחדים, כלי חיפוש לאוספים דיגיטליים ותזות .

1להלן מספר דוגמאות למקורות מידע שנכללים ברשימה: ShareILL.orgוויקי שמתוחזק על ידי ספרנים להשאלה בינספרייתית בארה"ב שמטרתו לסייע לאתר מקורות מידע רלוונטיים. האתר כולל גם את רשימת הספריות הלאומיות בעולם .

2Trove-  Australia – פורטל חופשי של הספרייה הלאומית באוסטרליה כולל גם גישה למקורות מידע חופשיים,  3The European Libraryאגרגטור של  מצאי דיגיטלי ופיזי של 48 ספריות לאומיות באירופה ומספר ספריות מחקר ו4NDLTDספרייה דיגיטלית של תזות ודיסרטציות

לרשימה המלאה

FileTube – מנוע חיפוש ייעודי לחיפוש קבצים

filesFileTube הוא מנוע חיפוש ייעודי לחיפוש קבצים.  הוא כולל באינדקס שלו קבצים מאתרים שיתופיים ואתרים להורדת קבצים כגון : Uploaded.to, Rapidgator.net, Netload.in, 4shared.com, Extabit.com, Turbobit.net, Mediafire.com  ואתרים נוספים אחרים.

באתר יש מנשק חיפוש בסיסי ומתקדם. בשני המנשקים אפשר להגביל את החיפוש  על פי סוג קובץ. בחיפוש המתקדם יש אפשרות להגבלות נוספות : גם על פי גודל הקבצים , תאריך והאתר ממנו לקוחים הקבצים.

בתוצאות החיפוש מקבלים מידע על הקבצים: סוג קובץ, תאריך גודל  ומידע על המקור ממנו לקוח הקובץ עם אפשרות להורדת הקבצים ישירות מתוצאות החיפוש.

למנוע החיפוש  

חיפוש טבלאות בגוגל

בזמנו כתבתי על מנוע חיפוש ייעודי לטבלאות ונתונים סטטיסטיים  ZANRAN

google-tablesשירות דומה ניסיוני מעניין של גוגל לחיפוש טבלאות הוא google tables . באתר זה אפשר להזין שאילתה בנושא כלשהו ומנוע החיפוש מציג טבלאות שחילץ מתוך דפי ווב  וגם טבלאות פתוחות לציבור מתוך  fusion tables.  את הטבלאות שנמצאו בעזרת google tables   אפשר לייבא ל- fusion tables   לצורך עיבודים נוספים, ויזואליזציה וכו' .  כדאי לציין שבמעט החיפושים שערכתי חלק  מהטבלאות נלקחו  מוויקיפדיה ומבלוגים מקצועיים.

ל-google tables

הודעה על שירות  google tables

FreeFullPDF – מנוע לחיפוש חומר אקדמי חופשי

FreeFullPDFfree       הוא מנוע חיפוש  לקובצי pdf  חופשיים  שפותח על ידי KnowMade. על פי מה שנראה הוא מנוע מותאם אישית של גוגל. על פי מה שמוצהר באתר מנוע החיפוש כולל למעלה מ- 80  מיליון פריטי מידע חופשיים בתחומי המחקר השונים : מדעי הרוח והחברה,  מדעי החיים, מדעי הפיסיקה ומתמטיקה .

 את תוצאות החיפוש אפשר לעדן על פי סוגי חומרים:  מאמרים, פטנטים, פוסטרים ותזות

 למנוע 

OATD – כלי חדש לחיפוש תזות בגישה פתוחה

oadOATD  – Open Access Theses and Dissertation הוא  שירות חדש כולל לחיפוש תזות ודיסרטציות   בגישה  פתוחה. כיום הוא  מאנדקס למעלה מ- 1.5 מיליון תזות  בגישה חופשית  מ– 600 אוניברסיטאות ומוסדות אקדמיים אחרים ב רחבי העולם . התזות עצמן נמצאות באתר המקורי שלהן והשירות רק מאפשר גישה אליהן.

הסטטוס של התזות  שנגישות בשירות זה מוגדרות באתר כתזות בגישה פתוחה במשמעות שהן נגישות לקריאה ולהורדה  ועל פי מה שמוצהר באתר האחראים על השירות מעודדים את המחברים להעניק זכויות נוספות במסגרת הרישיונות הגמישים של  creative commons .

ממנשק התוצאות יש גישה לטקסט המלא, לרשומה ביבליוגרפית מלאה, לפריטי מידע דומים וקיימת גם אופציה ליצוא ישיר לרשתות חברתיות אקדמיות ואתרי סימניות חברתיים

מנשק התוצאות כולל אופציות לעידון השאילתה על פי תאריך, אוניברסיטה, תואר ושפות

השירות תומך בפרוטוקול  OAI-PMH     – פרוטוקול נתמך על ידי רוב הפלטפורמות של מאגרי התזות המוסדיים  כגון  DSpace, Digital Commons, eprints, ETD-db, and ContentDM לכן תהליך האיסוף הוא בדרך כלל פשוט .

הוועדה המכוננת של השירות  כוללת ספרנים מומחים מאוניברסיטאות בארה"ב.

באתר השירות   אפשר למצוא גם התייחסות והשוואה עם שירותים אחרים לחיפוש תזות שקיימים היום כגון: PQDT ,  NDLTD יחודו של השירות החדש הוא שנכון להיום הוא מאנדקס רק תזות חופשיות לקריאה והורדה.

 לאתר

לכתבה בנושא

FindZebra – מנוע חיפוש ייעודי למחלות נדירות

findFindZebra  הוא מנוע חיפוש ייעודי  לאבחון מחלות נדירות שפותח על ידי חוקרים ב-Technical University of Denmark  .  על פי מה שנכתב באתר קיימים כ- 7000 מחלות נדירות    שהוכרו ככאלו על ידי  ארגונים למחלות נדירות.  מנוע החיפוש מתמקד במקורות ייעודיים למחלות כאלה כגון: Online Mendelian  Inheritance in Man,  the Genetic and Rare Diseases Information Center,ו-   Orphanet וסורק נכון להיום למעלה מ- 31000 מאמרים שמתמקדים במחלות נדירות ומחלות גנטיות.  על פי מה   שמוצהר באתר  הוא מיועד בעיקר  לאנשי מקצוע במטרה לסייע להם באבחון מחלות קשות לאבחון, ומכאן גם שמו כפי שנכתב באתר:

The term "zebra" is a medical slang for a surprising diagnosis. Physicians are taught since medical school to concentrate on the more common diseases: "when you hear a gallop, you should think about a horse, not a zebra". FindZebra is designed to help in those cases when the equine turns out to be a zebra  

 

לאתר

למידע נוסף

לכתבה בנושא

דרוג eBizMBA – פופולריות של מנועי חיפוש ואתרים בתחומים שונים – אפריל 2013

fifteen2eBizMBA Rank  הוא  דרוג שמהווה ממוצע  הדרוג הגלובלי  של  Alexa  והדרוג של ארה"ב   בהסתמך על Compete Quantcast.  

על פי דרוג זה 15 מנועי החיפוש הפופולריים ביותר אפריל 2013 הם:

Google     bing  Yahoo! Search  ask  Aol Search  MyWebSearch blekko  Lycos  Dogpile  WebCrawler  Info  Infospace  Search  Excite  GoodSearch

 נראה שלא חלו בדירוג זה שינויים מהדרוג של שנת 2012

באתר יש מידע  רב נוסף על 15 אתרים פופולריים בתחומים שונים:

בריאות, שיתוף קבצים, גדג'טים, תמונות , אתרי יעץ , אתרי מדע, סימניות חברתיות, רשתות חברתיותאתרי ווב 2.0  , מסחר אלקטרוני, חדשות ועוד.

wianבתחום אתרי היעץ- Wikipedia  נמצאת במקום ראשון. כמו כן בולטת הפופולריות של אתרי שאלות ותשובות  כמו Yahoo! Anwers , Answers, AllExperts

לאתר

Google Panda – בעתיד שילוב אינטגרטיבי יותר במערך הכללי של האלגוריתמים

pandasבתאריך 24 בפברואר 2011  גוגל הכניסה שינוי קטן בשם  "Panda"   לאלגוריתם דרוג התוצאות שלה במטרה להציף תוצאות איכותיות למעלה- לראש תוצאות החיפוש. השינוי משפיע על תוצאות החיפוש ויש לו משמעות לגבי האופטימיזציה של מנועי חיפוש וכל העוסקים בכך..

 מאז ועד ינואר 2013  הוכנסו 24 עדכוני Panda בתאריכים מסוימים והשינויים  בעקבות כך בתוצאות החיפוש היו  "חדים" דיים  כדי שנחוש אותם.

 בפוסט מעניין שהתפרסם ב- 13   במרץ 2013  בנושא אפשר למצוא רשימה כרונולוגית של  עדכוני ה- Panda  והשפעתם על תוצאות החיפוש, שניכרה בדרגות שונות מעדכון לעדכון.  

 אלא שעל פי הצהרתו של  Mutt Cutts  , ראש צוות ה- webspam    בגוגל, ב- 13 במרץ 2013 ,  בעתיד השינויים לא יתבצעו ביום מסוים אלא ישולבו בזמן אמת באופן הדרגתי במערך הכללי של האלגוריתמים  ולכן יהיו פחות ניכרים ומשמעותיים מבחינתם של מנהלי האתרים וכל העוסקים באופטימיזציה של מנועי חיפוש.

 בכל מקרה , כדי להגיע  למקום מכובד בתוצאות החיפוש כדאי לשמור על איכות גבוהה של התכנים  ולשם כך  אפשר להיעזר בפוסט מעניין של גוגל  בו מוצגים קריטריונים ברורים שלו  לדירוג תוצאות החיפוש ולזכור אותם בפיתוח התכנים באתר.