פרסונליזציה של תוצאות החיפוש והדור הבא של מנועי חיפוש

 אחד הפתרונות לתוצאות רלוונטיות יותר במנועי חיפוש הוא  הפרסונליזציה – התאמת תוצאות החיפוש למשתמש.

לעתים יש שאילתות מורכבות  או שאילתות בהן למונחי החיפוש יש כמה משמעויות והבעיה היא להציג תוצאות רלוונטיות לשאילתה  . כך למשל אילו תוצאות ידורגו בראש התוצאות כאשר המשתמש מחפש את המונח יגואר  – האם תוצאות של יגואר במשמעות יגואר החיה , המחשב או המכונית

אחת הפתרונות לתוצאות רלוונטיות יותר במנועי חיפוש הוא  הפרסונליזציה – התאמת תוצאות החיפוש למשתמש. שיטת הפרסונליזציה שמושתתת על התאמת התוצאות לפרופיל של משתמש לא תמיד יעילה שכן אותו משתמש יכול לחפש מונח מסוים בפעמים שונות בהקשרים שונים. מכאן החשיבות של פרסונליזציה בזמן אמת. פרסונליזציה בזמן אמת יכולה להתבסס על הקלקה על תוצאות החיפוש.

מנועי חיפוש ניסו תמיד לזהות דפוסי התנהגות  בכול הקשור להקלקה על תוצאות החיפוש .אך  טכניקות אלה היו גלובליות ולא אישיות.  כך למשל אם דפוס ההקלקה  השכיח ביותר היה בהקשר מסוים,  אותו  הקשר הוצג בפני רוב או כול המשתמשים 

החוקרים באוניברסיטת צפון קרוליינה פתחו  שיטה חדשה לפרסונליזציה של תוצאות החיפוש  שמותאמת למשתמש ספציפי בזמן אמת .

על פי שיטה זו נבדקים החיפושים האחרונים של המשתמש  והמונחים הקשורים למונחי השאילתה. כך למשל אם חיפוש קודם של משתמש ספציפי כלל את המונח  "שימור"  הוא יהיה קשור גם עם מונחים כגון חיות, חיות בר, גני חיות  ולכן בתוצאות החיפוש הראשונות של המונח יגואר  תוצג החיה ולא המחשב  או המכונית .  שיטה זו  פותחה כבר לפני שנה אבל מאחר והשיטה  גוזלת הרבה משאבי מחשב  ניתן היה ליישמה על מספר קטן יחסית של משתמשים בו זמנית. השנה  במקביל לשימוש בשיטה זו  פותחו גם שיטות אינדוקס וארכיטקטורות חדשות לארגון האינדקסים באופן שהשיטה תומכת  במספר גדול יותר של   משתמשים בו זמניים  .

bigנייר העבודה שמציג את השיטה  “Personalizing Search: A Case for Scaling Concurrency in Multi-Tenant Semantic Web Search Systems,”

הוצג בכנס  2013 IEEE International Conference on Big Data   שנערך ב-6-9 באוקטובר ב- Santa Clara, Calif

לכתבה בנושא

Pipl וחיפוש אנשים ברשת

leחיפוש אנשים בווב היא פונקציה די שכיחה. אפשר כמובן לחפש בגוגל  תוך שימוש באסטרטגיות חיפוש  מתאימות . מעבר לגוגל אפשר לחפש במנועי חיפוש ייעודיים שקיימים בווב  כגון :  Infospace, Argali , Zoominfo,  Infobel , Freeality  ועוד 

piplמנוע חיפוש ייעודי , לא חדש  אבל  ייחודי  הוא PIPL.   היום הוא מעניין יותר מבעבר בעיקר בגלל ריבוי הפרופילים ברשתות חברתיות. היחוד שלו על פי מה שמוצהר באתר הוא שהוא מחפש ברשת הלא נראית כלומר מציג מידע שאינו מוצג במנועי חיפוש כלליים.

אפשר לחפש על פי שם , דואל, שם משתמש וטלפון.הזנת מיקום אופציונלית.  בתוצאות מוצגים  פרופילים ואתרי ווב. בסרגל הצדדי מוצגים קישורים לכלי חיפוש נוספים  כגון  Spokeo   שמאפשרים חיפוש מידע חסוי יותר שרובו ניתן להשיג בתשלום.

Redz – מנוע חיפוש ויזואלי

 redzRedz  הוא מנוע חיפוש שבו תוצאות החיפוש מוצגות בצורה ויזואלית – תמונה מוקטנת של דפי התוצאות.  תצוגה זו מקלה על תהליך הדפדוף.  הוא משמש גם למטרות פרסום ושיווק.  

למנוע החיפוש 3 לשוניות חיפוש – תמונות , וידיאו וווב  .

מהתנסות קצרה עם מנוע החיפוש למטרות חיפוש בלבד  נראה שההצגה הוויזואלית מקלה על תהליך הדפדוף והתוצאות שהתקבלו היו  לרוב רלוונטיות לחיפוש.

למנוע

הווב הסמנטי – מנועי חיפוש ומפתחי אתרים

מנועי חיפוש מאמצים בהדרגה טכנולוגיות סמנטיות . כבר בשנת 2003  גוגל רכשה את applied semantic.   מאוחר יותר Microsoft  הלכה בעקבותיה ורכשה  בשנת 2008 את powerset ואת  zoomix שתי חברות   מתמחות בתחום הטכנולוגיה הסמנטית. ההצהרה של גוגל משנת 2012  בדבר אימוץ טכנולוגיות סמנטיות מחזקת את  דבקות ענקיות החיפוש במגמה לאמץ טכנולוגיות סמנטיות

נשאלת השאלה כיצד ישפיע  הדבר על בעלי אתרי הווב בכול הקשור לאופטימיזציה של מנועי חיפוש וכיצד להיערך ?

Michalis 'Big Mike' Kotzakolios  בספרו Web 3.0  Semantic Search (זמין באמזון בגרסת קינדל)  כולל מספר המלצות  לבעלי אתרים.

המשמעות של טכנולוגיות סמנטיות מבחינת מנועי החיפוש הוא הבנת התכנים של דפי הווב בצורה טובה יותר ומעבר לאינדוקס וניתוח מ- text patten matching model  ל-  vector space model

מבחינת אופטימיזציה של מנועי החיפוש המשמעות היא מעבר מאופטימיזציה שמתמקדת במלים מסוימות לתפיסה של המשמעות הרחבה של התכנים ביחס לכול המלים והביטויים שבהם נעשה שימוש,  ואינדוקס דפי ווב באופן  שגם מלים וביטויים שאינם נמצאות בהכרח בתכנים  של הדפים יכללו באינדקס המשויך לאותם דפים וזאת  מפני שהם רלוונטיים למשמעות הרחבה של הדפים.

לאור זאת מומלץ על  שימוש רב ככל האפשר במלים  דומות או נרדפות ששייכות לנושא,  ולהימנע משימוש רב  באותו מונח.   כמו כן מומלץ לקצר  בתכנים  ולהסתפק ב- 350 -400 מלים מכיוון שככול שהדף ארוך יותר כן יקשה להבין  את המשמעות הנכונה שלו

google-wהמלצות נוספות הן  כתיבת הדף ב- HTML5  ושימוש נכון ב-.microdata  לבחינת השימוש הנכון ב-microdata  אפשר להשתמש בכלי הייעודי של גוגל לצורך כך   Structured Data Testing Tool

open-gכמו כן  לאור המגמה של מנועי חיפוש להסתמך בתוצאות החיפוש על המעגלים החברתיים של המשתמש מומלץ לא להתעלם מ- Open Graph Protocol וזאת כדי לאפשר את הכללת דפי הווב בתוצאות החיפוש מבוססות המעגלים החברתיים.

מאחר ומנועי החיפוש כוללים באופנים שונים גם אלמנט אנושי וחברתי בדרוג התוצאות הרי בנוסף לטיפים אלה חשוב לדאוג שהמשתמש ירצה לשוב לדף ולכן חשוב שדפי הווב יהיו קלים לניווט ויכללו אלמנטים אטרקטיביים  תוך שימוש בכלים וווידגטים שיעשירו את חווית המשתמש. כול זה יעשה בתהליך מתמשך ודינמי כווב עצמו.

מנוע החיפוש Zeekly ושמירת הפרטיות

 בזמן האחרון,  לאחר שנודע  שהסוכנות לביטחון לאומי בארה"ב  אספה מידע של משתמשים ישירות מחברות אינטרנט אמריקאיות כגון פייסבוק וגוגל  במטרה לעקוב אחרי אנשים מחוץ לארה"ב, התעוררה בעיית שמירת פרטיות המידע ברשת ביישומיים  שונים כולל  מנועי חיפוש  

 בזמנו כתבתי פוסט בבלוג על מנועי החיפוש StartPage   ו- Ixquick  ששומרים על פרטיותו של המשתמש יותר מאחרים. גם DuckDuckGo  נמנה על מנועים מסוג זה ובעת האחרונה נרשמה עליה בתעבורה של מנועי חיפוש אלה.  

 zeekly מנוע נוסף פחות מוכר שנמצא עדיין בגרסת ביתא  ששייך לקטגוריה זו הוא  Zeekly. על פי מה שנכתב באתר Zeekly  מחפש במקורות מידע שונים בווב – גוגל, יאהו, בינג , אמזון, יוטיוב ובאינדקס עצמאי משלו ומציג את המידע בסביבת מידע  מאובטחת ומוצפנת ששומרת על הפרטיות . הוא אינו שומר היסטוריה של חיפושים ומשתמש בפרוטוקול תקשורת שמאפשר תקשורת מאובטחת ומוצפנת – 2048-bit SSL.  

 העובדה שהוא לא משתמש רק במנועי חיפוש אחרים אלא גם בזחלן ובאינדקס עצמאי משלו מייחדת אותו ממנועי החיפוש האחרים בקטגוריה מנועי החיפוש ששומרים על הפרטיות שהוזכרו לעיל.

 אפשר להגביל את החיפוש מראש לסוגי חומרים שונים – תמונות, וידאו, חדשות, אודיו,ויקי, ספורט, אמזון, בלוגים, PDF   , פורומים ומלונים . יש למנוע  גם מנשק לחיפוש מתקדם שמאפשר גם הגבלה לדומיין מסוים .

 למנוע  

אחזור מידע רפואי – השוואה בין Pubmed ו- Google Scholar

 המאגר הרפואי Pubmed  ומנוע החיפוש המדעי Google Scholar  שניהם  כלים חופשיים. עם גידול  השימוש בגוגל סקולר גם לחיפושים בתחום הרפואה,  מעניין  לערוך השוואה בין שני הכלים.

 jourמחקר שתוצאותיו התפרסמו  בגיליון אוגוסט  2013  של כתב העת  Journal of Medical Internet Research   עשה זאת. המחקר השווה את יעילות אחזור המידע של ספרות רפואית קלינית  בין  גוגל סקולר  ו- Pubmed .

 ההשוואה בוצעה על ידי 100  שאילתות מתחום  הנפרולוגיה שבוצעו בשני הכלים. מילות החיפוש לצורך החיפושים סופקו על ידי מומחים בתחום. ההערכה נעשתה על ידי השוואה של ההחזר והדיוק – 2 מדדים שימושים ומקובלים בהערכת מערכות מידע על פי פרדיגמת המערכת. נבדקו 40 תוצאות ראשונות בכל אחת מהמערכות. בנוסף לבדיקת שיעורי ההחזר והדיוק  נבדק  גם אחוז המאמרים  בטקסט מלא מתוך המאמרים הרלוונטיים שאוחזרו בכול אחת מהמערכות.

המחקר מצא שגוגל סקולר אחזר פי שניים מאמרים רלוונטיים מ- Pubmed ופי שלוש  מאמרים רלוונטיים בטקסט מלא.

 בהתחשב בעובדה שנבדקו 40 תוצאות ראשונות , יתכן שהיתרון בשיעורי הרלוונטיות של התוצאות בגוגל סקולר נבע מהאופן השונה של הצגת התוצאות בשתי המערכות ומהעובדה שגוגל סקולר מדרג את התוצאות על פי מידת הרלוונטיות. כאשר נלקחו בחשבון כל התוצאות ולא רק 40 התוצאות הראשונות שיעורי ההחזר היו דומים בגוגל סקולר ו- Pubmed ,  בעוד ששיעורי הדיוק  היו טובים יותר ב-Pubmed .  ממצאים אלה דומים לממצאי מחקרים קודמים בהם נערכה השוואה בין שני הכלים בתחומי רפואה אחרים. שיעורי ההחזר גדולים יותר בגוגל סקולר לעומת שיעורי דיוק גדולים יותר ב- Pubmed .

 בכל מקרה,  בהתחשב בעובדה שבדרך כלל  המשתמש לא בודק את כול התוצאות,  מסקנת המחקר על פיה מתוך 40 התוצאות הראשונות שיעורי המאמרים הרלוונטיים ואלה שנמצאו בטקסט מלא היו גבוהים יותר בגוגל סקולר, משמעותית  למשתמש.

להכללת התוצאות יש צורך  במחקרים דומים בתחומי רפואה נוספים .

 למאמר  המלא  

Kadaza – עמוד שער ויזואלי לווב

k2Kadaza הוא מדריך ששם לו ליעד  לשמש כעמוד שער  לווב  כפי שהגדיר זאת  באתר : "Let's create world's most reliable website encyclopedie".

האתרים במדריך נבחרים על ידי צוות המפתחים  ומסודרים בקטגוריות נושאיות . אפשר לדפדף בקטגוריות השונות גם על פי רשימה אלפביתית. האתרים בכול אחת מהקטגוריות מוצגים בצורה ויזואלית – מוצג הלוגו של כול אחד מהאתרים. בנוסף למנשק הוויזואלי שמקל על הניווט, createהקטגוריות מוגדרות  בצורה שמקלה על הדפדוף, כולל הגדרת פונקציות פעולה ולא רק שמות. כך למשל באות "c"   אפשר למצוא create a website" " או "create blog"   ובדפים המקושרים אפשר לראות בצורה ויזואלית יישומים רלוונטיים.

כפי שמוגדר באתר, Kadaza  הוא למעשה תוצאה של מחקר  שמצא שרק חלק קטן מאתרי הווב נמצא בשימוש אינטנסיבי   ואת אותם אתרים בחרו מפתחי המנוע להציג כדי להקל על החיפוש.

כפי שצוין לעיל האתרים הם אתרים נבחרים . למפתחי אתרים יש אופציה לשלוח את  כתובות עמודי הבית שלהם כדי להכלילם במדריך.

מאפיין נוסף של  Kadaza  בהתאם למטרה המוצהרת שלו לשמש כדף שער  ויזואלי לווב היא האפשרות בעמוד הבית לחפש בכול אחד ממנועי החיפוש העיקריים – גוגל, יאהו, בינג וגם ב- Youtube  וב-   Wikipedia.  בנוסף אפשר להגביל את החיפוש לאתרי ווב, וידאו  ותמונות .

קיימת אפשרות גם להתאמה אישית של הדף.

Kadaza אמנם אינו יישום חדש אך  הוא גדל ומתחדש מדי יום , הוא לא כל כך מוכר ואולי כדאי להכירו.

לאתר

התפתחויות בחיפוש חברתי – עבר, הווה ועתיד

patentב- 23 ביולי 2013  גוגל  רשמה לזכותה פטנט חיפוש נוסף והפעם בתחום החיפוש החברתי . הפטנט אושר  לחברה  על ידי משרד הפטנטים האמריקאי  והוא תומך בסינון מידע חברתי בתוצאות החיפוש. סינון תוצאות החיפוש נעשה על פי הגרף החברתי והנוכחות החברתית של המשתמש כלומר מתבצע זיהוי תכנים שנוצרו על ידי אחד או יותר ממשתמשי הרשת החברתית של המשתמש –  יוצגו תוצאות חיפוש שמתבססות על תכני ווב שנכתבו, שותפו או צוינו ב-  like על ידי אנשים ברשת החברתית של המשתמש, בהקשר זה מן הראוי לציין שהרשת החברתית גוגל פלוס מנתה  במאי 2013 למעלה מ- 500 מיליון משתמשים רשומים מתוכם 225  מיליון משתמשים פעילים.

פטנט זה הוא רק ציון דרך נוסף במגמה של הדמיון המסתמן בין רשתות חברתיות ומנועי חיפוש. בינג בסרגל החברתי שלו משלב מידע מהרשת החברתית פייסבוק כולל המלצות מחברים, גוגל משתמש במידע מגוגל פלוס לדירוג תוצאות החיפוש, ומנוע החיפוש החדש של פייסבוק דולה מידע  מחברים כולל שמות ותמונות.

מסתבר שהאלמנט של החיפוש החברתי היה קיים כבר מראשית דרכם של מנועי החיפוש. אינפוגרף של חברת  Yext ממחיש את התופעה החל מ- 1990 ועד היום. התופעה החלה ב- 1990 בחיפוש ב-Archie   והמשיכה בפונקציות שונות בהן נטל חלק הגורם האנושי /חברתי במנועי החיפוש השונים: Yahoo, Google, TripAdvisor, Digg, Reddit, Yelp, Foursquare  ולאחרונה פייסבוק עם גרף החיפוש.

נוכח מצב זה סביר להניח שהחברה שתצליח לשלב בהצלחה ובצורה היותר טובה מדיה חברתית בתוצאות החיפוש  תזכה בעתיד בציון הגבוה ביותר במדד  ACSI   – The American Customer Satisfaction Index

שביעות רצון מאתרים חברתיים, מנועי חיפוש ופורטלים על פי מדד ACSI

aACSI   – The American Customer Satisfaction Index  הוא מדד כלכלי לאומי של הערכה ושביעות רצון הצרכנים האמריקאים ממוצרים ושירותים. מדד ACSI מיולי 2013 מבוסס על סקר שביעות רצון של 70000   צרכנים מ-230 חברות ב- 43 תעשיות ו-10 מגזרים כלכליים , למעלה מ- 130 משרדי ממשלה, סוכנויות ואתרי ווב. המדד משתמש בסולם של 100 נקודות.

 על פי מדד יולי 2013  האתרים החברתיים הפופולריים ביותר ממשיכים לקבל את הציונים הנמוכים ביותר. Facebook   ו- LinkedIn קיבלו את הציון הנמוך ביותר –  62  נקודות. נראה שנושא שמירת הפרטיות היה בעוכריה של פייסבוק. Pinterest זכתה לציון הגבוה ביותר בין הרשתות החברתיות – 72 נקודות ואחריה Google+      ו- YouTube עם ציון של 71 נקודות. Twitter  עלה בנקודה אחת יחסית לשנה החולפת וזכה לציון של 65 נקודות – ציון שהוא עדיין נמוך מהממוצע בקטגוריה זו. נראה שבעיות יכולת ודיוק בחיפוש  עומדים בעוכריו של טוויטר

 גם השנה וויקיפדיה זכתה בציון הגבוה ביותר מבין האתרים החברתיים – 78 נקודות .

 באופן כללי מנועי חיפוש זכו לציונים גבוהים יותר מהאתרים החברתיים. אך גם כאן המגמה היא של ירידה  . בשביעות הרצון ממנוע החיפוש גוגל נרשמה ירידה של 5 נקודות והציון שקיבל- 77 הוא הנמוך ביותר שלו בהיסטוריה של ACSI  . אך עדיין הציון שלו גבוה משאר מנועי החיפוש והפורטלים- בינג ויאהו – 76 , MSN – 74, AOL – 71  .   באופן כללי הציון לו זכו מנועי החיפוש והפורטלים הוא הנמוך ביותר מאז 2007 . נראה שהתסכול של המשתמשים מאיכות הפרסומות ומהירות תגובה היו אחראים לירידה זו

 לממצאים נוספים ומידע נוסף

מעבר לגוגל – 10 מנועי חיפוש שכדאי לזכור

ב- 8 ביולי יאהו  הורידה את מנוע החיפוש בן 18 השנים ALTAVISTA  .  לכבודו של מנוע וותיק זה ולזכר הימים בהם  היו שחקנים רבים  במגרש החיפוש התפרסמה כתבה  שיכולה להיות שימושית ובה סקירה קצרה על 10 מנועי חיפוש ייעודיים שמתוארים כמנועי חיפוש שעדיין מסוגלים לעשות את מה  שגוגל אינו יכול.

wol2המנועים אינם חדשים ורובם מוכרים אבל בכול זאת אולי כדאי לצרכים מסוימים לזכור גם אותם. הבולטים בהם:  The Wayback Machine  ארכיון הווב , Wolfram Alpha  The "computational knowledge engine" שגוגל החל לשלב תוצאות ממנו במנוע החיפוש שלו, Creative Commons Search  לחיפוש  פריטי מידע  במסגרת הרישיון הגמיש של creative commons  , Duck Duck Go שאינו שומר היסטוריה של חיפושים ובכך שומר על הפרטיות של המשתמש, מסנן ספאם, מנסה לענות על שאלות ישירות ובכך חוסך למשתמש ניווטים מיותרים , Giphy ו- TinEye מנועי חיפוש ייעודיים ובעלי מאפיינים ייחודיים לתמונות ועוד 

מידע נוסף בכתבה

Webicine – מנוע לחיפוש מידע חברתי רפואי איכותי בווב

הרבה  חומר רפואי נמצא היום ברשתות חברתיות.   לעתים החומר שנמצא ברשתות אלה חשוב ויכול לסייע הן לחולים והן לרופאים כי הוא בדרך כלל מידע עדכני ודינמי שמושתת לרוב על הניסיון וההתנסות  של החולים והרופאים, אבל  לעתים הוא יכול להיות גם מידע שגוי , לא מהימן ומטעה. לכן חשוב שהמידע יעבור בקרת איכות .

webicineזוהי מטרתו של מנוע החיפוש – Webicine.

על פי מה שנכתב באתר, מנוע החיפוש כולל מקורות מידע איכותיים ומהימנים מיישומי ווב 2.0  – בלוגים, קבוצות בפייסבוק, טוויטר וערוצי יוטיוב. המנוע מכסה נכון להיום 5000   מקורות מידע,  140 נושאים ב- 20 שפות.  אפשר לעדן את תוצאות השאילתה על פי אשכולות – קטגוריות נושאיות, סוגי מקורות ושפות

cuהיעד של המנוע כפי שאופיין על ידי ארגון הבריאות העולמי וכפי שהוצג ב- Yale-, Stanford, Harvard  הוא לאפשר לחולים ולאנשי המקצוע שימוש בטוח ויעיל ברשת האינטרנט. הצוות האחראי על המנוע כולל אנשי מקצוע ויועצים שנחשבים  גּוּרוּאִים ב- e-health בתחומם curation2sוארצותיהם. מיסדה של Webicine  הוא ד"ר  Bertalan Meskó שידוע גם בשם  Dr. Twitter or Dr. House on Twitter ומראיון עימו שפורסם ב- 17 ביוני 2013 אפשר ללמוד על תהליך  העבודה ב-Webicine – תהליך שמטרתו להבטיח איכות.

לאתר

iSEEK -Education – מנוע חיפוש ייעודי לתחום החינוך

iseekiSEEK -Education כפי שכתוב באתר הוא מנוע חיפוש שכולל אתרים איכותיים ומיועד לסטודנטים, מורים  ולקהל הרחב. אפשר להגביל מראש את החיפוש למקורות מתחום החינוך על ידי בחירה בלשונית Education , להרחבת החיפוש אפשר לבחור בלשונית Web.ממעט החיפושים שערכתי נראה שהוא מיועד יותר ל-K-12 .

למנוע החיפוש יש מספר מאפיינים ייחודיים שהופכים את החיפוש לאיכותי ונוח יותר. הוא תומך בחיפוש בשפה טבעית, בתהליך החיפוש הוא יוצר on the fly  אשכולות  בהם אפשר לעדן את שאילתת החיפוש. האשכולות כוללים אשכולות נושאיים, מקומות, ארגונים, תאריך, ואשכולות ייחודיים לתחום החינוך:  מערכי שיעורים, רמות חינוך ועוד. כמו כן אפשר לעדן את תוצאות השאילתה על פי מקור – iSEEK Authoritative ו- General Web . מקורות המידע בקטגורית ה- Authoritative הם מקורות שנבחרו ידנית על ידי אנשי חינוך ומתעדכנים מדי שבוע. יש לציין שבמעט החיפושים שערכתי, בניגוד למצופה, התוצאות בקטגוריה  General Web היו רלוונטיות יותר .

הרשמה חופשית למנוע מאפשרת יצירת חשבון אישי בו אפשר ליצור ספרייה אישית של  אתרים מועדפים ומנוע החיפוש מאפשר לחפש רק בה, דרך לשונית החיפוש MySeek  שמתווספת לשתי  לשוניות החיפוש הקיימות: education   ו- Web . אפשר ליצור גם פורטל אישי ולהוסיף לו מבחר יישומים וגדגטים – Portlets מוצעים.

למשתמשים יש גם אפשרות להמליץ על אתרים להוספה למנוע. , האתרים המומלצים  ייבחנו לצורך הכללתם במנוע על פי קריטריונים מוגדרים  לאיכות

למנוע החיפוש

StartPage, Ixquick , Startmail ושמירת הפרטיות

 בזמן האחרון נודע  שהסוכנות לביטחון לאומי בארה"ב  אספה מידע של משתמשים ישירות מחברות אינטרנט אמריקאיות כגון פייסבוק וגוגל  במטרה לעקוב אחרי אנשים מחוץ לארה"ב .  בעקבות מידע זה  מתעוררת בעיית אבטחת המידע ושמירת הפרטיות ביישומים השונים ברשת בהם אנו משתמשים כולל מנועי חיפוש ושירותי דואר.

 iqבהקשר זה כדאי לזכור לטובה את מנועי החיפוש StartPage   ו- Ixquick  שמכנים עצמם  " the world's most private search engines"   וזאת בזכות המאפיינים שמטרתם להגן על הפרטיות של המשתמש. במנועי חיפוש אלה אין רישום של  כתובות ה-IP   והחיפושים שעורכים המשתמשים , אין מעקב אחר cookies  וקיימת הצפנה – HTTPS  .

 startמבחינה מסוימת שני מנועי החיפוש משלימים זה את זה –   Ixquick הוא מנוע-על וותיק שמספק תוצאות חיפוש שאינן כוללות תוצאות חיפוש של גוגל ו- StartPage  הוא למעשה שילוב של תוצאות החיפוש של גוגל ושמירת הפרטיות של Ixquick.  

 ומה בדבר שירותי דואר שמבטיחים פרטיות? 

פלטפורמת דואר עם מערכת הצפנה חזקה מאותו בית startהיוצר שתוצג לקראת סוף השנה היא StartMail.  מי שמעוניין להתנסות בגרסת ביתא של מערכת זו יכול להירשם בכתובת http://www.Startmail.com .

 מסתבר שהחשש לפרטיות  בעקבות המידע שפורסם לאחרונה על איסוף המידע על ידי הסוכנות לביטחון לאומי בארה"ב  החל לתת אותותיו  – התעבורה במנועי  החיפוש  StartPage ו- Ixquick    גדלה  לאחרונה באופן דרמטי.

 לכתבה בנושא

 

VirtualLRC – מנוע ייעודי לחומרי לימוד ומידע אקדמי

LCRVirtual Learning Resources Center- VirtualLRC  הוא מנוע חיפוש מותאם אישית של גוגל לחומרי לימוד ומידע אקדמי  בתחומים שונים. האינדקס של המנוע כולל אלפי אתרים נבחרים שכוללים מידע אקדמי  .

על פי מה שנכתב באתר מנוע החיפוש משלב אינדקס של למעלה מ- 10000 דפי ווב שמתוחזקים על ידי אדם ומנוע –על שתוצאות החיפוש שלו כוללות מידע ממדריכי נושאיים מומלצים  בפורטלים ובאתרי  אוניברסיטאות,  וספריות ציבוריות.

הכיסוי הוא רב תחומי .    

באתר יש קישור לדף  מנועי חיפוש שמושתתים על אותה טכנולוגיה ומאותו בית היוצר:

Alphamarks, MagBot , MagSearch , NewsBot , Academic Index ו- Infotopia

 

למנוע החיפוש  

נוף המחקר הגלובלי – מקורות מידע

מאמר שהתפרסם בגיליון מאי 2013 של College & Research Libraries News כולל רשימה ותיאור של מקורות מידע חופשיים. הרשימה כוללת מקורות מידע כלליים, קטלוגים מאוחדים, כלי חיפוש לאוספים דיגיטליים ותזות .

1להלן מספר דוגמאות למקורות מידע שנכללים ברשימה: ShareILL.orgוויקי שמתוחזק על ידי ספרנים להשאלה בינספרייתית בארה"ב שמטרתו לסייע לאתר מקורות מידע רלוונטיים. האתר כולל גם את רשימת הספריות הלאומיות בעולם .

2Trove-  Australia – פורטל חופשי של הספרייה הלאומית באוסטרליה כולל גם גישה למקורות מידע חופשיים,  3The European Libraryאגרגטור של  מצאי דיגיטלי ופיזי של 48 ספריות לאומיות באירופה ומספר ספריות מחקר ו4NDLTDספרייה דיגיטלית של תזות ודיסרטציות

לרשימה המלאה

FileTube – מנוע חיפוש ייעודי לחיפוש קבצים

filesFileTube הוא מנוע חיפוש ייעודי לחיפוש קבצים.  הוא כולל באינדקס שלו קבצים מאתרים שיתופיים ואתרים להורדת קבצים כגון : Uploaded.to, Rapidgator.net, Netload.in, 4shared.com, Extabit.com, Turbobit.net, Mediafire.com  ואתרים נוספים אחרים.

באתר יש מנשק חיפוש בסיסי ומתקדם. בשני המנשקים אפשר להגביל את החיפוש  על פי סוג קובץ. בחיפוש המתקדם יש אפשרות להגבלות נוספות : גם על פי גודל הקבצים , תאריך והאתר ממנו לקוחים הקבצים.

בתוצאות החיפוש מקבלים מידע על הקבצים: סוג קובץ, תאריך גודל  ומידע על המקור ממנו לקוח הקובץ עם אפשרות להורדת הקבצים ישירות מתוצאות החיפוש.

למנוע החיפוש  

חיפוש טבלאות בגוגל

בזמנו כתבתי על מנוע חיפוש ייעודי לטבלאות ונתונים סטטיסטיים  ZANRAN

google-tablesשירות דומה ניסיוני מעניין של גוגל לחיפוש טבלאות הוא google tables . באתר זה אפשר להזין שאילתה בנושא כלשהו ומנוע החיפוש מציג טבלאות שחילץ מתוך דפי ווב  וגם טבלאות פתוחות לציבור מתוך  fusion tables.  את הטבלאות שנמצאו בעזרת google tables   אפשר לייבא ל- fusion tables   לצורך עיבודים נוספים, ויזואליזציה וכו' .  כדאי לציין שבמעט החיפושים שערכתי חלק  מהטבלאות נלקחו  מוויקיפדיה ומבלוגים מקצועיים.

ל-google tables

הודעה על שירות  google tables

FreeFullPDF – מנוע לחיפוש חומר אקדמי חופשי

FreeFullPDFfree       הוא מנוע חיפוש  לקובצי pdf  חופשיים  שפותח על ידי KnowMade. על פי מה שנראה הוא מנוע מותאם אישית של גוגל. על פי מה שמוצהר באתר מנוע החיפוש כולל למעלה מ- 80  מיליון פריטי מידע חופשיים בתחומי המחקר השונים : מדעי הרוח והחברה,  מדעי החיים, מדעי הפיסיקה ומתמטיקה .

 את תוצאות החיפוש אפשר לעדן על פי סוגי חומרים:  מאמרים, פטנטים, פוסטרים ותזות

 למנוע 

OATD – כלי חדש לחיפוש תזות בגישה פתוחה

oadOATD  – Open Access Theses and Dissertation הוא  שירות חדש כולל לחיפוש תזות ודיסרטציות   בגישה  פתוחה. כיום הוא  מאנדקס למעלה מ- 1.5 מיליון תזות  בגישה חופשית  מ– 600 אוניברסיטאות ומוסדות אקדמיים אחרים ב רחבי העולם . התזות עצמן נמצאות באתר המקורי שלהן והשירות רק מאפשר גישה אליהן.

הסטטוס של התזות  שנגישות בשירות זה מוגדרות באתר כתזות בגישה פתוחה במשמעות שהן נגישות לקריאה ולהורדה  ועל פי מה שמוצהר באתר האחראים על השירות מעודדים את המחברים להעניק זכויות נוספות במסגרת הרישיונות הגמישים של  creative commons .

ממנשק התוצאות יש גישה לטקסט המלא, לרשומה ביבליוגרפית מלאה, לפריטי מידע דומים וקיימת גם אופציה ליצוא ישיר לרשתות חברתיות אקדמיות ואתרי סימניות חברתיים

מנשק התוצאות כולל אופציות לעידון השאילתה על פי תאריך, אוניברסיטה, תואר ושפות

השירות תומך בפרוטוקול  OAI-PMH     – פרוטוקול נתמך על ידי רוב הפלטפורמות של מאגרי התזות המוסדיים  כגון  DSpace, Digital Commons, eprints, ETD-db, and ContentDM לכן תהליך האיסוף הוא בדרך כלל פשוט .

הוועדה המכוננת של השירות  כוללת ספרנים מומחים מאוניברסיטאות בארה"ב.

באתר השירות   אפשר למצוא גם התייחסות והשוואה עם שירותים אחרים לחיפוש תזות שקיימים היום כגון: PQDT ,  NDLTD יחודו של השירות החדש הוא שנכון להיום הוא מאנדקס רק תזות חופשיות לקריאה והורדה.

 לאתר

לכתבה בנושא