פרסונליזציה של תוצאות החיפוש והדור הבא של מנועי חיפוש

 אחד הפתרונות לתוצאות רלוונטיות יותר במנועי חיפוש הוא  הפרסונליזציה – התאמת תוצאות החיפוש למשתמש.

לעתים יש שאילתות מורכבות  או שאילתות בהן למונחי החיפוש יש כמה משמעויות והבעיה היא להציג תוצאות רלוונטיות לשאילתה  . כך למשל אילו תוצאות ידורגו בראש התוצאות כאשר המשתמש מחפש את המונח יגואר  – האם תוצאות של יגואר במשמעות יגואר החיה , המחשב או המכונית

אחת הפתרונות לתוצאות רלוונטיות יותר במנועי חיפוש הוא  הפרסונליזציה – התאמת תוצאות החיפוש למשתמש. שיטת הפרסונליזציה שמושתתת על התאמת התוצאות לפרופיל של משתמש לא תמיד יעילה שכן אותו משתמש יכול לחפש מונח מסוים בפעמים שונות בהקשרים שונים. מכאן החשיבות של פרסונליזציה בזמן אמת. פרסונליזציה בזמן אמת יכולה להתבסס על הקלקה על תוצאות החיפוש.

מנועי חיפוש ניסו תמיד לזהות דפוסי התנהגות  בכול הקשור להקלקה על תוצאות החיפוש .אך  טכניקות אלה היו גלובליות ולא אישיות.  כך למשל אם דפוס ההקלקה  השכיח ביותר היה בהקשר מסוים,  אותו  הקשר הוצג בפני רוב או כול המשתמשים

החוקרים באוניברסיטת צפון קרוליינה פתחו  שיטה חדשה לפרסונליזציה של תוצאות החיפוש  שמותאמת למשתמש ספציפי בזמן אמת .

על פי שיטה זו נבדקים החיפושים האחרונים של המשתמש  והמונחים הקשורים למונחי השאילתה. כך למשל אם חיפוש קודם של משתמש ספציפי כלל את המונח  "שימור"  הוא יהיה קשור גם עם מונחים כגון חיות, חיות בר, גני חיות  ולכן בתוצאות החיפוש הראשונות של המונח יגואר  תוצג החיה ולא המחשב  או המכונית .  שיטה זו  פותחה כבר לפני שנה אבל מאחר והשיטה  גוזלת הרבה משאבי מחשב  ניתן היה ליישמה על מספר קטן יחסית של משתמשים בו זמנית. השנה  במקביל לשימוש בשיטה זו  פותחו גם שיטות אינדוקס וארכיטקטורות חדשות לארגון האינדקסים באופן שהשיטה תומכת  במספר גדול יותר של   משתמשים בו זמניים  .

נייר העבודה שמציג את השיטה  “Personalizing Search: A Case for Scaling Concurrency in Multi-Tenant Semantic Web Search Systems,”

הוצג בכנס  2013 IEEE International Conference on Big Data   שנערך ב-6-9 באוקטובר ב- Santa Clara, Calif

לכתבה בנושא

חישוב הרלוונטיות בפרימו – יוזמה חדשה

  המו"ל  המדעי  Elsevier  וחברת Ex Libris Group  הצהירו על יוזמה משותפת להשתמש בשני המדדים – המדד   המנורמל  למאמר   SNIP     והמדד לדרוג כתבי עת  SCImago Journal Rank-  SJR  לצורך חישוב הרלוונטיות ודרוג תוצאות החיפוש בפרימו

בעבר כתבתי פוסט בבלוג על שני המדדים – שני המדדים מבוססים על התכנים השפיטים במאגר Scopus ,  מדד SNIP     לוקח בחשבון את העובדה ששכיחות הציטוטים שונה  מתחום מחקר אחד למשנהו .. מדד זה  משקף את האימפקט של כתב העת בתחום שלו ולוקח בחשבון גם מאפיינים של התחום הנושאי של כתב העת , לכן הוא מאפשר להשוות כתבי עת בתחומי נושאים שונים ונחשב כמדד טוב ומדויק להשוואת כתב עת מסוים עם כתבי עת בתחומו וגם מחוץ לתחומו.

מדד    SJR     משתמש בכמה גורמים לחישוב  הפרסטיגה של המקור המצוטט , גם הוא  מאפשר השוואה ישירה של כתבי עת ללא תלות בסיווגם הנושאי.

 על פי ההצהרה המשותפת של המו"ל  המדעי  Elsevier  וחברת Ex Libris Group,   מדדים אלה ייכללו באלגוריתם חישוב הרלוונטיות של התוצאות ב-primo . המדדים יוצגו גם בתוצאות החיפוש כדי לסייע למשתמשים להעריכן.

 יש לברך על יוזמה מבורכת זו    לשיפור הרלוונטיות של התוצאות ב- primo .

להצהרה

IEEE ושימוש נאות במדדים ביבליומטריים להערכת פרסומים מדעיים

Technical professional organization  – IEEE   מכיר בדאגה שהובעה לאחרונה בקהילה האקדמית משימוש לא מתאים במדדים ביבליומטריים להערכת מחקר וחוקרים ובמסגרת תפקידו כארגון מוביל למצוינות טכנולוגית פרסם לאחרונה הצהרה בדבר שימוש נאות במדדים ביבליומטריים להערכה מדעית בתחומים הנדסה, מדעי המחשב וטכנולוגית מידע.

 ההצהרה  מספטמבר 2013  IEEE    מדגישה כמה עקרונות שמאמץ הארגון להערכה מדעית והם:

 שימוש במדדים ביבליומטריים משלימים  חשובים להערכה כוללת ומאוזנת של כתבי עת מדעיים.לאחרונה IEEE     אימץ את Eigenfactor   ואת Article Influence   בנוסף לאימפקט פקטור   להערכה מדעית של פרסומים  ומברך על אימוץ מדדים מתאימים משלימים  ברמת המאמר  כגון  altmetrics

מדדים  מבוססי כתב עת אינם מיועדים להערכה של מאמרים בודדים  או חוקרים  מכיוון שערכו המדעי של כתב עת מבוסס על ממוצע  ואין זה נכון להניח שמאמר בודד בכתב עת בעל אימפקט פקטור גבוה יהיה בהכרח  בעל מדדי ציטוט גבוהים

 הדרך העיקרית להערכת פרויקט מדעי או חוקר בודד הוא תהליך שיפוט peer review   שייקח בחשבון את התוכן המדעי כאספקט החשוב ביותר

 להצהרה המלאה

פרויקט הספרים של גוגל – הקץ למאבק?

   מאז שנת 2004  מתנהל מאבק משפטי בין גוגל , מחברים ומו"לים. המחברים והמו"לים ראו בסריקת הספרים על ידיGoogle  לצורך Google Books הפרה בוטה של זכויות היוצרים. הם מחו כנגד תוכנית הדיגיטיציה של Google, האפשרות הניתנת למשתמשים לראות קטעים מספרים מוגנים בזכויות יוצרים, ושיתוף פעולה עם ספריות ללא הרשאה מפורשת מבעלי זכויות היוצרים על כך.

 במסגרת המאבק המשפטי היו מספר התפתחויות עליהם גם דיווחתי בעבר בבלוג. . באוקטובר 2008  הועלתה    הצעה להסכם פשרה לישוב הסכסוך  בכל הקשור לפרויקט הדיגיטציה של הספרים. ב- 2009  ספרנים, משפטנים, מחברים, מו"לים וחברות טכנולוגיות שהתנגדו  להצעת ההסכם במתכונת שהושגה  חברו יחדיו והקימו את – Open Book Alliance ששם לו למטרה לידע את עושי המדיניות והציבור בדבר היבטיה השונים של ההצעה להסכם הפשרה.

 בסופו של דבר ב-14 בנובמבר 2013  גוגל נחל ניצחון כפי שניתן ללמוד ממסמך עליו חתום השופט Denny Chin    .  ממסמך זה עולה   שבית המשפט מכיר  בסריקת הספרים תוך שיתוף פעולה עם ספריות ציבוריות ואקדמיות והצגת קטעים מסוימים מהם שימוש הוגן ומעלה על נס את התועלת המחקרית של הפרויקט.

כפי שמצוין במסמך:

” In my view, Google Books provides significant public benefits. It advances the progress of the arts and sciences, while maintaining respectful consideration for the rights of authors and other creative individuals, and without adversely impacting the rights of copyright holders. It has become an invaluable research tool that permits students, teachers, librarians, and others to more efficiently identify and locate books. It has given scholars the ability, for the first time, to conduct full-text searches of tens of millions of books. It preserves books, in particular out-of-print and old books that have been forgotten in the bowels of libraries, and it gives them new life. It facilitates access to books for print-disabled and remote or underserved populations. It generates new audiences and creates new sources of income for authors and publishers. Indeed, all society benefits"

במסמך המלא יש  מידע מקיף על הפרויקט, עובדות, השתלשלות העניינים  והתועלת  של הפרויקט. נקודות עיקריות שצוינו בהקשר זה:  פרויקט הספרים של גוגל הוא כלי יעץ חשוב, מקדם ומאפשר כריית טקסט, מרחיב את אפשרות הגישה לספרים, תורם לשימור ספרים והפחת חיים חדשים בספרים, מסיע למחקר   ועל ידי הסיוע באיתור הספרים מועיל בסופו של דבר גם למחברים ולמו"לים.

נשאלת השאלה האם זה יהיה באמת סופו של המאבק ?

למסמך בנושא

לכתבה בנושא

למידע נוסף בנושא – תודה לד"ר רות הנדזל על קישור זה  והפנית תשומת הלב לנושא

CORE ומידע בגישה פתוחה ממאגרי מידע מוסדיים

CORE    הוא אגרגטור של  מיליוני פרסומים  ממאות מאגרי מידע  בגישה פתוחה . Core  כולל  5 יישומים:

 CORE Portal –  מאפשר חיפוש במאגרי מידע בגישה חופשית.

CORE Mobile  – אפליקציה של אנדרואיד שמאפשרת לחפש ולהוריד מאמרים בגישה פתוחה

CORE Plugin  –  רכיב   תוכנה   (plugin)  למאגרי מידע מוסדיים שמאפשר להם לחפש פרסומים מדעיים דומים

CORE API –  מאפשר למערכות חיצוניות ושירותים אינטראקציה עם CORE

Repository Analytics  –   כלי סטטיסטי

הפורטל חופשי. נכון להיום על פי מה שמצוין באתר אפשר לחפש ב- 18270112  מאמרים בגישה פתוחה. באתר  יש מנשק לחיפוש בסיסי ומתקדם. החיפוש המתקדם מאפשר להגביל מראש את החיפוש לשדות מסוימים כולל מחבר, מ"ול, מאגר ושנה. במנשק תוצאות החיפוש יש אפשריות לעידון השאילתה  – אפשר לסנן את תוצאות החיפוש על פי  טקסט מלא, שפה, מאגר (ברשימת המאגרים נכללים מאגרים מוסדיים/נושאיים)  ושנה

לפורטל

הבדלים בעלויות של ספרים אלקטרוניים וספרים בדפוס בספריות אקדמיות

ספריות אקדמיות ממשיכות להתמודד עם בעיות תקציב לצד הצורך לספק למשתמשים  גישה למקורות מידע אלקטרוניים – ספרים וכתבי עת

במקביל הספריות מתמודדות עם  הצורך לפנות מרחבים בספרייה לצרכים אחרים.  לאור זאת ספריות חייבות לשקול בזהירות אפשרות מעבר לפורמט אלקטרוני בלבד בהתחשב בעלויות

מחקר שנערך ב-  Auburn University at Montgomery-AUM  , אושר  לפרסום בכתב העת  C&RL    באוקטובר 2013 , מצא שהמחיר הממוצע של ספרים אלקטרוניים גבוה באופן משמעותי מהמקבילים בפורמט המודפס, ללא הבדל בין כותרים שיצאו לאור בהוצאה אוניברסיטאית או מסחרית.

ממסקנות המחקר : המעבר מפורמט מודפס לפורמט אלקטרוני כרוך באתגרים משמעותיים לספריות אקדמיות קטנות ובינוניות שנמצאות במצב כלכלי לא יציב. נתונים מפורטים  שמוצגים במאמר מדגישים את הפערים.

לאור המצב נראה שמודל ה- PDA     הוא אופציה סבירה להמשך פיתוח האוספים ובו בזמן לספק למשתמשים משאבים שהם חפצים בהם. אין זאת אומרת שהספריות צריכות לזנוח את התפקיד של בחירת האוסף שכן ספרנים בוחרים לטווח ארוך בעוד שהבחירה של המשתמשים באה לענות על צרכים מיידיים.

העלויות שכרוכות ברכש ספרים אלקטרוניים מהוות אלמנט שנוגס בכוח הרכש של הספרייה. אבל אם ספריות יוכלו להראות החזר השקעה על ידי שימוש רב בחומרים,  לספרייה יהיה בסיס מוצק חזק יותר (case)   למימון נוסף מהנהלת האוניברסיטה.

למאמר המלא

2012 Academic Library Trends and Statistics יצא לאור

2012 Academic Library and Statistics – הפרסום השנתי של ACRL  יצא לאור.פרסום שנתי זה של ACRL כולל השנה נתונים מ- 1495 ספריות אקדמיות  בארה"ב.

פרסום זה כולל נתונים על אוספים (כולל מספר כותרים, וספרים אלקטרוניים), הוצאות (חומרים, שכר חומרה ותוכנה וכיו"ב) ,  סגל הספרייה ושירותים כולל שירותי יעץ, השאלה והשאלה בינספרייתית, שימוש ברשתות חברתיות ומודעות ושימוש בסטנדרטים של ACRL

הפרסום אינו חופשי ודי יקר. ניתן לרכשו בחנות האלקטרונית של ACRL. סקירה קצרה מתאריך 30 באוקטובר כוללת  מספר נתונים.

מהנתונים עולה שבהשוואה לשנת 2011 חל גידול של 7.3% בהוצאות על אוספים .

בהוצאות שכר חל גידול של 3.7% .

אשר לשימוש במדיה חברתית – 76% מהספריות האקדמיות דווחו על שימוש ברשתות חברתיות כאשר פייסבוק, בלוגים, וטוויטר נמצאים בראש הרשימה.

 הנתונים המלאים ב- 2012 Academic Library and Statistics יכולים לשמש גם למטרות  תקצוב ותכנון אסטרטגי.

לסקירה

Pipl וחיפוש אנשים ברשת

חיפוש אנשים בווב היא פונקציה די שכיחה. אפשר כמובן לחפש בגוגל  תוך שימוש באסטרטגיות חיפוש  מתאימות . מעבר לגוגל אפשר לחפש במנועי חיפוש ייעודיים שקיימים בווב  כגון :  Infospace, Argali , Zoominfo,  Infobel , Freeality  ועוד

מנוע חיפוש ייעודי , לא חדש  אבל  ייחודי  הוא PIPL.   היום הוא מעניין יותר מבעבר בעיקר בגלל ריבוי הפרופילים ברשתות חברתיות. היחוד שלו על פי מה שמוצהר באתר הוא שהוא מחפש ברשת הלא נראית כלומר מציג מידע שאינו מוצג במנועי חיפוש כלליים.

אפשר לחפש על פי שם , דואל, שם משתמש וטלפון.הזנת מיקום אופציונלית.  בתוצאות מוצגים  פרופילים ואתרי ווב. בסרגל הצדדי מוצגים קישורים לכלי חיפוש נוספים  כגון  Spokeo   שמאפשרים חיפוש מידע חסוי יותר שרובו ניתן להשיג בתשלום.

ניהול משותף של ספרים

גם בעידן האלקטרוני ספריות עדיין רוכשות ספרים בגרסה מודפסת במיוחד בתחומי מחקר מסוימים כגון אמנות.  וכמו בכתבי עת מתעוררת לא אחת בעיה של מקום, במיוחד נוכח הצורך לפנות חללים פתוחים  לצורכי הסטודנטים.

הפתרון יכול להיות שיתוף פעולה בין ספריות  לניהול משותף של אוספים והקמת מאגר משותף של ספרים בדפוס. פרויקט כזה  מחייב ניתוח מצב האוספים, אופן השימוש בו , איתור כפילויות וכו'

דוגמה לפרויקט כזה הוא Northeast regional library print management planning project  בו משתתפות עד כה 90 ספריות בחוף המזרחי בארה"ב  ומכללות ואוניברסיטאות נוספות נקראות לקחת חלק בפרוייקט.

 המטרה של הפרויקט היא לאתר ספריות  עם צרכים משותפים  ועניין משותף בפתרונות אזוריים לצרכים אלו ולהציע אסטרטגיות ומודלים מתאימים –  מודלים כלכליים , אסטרטגיות  לניהול סוגים שונים של אוספים , זיהוי  הבדלים בניהול האוספים ביחס לניהול  אוספים של כתבי עת , צרכים נוכחיים, ואופציות תשלום . כל זאת כדי למצוא פתרונות  אפשריים כולל פיתוח אוספים מרכזיים או מבוזרים  ואוספים קבועים .

מודלים אלו  יוכלו לשמש דוגמה לספריות אחרות בעולם

 לפרטים נוספים על הפרויקט

למידע נוסף בנושא