כתבי עת ב"גישה פתוחה" – כמה ואלו מהם כלולים ב- JCR?

בעולם ההוצאה לאור במסגרת ה"גישה הפתוחה" מסלול הזהב – כלומר כתבי עת ב"גישה פתוחה" זוכים לתשומת לב רבה.

חוקרים רואים בכתבי עת בגישה פתוחה דרך להשיג מאמרים ללא תשלום אבל מצד שני לצורך הערכה מדעית הם נדרשים להציג את ציון האימפקט פקטור של כתבי העת בו הם מפרסמים כפי שמופיע ב- JCR .

מעניין לדעת איזה כתבי עת חופשיים כלולים ב- JCR ומהו ציונם של כתבי עת אלו על פי מדדים מקובלים להערכה מדעית של כתבי עת?

בעבר נעשו מחקרים על כתבי עת ב"גישה פתוחה" שקבלו אימפקט פקטור מ- Thompson Reuters Scientific , אבל אף אחד מהם לא הציג את רשימת כתבי העת בגישה הפתוחה שנכללו ב- JCR.

רשימה כזו זמינה כעת. הרשימה כוללת 619 כתבי עת מ- DOAJ ( על פי נתוני דצמבר 2010) שנכללו ב- JCR 2009 עם ציוני ה- ScimagoJR וה-SNIP שלהם. השימוש במדדים אלו להערכה מדעית במקום באימפקט פקטור של Thomson Reuters כפי שמופיע ב- JCR נעשה במתכוון כדי להימנע מבעיות זכויות יוצרים .

הערה: הרשימה כוללת גם קטגוריה נושאית של כל אחד מכתבי העת . כתב עת שמופיע ביותר מקטגוריה אחת נכלל פעמיים לכן הרשומה כוללת 782 שורות אבל למעשה היא כוללת 619 כתבי עת ייחודיים

לפרטים נוספים
לרשימה המלאה של 619 כתבי העת ב"גישה הפתוחה" שמופיעים ב- JCR

על תיקון וצנזורה בספרים

כרמית ספיר-ויץ מדווחת ב"מעריב" כי הסופר אלון חילו והוצאת ידיעות-ספרים הגיעו במסגרת הסכם גישור לפשרה עם משפחתו של חיים מרגליות קלווריסקי, שדמותו מופיעה ברומן שכתב "אחוזת דג'אני". לפי הפשרה, שמו של גיבור הספר ישונה במהדורות הבאות. במקום חיים מרגליות קלווריסקי, יהיה שמו "אייזק לומינסקי", עוד הוחלט כי בכריכות הספר או בתוכנו לא ייעשה שימוש בכתב היד של קלווריסקי וכי הערת המחבר לפיה מדובר בסיפור בדיוני, ולא ביומן אמיתי, תועבר לעמודו הראשון של הספר במקום בסופו. בנוסף הוחלט כי לבני המשפחה יתאפשר להוציא ביוגרפיה בהוצאת "ידיעות ספרים" על אודות פועלו האמיתי של חיים מרגליות קלווריסקי.

 לכתבה המלאה >>

נטשה מוזגוביה, כתבת "הארץ" בארה"ב מדווחת כי המהדורה חדשה של "הרפתקאותיו של האקלברי פין" תודפס ללא המלה הפוגענית "ניגר", שמופיעה בספר לא פחות מ-219 פעמים. המלה "כושי" תוחלף ב"עבד". בספר נעשה שינוי נוסף באותה הרוח: מילת הגנאי המתארת את ג'ו האינדיאני, Injun, הומרה ב-Indian.
אך למרות הכוונות הטובות, ההוצאה לאור הוצפה בתגובות שליליות. מורים רבים מחו על השינוי בטענה שמדובר בפגיעה באותנטיות של היצירה ושהצנזור עשוי למנוע דיון פורה בכיתה על הסוגיה הרגישה. ובנוסף, אמרו, בסופו של דבר ג'ים מפסיק להיות עבד – אבל עדיין נשאר "כושי".
מייסדת ההוצאה סוזן לה-רוזה אמרה שהיא שמחה שהספר עזר לעורר דיון על משמעות השפה והשפעתה על תהליך הלמידה. אף בית ספר לא הביע בשלב זה עניין ברכישת הספר המצונזר, אך חנויות הספרים כבר שלחו הזמנות מוקדמות.

לכתבה המלאה>>

Culturomics – גוגל ספרים ומגמות תרבות לאורך ההיסטוריה

כלי חדש של גוגל – Books Ngram Viewer מאפשר ללמוד על מגמות תרבות לאורך ההיסטוריה. הכלי מבוסס על "גוגל ספרים" ומאפשר חיפוש במסד נתונים של 500 מיליארד מילים מתוך 5.2 מיליון ספרים בתקופה 1500 – 2008 בשש שפות – אנגלית, צרפתית, ספרדית, גרמנית, סינית ורוסית. תוצאות החיפוש – הצגה גרפית של שכיחותם של מונחי החיפוש לאורך השנים . שכיחות זו מאפשר ללמוד מתוך ספרים על מגמות תרבות לאורך ההיסטוריה.

כלי זה הוא פרי פרויקט מחקר של חוקרים באוניברסיטת הארוורד ובעיקר של המתמטיקאי ארז ליברמן איידן, בשיתוף עם גוגל. המחקר התפרסם בגיליון 17 בדצמבר בכתב העת science . טענתו העיקרית של ארז ליברמן איידן הייתה שעל ידי ניתוח הגידול והשינויים לאורך זמן של מלים מודפסות אפשר להבין את האבולוציה של התרבות , לבדוק את השפעתם התרבותית של אישים מסוימים לאורך ההיסטוריה ולחשוף מגמות שנעלמו לעתים מעיניהם של היסטוריונים. ניתוח זה של מידע כונה בשם : culturomics -שילוב של תרבות ומטריקה . יש לציין שמסד הנתונים ניתן להורדה ולחיפוש בכלים שייבנו על ידי המשתמשים .

עמדות החוקרים במדעי הרוח מעורבות ומהולות בהתלהבות ואכזבה. יש הטוענים שכלי זה מהווה שיטת מחקר חדשה כמותית באופייה במדעי הרוח ויש הטוענים שכלי זה יכול להיות שימושי אם לא יצטמצם רק לניתוח שכיחותם של מילים ובכל מקרה לכנותו culturomics זה יהיר מדי….

ל- Books Ngram Viewer
למאמר ב-science על הפרויקט המחקרי
לאתר Culturomics – שם אפשר למצוא קישורים רלוונטיים בנושא
לכתבה בדה –מרקר בנושא

תודה לד"ר אריאל פרנק שהפנה את תשומת ליבי למחקר בנושא

פרויקט הדיגיטציה של האנציקלופדיה לחלוצי היישוב מאת דוד תדהר

ספריות באוניברסיטת טורו בניו-יורק בשיתוף עם משפחתו של דוד תדהר , סיימו לאחרונה פרויקט של סריקת האנציקלופדיה לחלוצי הישוב מאת דוד תדהר (19 כרכים במקור) והעלאתה לאינטרנט.

המידע פתוח לצבור הרחב.

האנציקלופדיה היא מקור ביוגרפי חשוב וכוללת מידע על כ- 6000 אישים . אפשר לדפדף על פי רשימה אלפביתית של האישים ועל פי כרך ואפשר גם לחפש באתר.

תודה לחוה רמברנד
ספרנית המכללה האקדמית עמק יזרעאל ע"ש מקס שטרן על המידע

לאתר

פרסומים במסגרת ה"גישה הפתוחה" – מהי עמדתם של החוקרים?

תנועת ה"גישה הפתוחה" הפכה לפופולרית בשנים האחרונות . מספר כתבי העת ב"גישה פתוחה" הולך וגדל וכנ"ל גם מספר ה"מאגרים המוסדיים" של המוסדות האקדמיים השונים בהם מופקדת התנובה המחקרית של החוקרים במוסדות אלו. נראה שתנועת ה"גישה הפתוחה" זוכה לתמיכת קהילת המחקר.

אבל נשאלת השאלה עד כמה החוקרים משתמשים בחומרים פתוחים אלו ועד כמה הם מפרסמים בכתבי עת פתוחים ומעלים חומרים למאגרים מוסדיים פתוחים. מהי עמדתם ביחס למהימנות החומרים הללו?

מחקר שהתפרסם בגיליון דצמבר 2010 של כתב העת Journal of Electronic Publishing שופך אור על הנושא. המחקר שנערך בתקופה יוני – אוגוסט 2009 שם לו למטרה לבדוק עמדות אלה של החוקרים והתמקד בעיקר בנושא המאגרים המוסדיים. שיטת המחקר הייתה סקר בקרב קבוצת מדגם אקראית שכללה 532 חוקרים בתחומי מדעי החברה והטבע מ- 20 מוסדות אקדמיים באירופה וצפון אמריקה .

מממצאי המחקר עולה שעדיין קיימת הסתייגות מסוימת בקרב החוקרים ביחס לפרסומים בגישה הפתוחה – רוב המשתתפים במחקר השתמשו בפרסומים בגישה פתוחה כקוראים, למרות שלא כולם מעריכים אותם כמהימנים באותה מידה כמו פרסומים מסורתיים. גם אלה שטענו שהם רואים את פרסומי הגישה הפתוחה כמהימנים פחות ממחציתם פרסמו את עבודתם במדיום זה .
רוב המשתתפים במחקר אמרו שהם יקבלו בברכה הליכים קפדניים יותר להכללתם של חומרים במאגרים מוסדיים . הליכים קפדניים אלה יגדילו את אימונם במאגרים מוסדיים ואת נכונותם להעלות חומרים למאגרים אלו. הם הביעו נכונות גם לסייע בהליכים אלו.

לאור ממצאי המחקר מסתבר שלמרות ההתקדמות בנושא פרסומים בגישה הפתוחה , הדרך עדיין ארוכה, במיוחד בכל מה שקשור למאגרים המוסדיים, וכדי לזכות באמון ובתמיכה של הקהילה המדעית המחקרית כולה יש לנקוט במספר צעדים שיבטיחו את איכות המידע המתפרסם

למאמר המלא

חטיף, שתייה וספר: מכונה אוטומטית להשאלת ספרים

בעוד בעולם מתרחבת מגמת הספרים האלקטרוניים, בשבוע הבא תיפתח בישראל הספרייה האוטומטית הראשונה – "הספריומט", שיוצב בסמוך לספרייה העירונית בראש העין.
הספריומט  יכיל כ-200 כותרים ויאפשר השאלה באמצעות הטלפון הנייד, 24 שעות ביממה.

מנויי הספרייה יוכלו לעצור בין הקניות השבועיות או לאחר יום העבודה, ולשאול או להחזיר ספרים שהוזמנו מראש באינטרנט. זה אולי לא ישבור את מבצעי מכירות החיסול ברשתות הספרים,  אבל במשרד התרבות והספורט מקווים שהפיילוט הראשון יהפוך את הספריות הציבוריות נגישות יותר לציבור.
הזמנות הספרים יתבצעו באתר הספרייה העירונית. בהמשך תושק גם אפליקציה מיוחדת
לאייפון ולטלפונים סלולריים שבה יוכלו המנויים להזמין את הספרים און-ליין. לאחר מכן,
יקבל המנוי הודעת SMS או דוא"ל.
"חשבנו על פתרון כיצד לעודד את השאלת הספרים גם שלא בשעות הפתיחה, אלא 24/7", מסבירה ריקי כרמל, מנהלת הספרייה בראש העין. "אנחנו נבדוק אילו ספרים הלקוחות שלנו אוהבים, ולפי זה נבצע את הרכש. אנחנו מקווים מאוד ליצור פופולריות וחזרה לקריאה, אולי גם עבור מי שזמן פנוי לא בנמצא עבורו".
בתקופה הקרובה תוצב המכונה לתקופת הרצה בתוך הספרייה העירונית. בהמשך יועבר ה"ספריומט" אל מחוץ לספרייה, ולבסוף – לאחד ממרכזי הקניות בראש העין. הכוונה היא להקים רשת מכונות אוטומטיות נוספות לספרים, שיוצבו ברחובות המרכזיים של השכונות המרוחקות מהספרייה
מנהלת הספרייה מסבירה כי "בעולם מאוד מהיר ואינטנסיבי, שהכל קורה פה ברגע, אני חושבת שאדרבא – יש מקום של כבוד לספר ליד יתר המוצרים הנרכשים. אנחנו חושבים איך להביא את הקהל שלנו לקרוא ספרים גם בדרך אחרת".

לכתבה

ממעבדות גוגל – Body Browser – מודל תלת ממדי של גוף האדם

Body Browser של גוגל הוא מודל תלת ממדי של גוף האדם. המודל שהושק ב- 16 בדצמבר הוא בדמות אישה ומאפשר למשתמש בעזרת הסמן לנווט בין חלקי הגוף השונים, לקלף שכבות ולראות את מבנה השרירים, כלי הדם והעצבים. לחיצה על אופצית labels מקשרת למידע מתוך ספר ביולוגיה על כל איבר בו נמצאים.

אפשר לשתף את מה שרואים על ידי העתקת הקישור של אותו חלק שרואים. בעתיד הקרוב יתווסף מודל בדמות גבר.

לסטודנטים לרפואה מודל זה יכול להוות תחליף לרישומים סטטיים בספרי רפואה או למודלים תלת ממדיים אחרים שעלותם גבוהה.

השימוש במודל שנמצא עדיין בגרסת ביתא מצריך דפדפן שתומך ב- WebGL כמו Google Chrome Beta

International Encyclopedia of Human Geography

האנציקלופדיה International Encyclopedia of Human Geography בהוצאת  Science Direct התווספה לאחרונה לאוסף האנציקלופדיות האלקטרוניות שבספרייה המרכזית.

האנציקלופדיה כוללת קשת רחבה של נושאים בגיאוגרפיה ובנושאים נלווים כמו למשל תורת האקלים,מדעי הסביבה,קרטוגרפיה ו GIS, גיאוגרפיה אורבנית,גיאוגרפיה פוליטית,גיאוגרפיה תרבותית וחברתית,גיאוגרפיה פמיניסטית,גיאוגרפיה ופילוסופיה ועוד.

ניתן לאתר מידע ע"י דפדוף ברשימת כותרים מחברים ונושאים או באמצעות חיפוש מתקדם לפי שדות.

לכל רשומה קישורים למאמרים  באותו נושא מתוך כתבי עת שכלולים ב  – Science Direct  ובטקסט מלא (במידה ולספרייה יש מנוי) וגם קישורים לערכים אחרים באנציקלופדיה .

האנציקלופדיה נגישה מאתר הבית של הספרייה וגם מהקטלוג.

עיתון "מעריב" התווסף לאתר עיתונות יהודית היסטורית

מעריב, מהחשובים שבעיתונים היומיים של ישראל בעבר ובהווה, התווסף לאתר. זהו העיתון השני במאגר 'עיתונות יהודית היסטורית' שהוא עיתון פעיל, וממשיך להתפרסם בימים אלה (העיתון הראשון הוא ה-Palestine Post, ששינה את שמו ל-Jerusalem Post ב-1950).

בשלב זה הועלו לאתר שני העשורים הראשונים של העיתון (1948-1968) עם כמה חודשים חסרים המושלמים בימים אלה. נכון לעכשיו 74,558 מעמודי מעריב זמינים באתר מה שהופך את העיתון לשני בגודלו (מבחינת מספר עמודים) לאחר "דבר".
זהו העיתון ה-19 המתווסף לאתר, והעיתון העשירי בעברית.

לעיתון

עיתונים נוספים שהתווספו לאתר לאחרונה הם: "חבצלת" ו"השקפה"

מדריך לחיפוש בממשקי העיתונים השונים

הגישה למאגר "עיתונות יהודית היסטורית" דרך אתר הבית של הספרייה > מאגרי מידע.

איגוד האינטרנט הישראלי – פיקיוויקי והנצחת יופיו של הכרמל

בזמנו כתבתי על פיקיוויקי – מאגר שיתופי לתצלומים בנושאי היסטוריה, גיאוגרפיה וחברה במדינת ישראל ובארץ ישראל. הפריטים במאגר נתרמים ומוזנים למאגר על ידי כל מי שמצויה בידו תמונה רלוונטית שיש בה עניין לציבור.. הזנת התצלומים על ידי הגולשים מתבצעת באמצעות מערכת פשוטה כתובה בעברית. השימוש במאגר חופשי לכל, במסגרת רישיון גמיש של זכויות יוצרים.

יתרונותיו הגדולים של המאגר ביחס לתצלומים וקבצי מדיה רבים אחרים בווב המתעדים את מדינת ישראל וארץ ישראל הם:
א. שימוש במסגרת רישיון גמיש של זכויות יוצרים
ב. החומר מאורגן בצורה שמאפשרת את אחזורו בקלות תוך שימוש בשיטות מיון וקטלוג מתקדמות

איגוד האינטרנט הישראלי שהוא אחד השותפים למיזם פרסם לאחרונה בעלון "עדכון פעילויות איגוד האינטרנט הישראלי" מדצמבר גיליון 116 – קריאה לכל מי שבידו תמונות שיכולות לסייע בהנצחת יופיו של הכרמל , להעלות אותם למאגר פיקיוויקי.

מידע על הכללים להעלאת תמונות למאגר
למאגר התמונות
לקריאת איגוד האינטרנט הישראלי להנצחת הכרמל

מנוע החיפוש Blekko ופילוח הווב

מנוע החיפוש BLekko אימץ לו את הסיסמה Slash the Web . ואכן המאפיין הייחודי שלו הוא סינון תוצאות החיפוש על ידי שימוש ב-Slashtags Slashtags מאפשרים למשתמש למקד את החיפוש על ידי שימוש בהגבלות מסוימות בהתאם למה שמופיע אחרי ה- / .קיימים במערכת Slashtags מוכנים ומשולבים במערכת כגון: : – flickr/, youtube /, maps/, people / שמאפשרים למשתמש לסנן את תוצאות החיפוש על פי סוג מסוים של אתרים. קיימים גם מאות Slashtags נושאיים. כמו כן המערכת מספקת למשתמש אופציה להגדיר Slashtags משלו, שיאפשרו חיפוש רק באותם אתרים שיוגדרו על ידי המשתמש. למשתמש שיוצר Slashtags יש אפשרות לשמור את ה- Slashtags כפרטיים או לשתפם ואף להתיר את עריכתם על ידי אחרים.

אפשר לשלב בשאילתת החיפוש מספר Slashtags. פירוט נוסף על אופן השימוש במערכת אפשר למצוא במערכת העזרה באתר.

בחירת אתרים נבחרים על ידי המשתמשים והגדרתם כ- Slashtags מאפשרת למטב את תוצאות החיפוש תוך ניצול חוכמת ההמונים, וזהו ייחודו של BLekko. מאפיין זה אמנם קיים במנועי חיפוש מותאמים אישית אבל ייחודו הנוסף הוא באפשרות לשלב סוגים שונים של Slashtags חלקם מובנים במערכת

למנוע החיפוש

ספריות מפוארות באירופה

הספריות המפוארות באירופה נבנו כספריות בתי- מלוכה, כנסיות ומוסדות אקדמיים.רבות מהן ממוקמות בארמונות כנסיות ומנזרים.
בימינו אלה כאשר הספרייה מקבלת צביון דיגיטאלי, פניה של הספרייה הקלאסית אשר בבסיסה מוגדרת כמקום משכנו של הספר – נדירה וראויה להנצחה ולצפייה.
במצגת של דן קליסטרט מצולמות הספריות המפוארות באירופה המשולבות ביצירות אמנות ועיצובים ארכיטקטוניים יפהפיים.

   

Africa portal – פורטל וספרייה דיגיטלית חופשיים בנושאים שקשורים למדיניות באפריקה

CIGI בשיתוף עם גופים אחרים – Makerere University ו- South African Institute of International Affairs השיקו לאחרונה את Africa portal – פורטל חופשי שכולל מחקרים ומידע בנושאים עכשוויים שקשורים למדיניות באפריקה – פתרון קונפליקטים, אנרגיה, מזון, הגירה, בריאות ושינויי אקלים .

מרכיב מרכזי בפורטל הוא ספרייה דיגיטלית שכוללת נכון להיום כפי שכתוב באתר – אוסף חופשי בטקסט מלא שכולל 2,500 ספרים, כתבי עת ומסמכים דיגיטליים . כמו כן אפשר למצוא בפורטל מדריך מומחים ולוח כנסים ואירועים

לפורטל

Oxford English Dictionary משודרג

Oxford English Dictionary – המילון שנחשב למקיף ולמהימן ביותר לשפה האנגלית יפסיק לצאת במהדורת דפוס וגירסתו המקוונת עומדת להשתנות.
מדצמבר 2010, OED לא יכיל רק את מילון אוקספורד האנגלי במלואו, אלא יכלול גם את   Historical Thesaurus of the OED המכיל כמעט כל מילה מאנגלית עתיקה ועד היום. מאפשר למשתמשים לפענח פירוש מילה, לאורך ההיסטוריה.
שיפורים נוספים:
+ חיפוש ודפדוף על-פי נושא, אזור, שימוש, או שפת המקור
+ האפשרות לגלות את המקורות העיקריים של OED (כותבים ועבודות) ומעקב אחר תפקידם בעיצוב השפה.
+ ניתן יהיה להציג את תוצאות החיפוש על ציר זמן, מה שיאפשר למשתמש לראות מתי נכנסו מילים לשפה, למשל מילים ביפנית או מילים הקשורות לאסטרונומיה
+ מסד הנתונים יראה אור בפעם הראשונה, ויחשוף מאות אלפי סטנדרטים ותיקונים.
+ כל ערך יכלול מידע קצר כולל צירי זמן של התפתחות, וקישורים לערכים קשורים.
+ יופיעו קישורים בכל ערך למקורות קשורים כולל: Oxford Dictionary of National Biography, Oxford Dictionaries Online, ולמשאבים מקוונים אחרים.
+ יצירת פרופיל אישי- My Oxford English Dictionary לשמירת חיפושים ותוצאות
+ אפשרות לסטטיסטיקה
+ עיצוב חדש וידידותי למשתמש

הגישה למילון דרך אתר הספרייה

ממציא הווב – טים ברנרס-לי – כיצד להגן על הווב ?

במאמר מעניין שהתפרסם בגיליון דצמבר 2010 של Scientific American מספר טים ברנרס-לי ממציא הווב על העקרונות עליהם מושתת הווב , הסכנות האורבות לווב וכיצד נוכל להגן עליו מפניהם.

הווב הפך להיות כלי בעל עצמה בשל היותו מושתת על עקרונות שוויוניים ובזכות עבודתם המשותפת של אנשים פרטיים, חברות ואוניברסיטאות במסגרת ה- World Wide Web Consortium למען הרחבת יכולותיו של הווב שמושתתים על עקרונות אלו.

הווב היום ניצב בפני מספר סכנות כאשר חלק מדייריו המוצלחים החלו לכרסם בעקרונות עליהם הוא מושתת. אתרי רשתות חברתיות החלו בהצבת חומות ובחסימת מידע מפני שאר חלקיו של הווב, ספקי אינטרנט אלחוטי פועלים למען האטת התעבורה לאתרים שלא עשו עמם עסקים, ממשלים טוטליטריים ודמוקרטיים כאחד עוקבים אחרי הרגליהם המקוונים של אנשים תוך פגיעה בזכויות אדם חשובות.

אחד העקרונות החשובים עליהם מושתת הווב הוא האוניברסליות. קיימת הזכות לכול להעלות חומרים לווב ולא משנה איזה מחשב, תוכנה, שפה, וסוג תקשורת – אלחוטית או חוטית יש ברשותם. הווב חייב להיות נגיש גם לבעלי מוגבלויות.

דֶּצֶנְטְרָלִיזַצְיָה – ביזור – הוא מאפיין חשוב אחר. אין צורך לקבל אישור משום גוף מרכזי להוסיף אתר או קישור. כל מה שצריך לעשות הוא לעשות שימוש ב- 3 פרוטורקלים – html לכתיבת דף ווב, ULI להענקת כתובת לדף , ו- http להעלות אותו לרשת האינטרנט.

ה- ULI הוא המפתח לאוניברסליות …
מספר תופעות שמאיימות על האוניברסליות קשורות ל-ULI . בידי רשתות חברתיות כגון Facebook, LinkedIn, Friendster יש מידע על המשתמשים שלהן, בו הן משתמשות למען ייעול שירותיהם, אבל המידע הזה אינו זמין לגופים אחרים, כל רשת פועלת כגוף נפרד . אתרי הווב פתוחים לכול אבל לא הנתונים. בידוד זה קורה מכיוון שאין לכל פיסת מידע URI …… הקשר בין הנתונים קיים רק בתוך האתר. באופן זה אתרי רשתות חברתיות הפכו לפלטפורמות סגורות.

סכנה נוספת היא שרשת חברתית גדולה או מנוע חיפוש או דפדפן יהפכו למונופול …. מכיוון שזה עלול להגביל את החדשנות…

תופעת חברות הכבלים אשר מוכרות קישוריות לאינטרנט ושוקלות להגביל את משתמשי האינטרנט להורדה של חבילות הבידור שלהן בלבד, אף היא מאיימת על האוניברסליות..

עיקרון האוניברסליות הוא רק אחד העקרונות עליהם מושתת הווב . עקרונות נוספים הם סטנדרטים פתוחים , עקרון ההפרדה בין השכבות – הפרדה בין הווב והאינטרנט ….

על כך ועוד דברים מעניינים אפשר לקרוא במאמר המלא

חיפוש מידע רפואי באינטרנט – חוקרים מלמדים מנועי חיפוש רפואיים להבין סלנג

משתמשים רבים מחפשים מידע רפואי באינטרנט ואכן קיימים באינטרנט אתרים רבים דוגמת WebMD שמספקים מידע רפואי ל- consumers.

אלא שקיימת בעיית "פער השפה" – הפער בין המונחים הרפואיים ובין מונחים בסלנג שבהם מחפשים המשתמשים. בעיה זו פוגעת ברלוונטיות של תוצאות החיפוש. כדי להתגבר על הבעיה חוקרים ב- Georgia Tech פתחו את DiaTM – Dialect Topic Modeling for Improved Consumer Medical Search – שלומד את שפת המשתמש ובכך משפר את תוצאות החיפוש.

לימוד שפת המשתמש על פי DiaTM מתבצעת על ידי השוואת מסמכים רפואיים רבים שכתובים ברמות שונות של שפה טכנית. על ידי כך המערכת לומדת על הקשר בין מונחי סלנג ומצבים וסימפטומים רפואיים שונים ובכך מצטמצם פער השפה בין שפת המשתמש ובין שפת מאגרי המידע בהם הוא עורך את החיפוש. כך למשל אחרי עיבוד של כמות מספקת של מסמכים המערכת לומדת שמשמעות המונח gunk בהקשרים מסוימים היא discharge. המסמכים שמשמשים את המערכת לצורך השוואה ולימוד לקוחים ממספר מגוון של מקורות מידע כגון: WebMD Yahoo! Answers, PubMed Central, the Centers for Disease Control & Prevention website sources ואחרים.

במחקרים שנערכו לבדיקת DiaTM נמצא שהוא שיפר את הרלוונטיות של התוצאות ב- 25%

טכניקה זו של DiaTM אינה מצטמצמת רק לתחום הרפואי וניתן ליישמה על תחומים אחרים.
נייר העבודה שמתאר את המערכת:
“Dialect Topic Modeling for Improved Consumer Medical Search,”
הוצג ב- 17 בנובמבר במפגש השנתי של American Medical Informatics Association, Washington, D.C

לפרטים נוספים

Extractiv – כלי לחילוץ מידע מטקסט בשירות הווב הסמנטי – סוקר דפי ווב, מזהה קשרים סמנטיים והופך מידע לא מובנה למובנה

הווב מכיל דפים רבים עם מידע מתעדכן ומתחדש – ידיעות חדשותיות, פוסטים בבלוגים וציוצים. לעבד את המידע ידנית היא משימה בלתי אפשרית. מנועי חיפוש מסוגלים לאתר פריטי מידע של מידע אבל מותירים מאחור את התמונה השלמה. Extractiv – שירות לחילוץ מידע מטקסט יכול לסייע במשימה.

Extractiv הוא שירות שהופך באופן אוטומטי טקסט לא מובנה לטקסט סמנטי מובנה. משלב זחלן שסורק דפי ווב על פי בקשה או הגדרת מלות מפתח, ויכולת של ניתוח בשפה טבעית. מזהה זהויות וקשרים ביניהם.

Extractiv מאפשר למשתמש להגדיר מה הוא רוצה לחלץ מהטקסט כך למשל אם מגדירים לו עיר הוא יחלץ את כל הערים , כמו כן הוא מאפשר למשתמש להגדיר באיזה פורמט הוא רוצה לקבל את התוצאות. השירות הוא בתשלום. מדי פעם ג'וב של עד 1000 URL אפשר לקבל חינם לאחר הרשמה חינמית לפורטל.

במהלך תהליך הגדרת המשימה על ידי המשתמש – המשתמש בוחר נושא מתוך רשימת נושאים כגון רפואה, מחשבים, וזהויות שמוצעות למשתמש לבחירה בהתאם לתחום שבחר – כך למשל ברפואה מוצעות זהויות כמו דוקטור, תרופה, מחלה, בתי חולים וכו' , במחשבים – אלגוריתם שפת תכנות ועוד..

המשתמש בוחר קשרים אותם הוא רוצה שהכלי ינתח כמו גיל, מספר טלפון, דת, שפה. אפשר להזין מלות מפתח והיישום מחפש אתרים בהתאם. אפשר לתת רשימת אתרים ממנה יתחיל את הסריקה , אפשר לבקש שיסרוק את כל הקישורים או להתמקד בדומיינים מסוימים , להגדיר את עומק הסריקה, מספר URL שיסרוק, פילטרים , ובאיזה פורמט רוצים לקבל את התוצאות – – JSON, XML, RDF. בעתיד מבטיחים גם . sentiment analysis

שירות כזה יכול להיות יעיל לקבלת מידע על אדם מסוים או חברה מסוימת וגם על נושא מסוים והוא מהווה חזון לעתיד..

לאתר השירות
מידע באתר אודות השירות

שילוב קוראים אלקטרוניים בקטלוג הספרייה – פרויקט ה- eReaders באוניברסיטת Duke

כנס צ'ארלסטון הוא מפגש שנתי של ספרנים, מנהלי ספריות, מו"לים, יועצים, וספקים שבאים לדון באווירה לא פורמלית יחדיו בנושאים חשובים שמעניינים אותם. השנה היה זה המפגש השנתי ה-30, הוא התקיים ב- 3-6 בנובמבר 2010 ועסק בנושא רכש ספרים וכתבי עת .

אחת ההרצאות המעניינות הייתה הצגת פרויקט ה- eReaders של הספריות באוניברסיטת Duke.
במסגרת פרוייקט זה נרכשו קוראי ספרים אלקטרוניים Kindles- ושולבו בקטלוג להשאלה למשתמשים.

הפרוייקט החל כפרוייקט פיילוט בראשית 2010 עם מספר מצומצם יחסית של מכשירי קינדל וגדל עד כה ל-40 קוראים אלקטרוניים. האוסף נבנה על פי נתוני השאלה של הספרים המודפסים. כל כותר שנמצא מושאל מעל 3 פעמים נוסף לקינדל. כמו כן במסגרת הפרוייקט יצרו רשימת תפוצה ייעודית לקינדל דרכה המליצו המשתמשים על כותרים להוספה לקוראים האלקטרוניים.

לצורך שיווק הפרויקט הקימו אתר ייעודי. כל הכותרים שולבו בקטלוג ודרכו מצאו המשתמשים את הקוראים האלקטרוניים.

פרויקט מעניין שמרמז על העתיד…

פרטים נוספים אפשר למצוא בדווח של מי שנכח בכנס. המצגות עדיין לא עלו לאתר
לאתר הפרויקט

אונטולוגיות והווב הסמנטי

האונטולוגיות הם מרכיב חשוב בווב הסמנטי. מה הן אונטולוגיות וכיצד לבנות אותם?
סדרה של מאמרים/מדריכים אשר עשויים לשפוך אור על ההיבט המתודולוגי והמעשי בכל הקשור לאונטולוגיות אפשר למצוא ב-TechWiki

במסגרת מדריכים אלה יש גם רשימה של כ-200 כלים לבניית אונטולוגיות רובם בקוד פתוח

 

מאפיין Book Creator בוויקיפדיה האנגלית

מאפיין Book Creator הוא מאפיין נחמד שנוסף לוויקיפדיה האנגלית כזמין לכולם החל ממאי 2010 . מאפיין זה מאפשר לקבץ מאמרים מהוויקיפדיה לקובץ אחד אותו אפשר להוריד חופשי כקובץ pdf אחד בפורמט של ספר , או להזמין אותו כספר כרוך בתשלום.

תחילה יש להפעיל את המאפיין. כאשר נמצאים במאמר רלוונטי בוויקיפדיה, מצד שמאל אחת מהאופציות של print/export היא create a book . בחירה באופציה זו מציגה אפשרות ל- "start book creation" אשר מוסיפה את המאפיין בראש המאמרים בוויקיפדיה. אחרי הפעלת המאפיין אפשר לקבץ מאמרים מהוויקיפדיה על פי בחירה. אפשר לקבץ מאמרים מקושרים מבלי לבקר בהם וגם להוסיף קטגוריות שלמות . קיימת גם אופציה ל- suggest – המערכת מציעה דפים דומים רלוונטיים אותם אפשר להוסיף לקובץ. בסוף התהליך לאחר הוספת כותר מתאים מקבלים קובץ בפורמט של ספר שכולל גם תוכן, ואותו אפשר להוריד חופשי כקובץ pdf .. אפשר גם להזמין תמורת תשלום את הקובץ בפורמט של ספר כרוך מותאם אישית שכולל גם אינדקס.

מאפיין כזה יכול להיות שימושי מאוד במאגרי מידע. קיבוץ מאמרים נבחרים לקובץ אחד בפורמט של ספר עם תוכן היה יכול להקל מאוד על הסטודנטים כאשר הם דולים חומר בנושא מסוים ממאגרי מידע.