WikiSlice – מנוע ייעודי לחיפוש בוויקיפדיה

WikiSlice מאפשר חיפוש יעיל בוויקיפדיה האנגלית. הוא מאפשר יצירת אשכולות נושאיים. כאשר נחפש נושא מסוים נקבל את כל הדפים בוויקיפדיה הקשורים לאותו נושא. בסרגל צדדי מוצגים כל תתי הנושאים הקשורים לנושא. ניתן לחפש באותם דפים שמהווים נתח נושאי מהוויקיפדיה. ניתן גם להוריד את כל הדפים הקשורים לנושאים/תתי נושאים השונים בתנאי שמספר הדפים באשכול אינו עולה על 1000. במסך התוצאות מוצגים בצורת ענן תגיות דפים הקשורים לנושא שנבחרו באקראי. כמו כן בסרגל צדדי מוצגים "נתחים" נושאיים קרובים.
מאפיינים אלה הופכים את החיפוש בוויקיפדיה ליעיל יותר.
כך למשל חיפוש במנוע החיפוש בוויקיפדיה בנושא open access מציג  את הערך המרכזי בנושא בלבד, לעומת זאת חיפוש ב- Wikislice הניב 44 דפים שקשורים לנושא – בראשם הדף שכולל את הערך המרכזי בוויקיפדיה בנושא, ודפים נוספים שכוללים ערכים בנושאים רלוונטיים לנושא כמו:
Open access journal ,Open access publishing ,Public Library of Science, Institutional repository ועוד.. במסך התוצאות מוצגת פסקה או כמה פסקאות פותחות של כל אחד מהערכים. לחיצה על more תציג  את הערך המלא. כמובן שהמאפיינים הנוספים שהוזכרו לעיל מייעלים עוד יותר את החיפוש. מבחינה זאת מנוע זה מצטרף למנוע הסמנטי powerset שבשלב זה מצטמצם לחיפוש בוויקיפדיה.

קישור לאתר המנוע
אודות המנוע ושאלות נפוצות

אנציקלופדיה בריטניקה יורדת אל העם

אנציקלופדיה בריטניקה, אחת האנציקלופדיות המכובדות והוותיקות בעולם, נוקטת בצעדים ראשונים לקראת שיתוף המשתמשים ביצירת התוכן, בדומה לויקיפדיה.

בריטניקה היא האנציקלופדיה הותיקה ביותר המודפסת כיום: המהדורה הראשונה של האנציקלופדיה פורסמה בשנת 1768. לפני מספר שנים האנציקלופדיה פתחה אתר אינטרנט בתשלום, בו כלולים כ-120,000 ערכים המתעדכנים באופן קבוע. החל מראשית שנת 2007, הערכים של הבריטניקה און-ליין זמינים במלואם בתנאי שהם מקושרים מאתר אחר.
על אף שמספר המשתמשים באתר בריטניקה זעום ביחס לאנציקלופדיה החופשית, ויקיפדיה, מנהליה הביעו התנגדות נחרצת לשיטת ויקיפדיה, שבה כל משתמש חופשי לשנות כל ערך כראות עיניו. לא רק חוסר הדיוק והטעויות האפשריות בויקיפדיה מפריעים לעורכי בריטניקה, אלא גם ה"נייטרליות" המחייבת את ויקיפדיה לתת במה שווה לכל דעה. לטענתם, נדרש עורך מומחה כדי לברור את המוץ מהתבן ולפרסם הכרעות ברורות בנושאים מורכבים, במקום ערב-רב של דעות שונות ומנוגדות.

אך כנראה ש-2 מיליון הערכים של ויקיפדיה שנגישים בחינם ומככבים בגוגל, בזמן ש-120 אלף הערכים של בריטניקה נעולים בסיסמה, ונגישים תמורת 70 דולר בשנה שפחות ופחות אנשים מוכנים לשלם, גרמו לבריטניקה לשנות גישה…..

כעת בריטניקה מנסה גם היא לגייס את חכמת ההמונים, אם כי היא עושה זאת באופן זהיר והדרגתי. בפוסט בבלוג של בריטניקה פורסם כי באתר החדש של האנציקלופדיה, שנמצא כרגע בבטא, משתמשים יוזמנו לתרום מהידע שלהם לעדכון ערכים ולכתיבת ערכים חדשים.

מעניין יהיה לראות האם בריטניקה תצליח לחקות את סיפור ההצלחה השנוי עדיין במחלוקת של ה"ויקיפדיה" ;  מסקרן יהיה לראות מי ישרוד? המודל הסגור של בריטניקה או המודל הפתוח… ואולי דווקא מודל שישלב בין שניהם… 

לכתבה המלאה מתוך נענע 10 מחשבים »

קישורים נוספים:
גרסת OCR של מהדורת 1911, פתוחה לכל
האנציקלופדיה ברשת מדויקת כמעט כמו בריטניקה

Google Doctype – אנציקלופדיה חופשית למפתחי Web על ידי מפתחי Web

ב-14 במאי 2008 הצהירה Google על גרסת ביתא של Google Doctype – אנציקלופדיה חופשית – מעין וויקיפדיה, בנושאים הקשורים לפיתוח יישומים ב-Web. האנציקלופדיה מכילה שורות קוד רבות ב- javascript בנושאים שחשובים למפתחי Web – נושאי אבטחת מידע, CSS, הטמנה (Caching), טיפים ועוד. שורות הקוד פתוחות לשימוש במסגרת ה- creative commons, האנציקלופדיה כולה ניתנת להורדה ולהפצה, ומפתחי Web נקראים לתרום לאנציקלופדיה זו… מטרתה של האנציקלופדיה  מעשית – לענות למפתחי Web על השאלה "כיצד" ? והתרומה צריכה להיות בהתאם.
כיום היא נמצאת עדיין בשלב ביתא והיקפה מצומצם יחסית, אך אין ספק שזו יוזמה חשובה של Google עבור מפתחי Web שיוכלו למצוא במקום אחד ריכוז של שורות קוד חופשיות לשימוש ולהפצה מחודשת בנושאים חיוניים לפיתוח, וככל שירבו התורמים כן תגדל תרומתה.

לאתר האנציקלופדיה 

תוכנה שתדרג אוטומטית את רמת האמינות של ערכים באנציקלופדיה וויקיפדיה

אתי יערי מהמחלקה ללימודי מידע באוניברסיטת בר אילן בדקה בעבודת הדוקטורט שלה את האפשרות להעריך באופן אוטומטי את האמינות של ערכים בוויקיפדיה, כדי לספק מדד יעיל לגולשים על איכות הערך.
לדברי יערי, מחקרים מראים שרוב משתמשי האינטרנט אינם טורחים לאמת את המידע שהם שואבים מהרשת באמצעות מקורות אחרים. "המטרה היא לבנות כלי שתוכל להשתמש בו בכל פעם שתיכנס לוויקיפדיה. תופיע לך תיבה, שבה רמז לגבי האיכות של הערך, למשל בצורה של ציון מאחת עד עשר". באחרונה קיבל צוות המחקר מענק מאיגוד האינטרנט הישראלי, כדי לפתח אמצעי כזה.

עבודת הדוקטורט של אתי יערי,  תוצג בשבוע הבא בכנס של מכון נטוויז'ן לחקר האינטרנט באוניברסיטת תל אביב.

הידיעה  המלאה שהתפרסמה ב "קפטן אינטרנט"

הכנס הארצי השני של  דוקטורנטים חוקרי אינטרנט 

מנוע החיפוש של הסטארט-אפ Powerset הוא מנוע חיפוש מסוג אחר – האם יתחרה בגוגל?

כתבה מ- TheMarker מ-15.5.2008.

Powerset השיקה השבוע גרסה ניסיונית של מנוע חיפוש חדשני שמשתמש בטכניקות חיפוש מתקדמות, שמאפשרות הבנה סמנטית של דפי ה-Web. מנועי החיפוש המסורתיים, כולל גוגל משתמשים בשיטת החיפוש הקונבנציונלית שמתייחסת אל דפי ה-Web כאסופת מלים. בניגוד למנועי החיפוש המסורתיים מנוע חיפוש זה הוא מנוע חיפוש סמנטי אשר מייצר ייצוג סמנטי של הדף על ידי ניתוח כל משפט המופיע בו, והבנת המשמעות שלו. באופן זה המנוע יכול לתת בתוצאות החיפוש אוסף של עובדות הקשורות לשאילתה, לתמצת את המידע, ולספק תשובות ישירות לשאלות עובדתיות.
האם בזכות שיטת החיפוש יוכל מנוע החיפוש של Powerset להתחרות בגוגל? היתרון העצום של גוגל בנוסף לאלגוריתם המתוחכם שלו הוא האינדקס העצום שלו . על פי דברי מריסה מאייר, סגנית נשיא בגוגל האחראית על מוצרי החיפוש וחוויית משתמש, "עם כמויות מידע כל כך גדולות, בסופו של דבר מתקבלות תוצאות שנראות אינטליגנטיות, למרות שהן נאספו באמצעות כוח-גס ותו לא".
האינדקס של Powerset לעומת זו מוגבל ביותר, וכולל רק כמיליון דפים מוויקיפדיה וממסד הנתונים האינטרנטי Metaweb Technologies' Freebase. עם זאת, מנהל המוצר של Powerset סקוט פרווסט מבטיח שהאינדקס יתחיל לגדול בתוך חודש מרגע ההשקה, ובסופו של דבר יוכל להתחרות מבחינת גודלו מול גוגל, יאהו ואחרים.
בעתיד Powerset תצטרך להוכיח שמנוע החיפוש שלה יכול להתמודד עם אינדקס של מיליארדים רבים של דפי אינטרנט, ולשרת מיליוני משתמשים במקביל. "אין ספק שיש כאן פוטנציאל, אבל ליישם את מה ש-Powerset עשתה על הרשת כולה הוא אתגר עצום שיצריך זמן רב ומשאבים עצומים",אומר האנליסט גרג סטרלינג מחברת Sterling .Market Intelligence
אשר לגוגל אין ספק שהיא שוקדת על פיתוח טכנולוגיות סמנטיות ומנוע החיפוש שלה יהיה בעתיד חלק מה- Web הסמנטי . מי יקדים את מי? ימים יגידו…

ובינתיים, כדאי להשתמש במנוע חדש וחדשני זה לחיפוש מאמרים מה-wikipedia

לכתבה המלאה ב-TheMarker
קרדיט לד"ר אריאל פרנק שהפנה את תשומת לבי לכתבה

ויקיפדיה – הגירסה המודפסת

המו"לית הגרמנית ברטלסמן תוציא לאור ספר המכיל ערכים נבחרים מאנציקלופדיית התוכן החופשי המקוונת, ויקיפדיה. הספר, שייצא לחנויות בספטמבר ויכיל רק כרך אחד, יימכר ב-19.95 יורו.

קרדיט ולידיעה המלאה:  TheMarker , 23/4/2008

WikiAnswers -שירות נוסף של Answers.com

WikiAnswers הוא שירות נוסף של Answers.com .Answers.com מוכר כמנוע "לכל שאלה תשובה"  מסוג "encyclodictionalmanacapedia" – כלומר האינדקס שלו הוא למעשה מאגר יעץ מקוון גדול שכולל מגוון מקורות יעץ – אנציקלופדיות כמו בריטניקה וויקיפדיה, מילונים לשוניים, אוניברסיטאות ועוד . למנוע מרכיב נוסף WikiAnswers. בעוד ש- Answers.com מטרתו לספק מידע כללי בנושאים שונים הרי מטרתו של שירות זה הוא לתת מענה לשאלות יעץ ספציפיות ופרטניות יותר. השירות ניתן על ידי מתנדבים והמטרה ליצור מאגר גדול של שאלות ותשובות ספציפיות. ניתן לדפדף וגם לחפש במאגר התשובות. בשירות גם צוות  אחראים שעונים על השאלות, מוחקים "ספאם" ועורכים את התשובות במידת הצורך.

לפרטים נוספים, נתונים סטטיסטיים על השירות 

הוויקיפדיה במשבר זהות

מאמר שפורסם באקונומיסט  מתמקד במדיניות הכללת ערכים בוויקיפדיה. הוויקיפדיה שכוללת ערכים ב-250 שפות היא האנציקלופדיה הגדולה בהיסטוריה והדוגמה המצליחה ביותר של תוכן שנוצר על ידי המשתמשים. אבל נראה שהוויקיפדיה מתמודדת היום עם משבר זהות כאשר היא נקרעת בין שתי אלטרנטיבות הקשורות למדיניות של  הכללת ערכים. מצד אחד ההשקפה הטוענת שיש לכלול בה את כל  הידע האנושי ולא משנה עד כמה טריויאלי הוא יהיה, ומצד שני ההשקפה שיש למחוק ערכים בנושאים טריויאליים כדי לשמור עליה כעל מקור יעץ מהימן.

לכאורה ניתן לחשוב שכל אחד יכול לכתוב ולתרום בכל נושא שהוא, אך מסתבר שקיימת אליטה של כ-1000 הכותבים האקטיביים ביותר בוויקיפדיה שעל פיהם יפול דבר, והם אלה שמחליטים אילו ערכים ייכללו בוויקיפדיה ואילו יימחקו. כמו כן קיימת וועדת בוררות שמיישבת חילוקי דעות ומכריעה סופית בדבר גורלם של ערכים שנויים במחלוקת. בעליו של ערך  שנועד  למחיקה יכול להגיש ערעור ובדרך כלל יתבקש לספק מידע נוסף. כדי למדוד אם הנושא ראוי להיכלל בוויקיפדיה נקבעו מספר קריטריונים כמו אזכור האתר ודרוגו  בגוגול. כך למשל מייסד הוויקיפדיה עצמו ג'ימי ווילס נפל קורבן למדיניות זו כאשר ערך שכתב על מסעדה בדרום אפריקה, בה ביקר בקיץ שעבר, היה מועמד למחיקה מאחר והמסעדה לא זכתה לדרוג גבוה בגוגול.

אלה שתומכים בהשקפה שיש לכלול בוויקיפדיה כל מידע חוששים שמדיניות הבחירה הקיימת היום תרתיע כותבים פוטנצייאליים, והאכזבה ממחיקת ערכים גורמת להרבה אנשים לעזוב את הפרויקט. ואכן נתונים לא רשמיים מאוקטובר 2007 מצביעים על ירידה בפעילות ומדובר על חשש לחשוף את האמת.גוגול הצהירה בסוף דצמבר 2007 על יוזמת פרויקט האנציקלופדיה החופשית  Knol שתאפשר למומחים לכתוב  ערכים כל אחד בתחומו. יוזמה זו,   גם אם לא תמית את הוויקיפדיה הרי שהיא תגרום לוויקיפדים להרהר מחדש במדיניות הכללת  הערכים בה.

ומה בדבר הוויקיפדיה העברית? מסתבר שהמצב מבחינת בחירת הערכים דומה. מהרצאה מעניינת של החוקרת יפעת בילואוס ששמעתי לאחרונה, עולה שקיימת אליטה של כ-30 וויקיפדים על פיהם יפול דבר. מעניין היה לשמוע את אחד הכותבים בוויקיפדיה שנכח בהרצאה וסיפר על  נסיונו האישי ותלאותיו בהכללת ערך שכתב והיה מועמד למחיקה..

למאמר המלא