הייתם מוסרים את מפתחות ביתכם לזר? ומה לגבי המידע הפרטי שלכם?

Cell Phone Security Concept

היום, 28/1 מצוין במדינות רבות בעולם יום פרטיות המידע והגנתו. מטרתו של יום זה היא לעורר מודעות להגנה על פרטיות ונתונים. כיום, כאשר אנו חיים בעידן ה-BIG DATA קל לחברות לכרות מידע מבסיסי נתונים, לנתח את ים הידע הנאסף במהירות, להפיק מנתונים אלה תובנות אודות תבניות המניעות את עולמנו, וכך לצפות מהומות או לנבא התפרצות מגפות. למה אם כך יש צורך במודעות לפרטיות? הצורך במודעות לפרטיות המידע רק גדל כיוון שאסור לנו לשכוח מאין באו שלל הנתונים עליהם מתבסס ה-BIG DATA ואילו עוד שימושים יש למידע זה בדרך.

היום, כשלכולנו נייד בקצה היד, כל תהליך איסוף המידע, פיענוחו והפצתו הפכו קלים וזולים. מהפכת המחשוב שעבר העולם הקטינה את המחשב והפכה אותו למהיר. לשם השוואה – מערכת הניווט של חללית אפולו, פאר היצירה של אותה תקופה שקלה 32 ק"ג וזיכרון העבודה שלה היה 64KB RAM. בימינו הטלפונים שוקלים פחות מ- 200 גר', וזיכרון העבודה שלהם הוא בממוצע 4GB RAM, פי 64,000. מקצה היד שלנו זורם המידע אל מחשבי הענן שגודלם וכוחם המשותף כבר בלתי נתפס. כוח המחשוב המשותף של מחשב סריגי שכזה, מאפשר, כאמור, פתרון בעיות המטרידות את האנושות כמו חיזוי מגפות, אסונות, שאלות מסובכות כמו קיפול חלבונים ומציאת תרופות חדשות. אבל יש לו גם צד מסחרי.

בעבר כדי למכור מוצר, נאלצו המוכרים לכתת רגליהם ולעבור בין לקוחות, או לנחש היכן יקבל בית העסק שלהם חשיפה – היכן למקם חנות, והיכן לפרסם אותה: זמן שידור באמצעי התקשורת המוקדש לפרסום קצר ויקר וכך גם מודעות בעיתונים. גם הסתמכות על מובילי דעה כאמצעי פרסום היא בעייתית, כיוון שהיא מצריכה איתור שלהם, ומידה רבה של שכנוע ותקציב כדי שיפעילו את השפעתם ויפרסמו את המוצר. תהליך יקר ואיטי. היום, כאשר כולנו מחוברים לרשת האינטרנט, כל המכשירים המחוברים לרשת אוספים מיליוני טרה-בייטים של מידע ושולחים אותם בחזרה לענני המחשוב. משם הם נאספים ונמכרים על ידי חברות לכל מי שמוכן לשלם.

עולם זה של מסחר במידע הפרטי שלנו מתנהל הרחק מעל ראשינו, ואנו נהנים רק מפירורים הניתנים לנו כדי שנמשיך לספק אותו. בכל פעם שהזדהינו למערכת כלשהי, הצטרפנו למעשה למאגר המידע של אותה חברה, והתחלנו לתת לה פרטים אישיים עלינו. בתמורה מבטיחה לנו אותה חברה שתספק לנו שירות או מוצר מותאמים יותר לצרכינו, הטבות ופינוקים שונים בדמות הנחות למשל. מצד שני, מרגע שמסרנו את אותו מידע פרטי, איבדנו שליטה עליו. כל עוד אנו לקוח שנכנס לחנות, רכש מוצר ולא הזדהה, החנות יכולה לדעת רק שלאותו מוצר יש ביקוש. מרגע שהשתמשנו באמצעי זיהוי כלשהו המחבר אותנו הצרכנים למוצר, החברה יכולה להמשיך ולנסות למכור לנו מוצרים נוספים שלדעתה אנו צריכים: קניתם חולצה? רוצים גם מכנסיים, גרביים ונעליים? אולי תרצו משהו משותפינו המוכרים גם תיקים? תוכלו לקבל גם הנחה עבור רכישת נוספת בחנויות אחרות במועדון הלקוחות שלנו. נשמע מוכר?

את הקופאית המנסה למכור לנו עוד כמה מוצרים לא נחוצים כולנו מכירים. גם את הקופונים "המותאמים אישית" שמגיעים כל העת. אבל כמה מכם שמו לב להצהרת הפרטיות של האפליקציות? כמה שמו לב לרשימה הארוכה של הרשאות שאפליקציות שונות מבקשות לשימוש בטלפון הנייד? כמה מכם אישרו אותן מבלי לעצור שנייה ולחשוב למה? למה אפליקציה אחת צריכה לדעת אילו אפליקציות אחרות מותקנות על הטלפון? למה אפליקציות שבינן לבין מיקום גאוגרפי אין כל קשר, צריכות לדעת היכן אנחנו ולאילו רשתות WIFI התחברנו? קל להבין מדוע אפליקציות כמו WhatsApp צריכות גישה לרשימת אנשי הקשר שלנו, אבל למה אפליקציה להזמנת מונית צריכה להכיר אותם או מדוע היא צריכה גישה ללוח השנה שלנו? אנו צורכים את האפליקציות הללו אך רובנו לא שמים לב, ובלי משים מאשרים לאפליקציות לאסוף עלינו מידע פרטי. לעומת זאת האפליקציות, מצהירות בהצהרת הפרטיות שלהן כי מידע שאנו מוסרים להן מרצוננו הוא רכושן ויתכן שמידע זה יועבר גם לגורם שלישי. וכך לא רק הרגלי הקנייה שלנו הופכים לרכושן, גם תמונות שאנו משתפים, סטטוסים שפרסמנו, וכל פרט מידע אחר שפרסמנו הוא שלהן ויכול לעבור הלאה לגורם שלישי.

מיהו אותו "גורם שלישי"? מדובר בחברות מסחריות אחרות המשלמות עבור המידע, אבל לא רק. לעיתים מדובר בגורמים ממשלתיים הדורשים מחברות להעביר להן מידע על הגולשים מסיבות ביטחוניות, כמו מניעת פשע או טרור. גם כאן ההגדרות בעיתיות. במשטרים טוטאליטריים המנסים לשלוט במידע שמקבלים אזרחיהן ובמידע העובר ביניהם, ברור לנו שהממשלה המאזינה לאזרחיה ויודעת עליהם הכל. אבל אסור לשכוח שגם ממשלות מערביות עלולות לגלוש במדרון החלקלק של מעקב אחרי האזרחים, כדי להטות את דעת האזרחים לדעה הרצויה לממשל.

כאשר כל המערכות סביבנו מחוברות לרשת האינטרנט, לא מעשי שנתנתק לחלוטין. אבל מה כן אפשר לעשות?

  • היו מודעים לזכותכם לפרטיות ואל תמסרו מידע אישי מיותר. הוא שווה לקמעונאיות הרבה יותר מאשר קופסת השוקולדים ביום ההולדת וכל ההנחות שתקבלו בעזרת הקופונים, ושווה יותר מכל יתרון בכל אפליקציה.
  • אל תתפתו להשתתף בשאלוני רשת חביבים המחייבים כניסה עם חשבון גוגל או פייסבוק. הפרופיל שלכם שווה הרבה יותר מהידיעה מה פירוש אותיות שמכם באלפבית הרוני, איזו חיה הייתם בגלגול הקודם או כמה אתם חכמים.
  • קחו לכם מספר דקות ועברו על רשימת ההרשאות של כל אפליקציה בטלפון הנייד. אם הטלפון מאפשר – כבו כל הרשאה מיותרת. כמובן שמיד תוזהרו שהאפליקציה עלולה לא לפעול בלי ההרשאה הנסגרת, אך לא צריך להיבהל. הרוב יפעל גם בלי ההרשאות המיוחדות, ומה שלא ניתן תמיד לאישור מחודש.
  • הגדירו חשבונות כפרטיים ברשתות החברתיות, כך שרק מי שתאשרו יוכל לראות מה שיתפתם.
  • קיבלתם פנייה או שיחת טלפון מגורם לא מוכר ולא רצוי – חסמו אותו.
  • פנו למפתחים אם אפשר ודרשו לדעת – לאן הולך המידע. שימו לב גם לשינויים בהגדרות הפרטיות ופנו לחברות. תלונות גולשים גורמות לחברות לשמור טוב יותר על פרטיות תוכן הגולשים.

זכרו תמיד שהמידע האישי הוא שלכם. בדיוק כמו מפתחות הבית או הרכב. גם אותם לא תמסרו לזרים בלי לדעת למה. קחו את היום להתחיל לקחת בחזרה את המושכות אליכם.

מדעי הרוח הדיגיטליים – יום עיון ראשון בספרייה המרכזית

 

עם תחילת שנת הלימודים חנכנו בקומת הגלריה את "הספרייה הדיגיטלית" – מרחב למידה חדש ובו חללי למידה והוראה מגוונים, המצויידים בעזרים טכניים מתקדמים. פתיחת המתחם החדש משתלבת בחזון הכולל שלנו, הרואה את הספרייה כגורם מרכזי בהפצת אוריינות מידע, בתמיכה במחקר ובהוראה ובהנגשת מידע איכותי לקהל המשתמשים האוניברסיטאי. ככזו, הספרייה מחוייבת גם לקידום כלים טכנולוגיים בהוראה ובמחקר, אליהם נהוג להתייחס כאל "מדעי הרוח הדיגיטליים".

ברוח זו קיימנו ביום שני ה27.11 יום עיון קצר בתחום מדעי הרוח הדיגיטליים תוך התמקדות במאגר מידע חדש שהספרייה רכשה עבור קהילת האוניבברסיטה – Eighteen Century Collections Online. כריס יוטון מחברת גייל, המו"לים של המאגר ושל מאגרים נוספים הקיימים באוסף הספרייה, דיבר על החומרים הכלולים במאגרים שרכשנו והציג דוגמאות לחיפושים מושכלים. הוא הרחיב בדבריו גם על כלים מעולם מדעי הרוח הדיגיטליים המוטמעים במאגרים, כגון תצוגות אינפוגרפיקה של מעקב אחר שכיחות מילים, יצירת ענני מונחים, OCR וכדומה. כדי להמחיש את השימוש המעשי בכלים אלו, כריס הציג מחקרים שנעשו בעזרת המאגרים השונים של החברה מתוך גישה של מדעי הרוח הדיגיטליים. כלים אלו אפשרו, למשל, לבצע השוואות סגנוניות בין מחזותיו של שייקספיר למחזותיו של מארלו, וזאת על מנת להכריע לגבי זהות המחבר של כתבים נתונים בספק. חוקרת אחרת מיפתה התכתבויות דיפלומטיות מתקופת הנרי השמיני וכך הצליח לזהות "מרגלים" מתוך רשת הקשרים וסגנון הכתיבה שלהם. מחקר מלהיב המתבצע בימים אלו מוקדש ל"חילוץ" שירה שהתפרסמה אך ורק בכתבי עת ולכן לא הייתה ידועה או נגישה לחוקרים בני זמננו.

פרופ' איימי סינגר מהחוג להיסטוריה של המזרח התיכון ואפריקה הציגה את הנושא מנקודת המבט של החוקר המבקש לנצל כלים דיגיטליים בעבודתו. היא דיברה על הפער הלא מתועד בין הממצאים הראשוניים העומדים בבסיס המחקר לבין התוצר – ספר או מאמר. האם יש דרך לתעד את תהליך העבודה, לשתף את תוצרי המשנה שלו או לעבוד בצורה שיתופית? זו נקודה מעניינת וחשובה לה ניתן יהיה, אולי, למצוא פתרונות תוך שימוש בכלים מעולם מדעי הרוח הדיגיטליים. פרופ' סינגר הציגה את הפרוייקט המקוון בו היא מעורבת יחד עם קבוצה של חוקרים נוספים – Open Ottoman. זהו פורטל המאגד מקורות (בעיקר דיגיטליים) ללימוד העולם העות'מני, הדרכה לשימוש בהם ושיטות עבודה מומלצות. בפורטל גם ניתן למצוא קישורים למאגרי מידע רלוונטיים לצד סקירה ביקורתית שלהם.

גילה מיכלובסקי, מנהלת ספריית וינר לחקר התקופה הנאצית והשואה, הציגה את פרוייקט הדיגיטציה של מסמכי אוסף וינר המתבצע בספרייה. אל המסמכים הסרוקים, לצד רשומות ביבליוגרפיות מפורטות, ניתן להגיע מכל מחשב בעולם דרך חיפוש בדעת"א. כמו כן, ניתן להוריד את הקבצים הדיגיטליים עצמם ואת הרשומות המלוות אותם ללא הגבלה.

לסיכום, פיטר פוסטר מחברת גייל סקר את התוכניות העתידיות של החברה לקידום התחום. לפי מחקרים מעודכנים, 90 אחוזים מהמשתתפים בקהילה דיגיטלית כלשהי הם פאסיביים לחלוטין, 9 אחוזים תורמים ומעשירים את המידע בצורה ספורדית ורק אחוז אחד אחראיים לרוב התוכן המיוצר בקהילה. בהתאם לכך, גייל מחוייבת להנגיש כלים מעולם מדעי המחשב לקהילת החוקרים במדעי הרוח בצורה ידידותית וקלה לשימוש על מנת לאפשר גם לאלו שאין להם רקע בעולם מדעי המחשב להעשיר את הפרקטיקה המחקרית שלהם, להצטרף לאחוז המשתתפים האקטיביים ולתרום לעולמות התוכן הרלוונטיים באופנים חדשים.

להתראות ביום העיון הבא!

 

כנס אווה/מינרבה הארבעה-עשר לדיגיטציה של מורשת התרבות

 

השבוע התקיים במכון ון-ליר בירושלים כנס אווה/מינרבה הארבעה-עשר לדיגיטציה של מורשת התרבות. כנסים אלו, המתקיימים מאז שנת 2004, הפכו למסגרת מרכזית להצגת פרויקטים חדשים בתחומי הדיגיטציה בעולמות התרבות ולמפגשי עמיתים של המתעניינים בתחום – חוקרים וסטודנטים, אוצרים, אנשי מחשבים, ארכיונאים, ספרנים ואנשי ממשל מאירופה ומישראל. בכנסים מוצגים כלי מחקר חדשים, יוזמות ציבוריות אירופאיות-ישראליות לשימור, הנגשה והפצת תרבות באמצעים דיגיטליים, שיתופי פעולה, אפליקציות מתקדמות עבור מוסדות תרבות וכן תשתיות פתוחות למחקר במדעי הרוח.

יומו הראשון של הכנס עמד בסימן ההשקה החגיגית של פורטל המוזיאונים הלאומי לאחר תקופת פיילוט ארוכה. האתר הוא פרי פרויקט שימור והעצמה דיגיטלית המשותף למשרד התרבות והספורט, משרד רה"מ, אגף מורשת ועשרות המוזיאונים המוכרים בישראל, בכל התחומים. מטרתו היא לחשוף בפני הציבור באופן נגיש, ידידותי ואיכותי את הפריטים המגוונים השמורים במוזיאונים, הן בתצוגה והן באחסון – בסה"כ כמיליון וחצי פריטים במגוון תחומים: אמנות, יודאיקה, היסטוריה, ארכיאולוגיה, אתנוגרפיה, טבע ומדע. המידע באתר מאורגן בשלושה רבדים – רובד המוזיאונים הכולל דפי מידע על המוסדות השונים ועל אוספיהם; רובד הפריטים המציג אלפי פריטים שסומנו כבעלי ערך מיוחד, והם מופיעים לצד מידע מפורט אודותיהם; ורובד התערוכות המגיש טעימות משלל התערוכות המוצגות בימים אלו או הוצגו בעבר במוזיאונים השונים. שיתוף פעולה עם Europeana, הספרייה התרבותית הדיגיטלית הכלל אירופית, מאפשר איתור, אחזור, צפייה ומחקר של פריטים מקבילים באמצעות כלי מתקדמים המוטמעים בפורטל.

מושב מיוחד הוקדש לסקירת מיזמי דיגיטציה של נכסי תרבות המבוצעים בארץ בחסות מחלקת היודאיקה בספריית אוניברסיטת הרווארד. הראשון שבהם הוא פרויקט הדיגיטציה של ארכיון הצלם ישראל צפריר השמור במרכז המידע לאמנות ישראלית במוזיאון ישראל. הארכיון הייחודי מונה כעשרים אלף צילומים של אמנים ישראליים או של יצירות אמנות ישראלית. הדוברות סקרו את התהליך הטכני של סריקת חומרי הארכיון המגוונים (נגטיבים, פוזיטיבים, שקופיות, מעטפות וכדומה) והצמדת המידע הקטלוגי הרלוונטי לכל פריט ופריט. בנוסף, סופר על הקושי הגדול הגלום בניסיון לזהות את יצירות האמנות המצולמות, וכן הבעייתיות של הסדרת זכויות היוצרים בסוג חומרים שכזה. החומרים שנסרקו והמידע עליהם מוצגים באמצעות הקטלוג המקוון של הספרייה בהרווארד.

בהמשך נסקרה ההתקדמות בפרויקט הלאומי "שימור מורשת תרבות חזותית ואמנויות הבמה" של תכנית "ציוני דרך" במשרד מורשת וירושלים ובשיתוף הספרייה הלאומית המרכזת את המיזם ומנהלת אותו מקצועית. פרויקט זה מוקדש לשימורה של מורשת התרבות החזותית ואמנויות הבמה בישראל לדורותיהם, והוא כולל תיעוד, דיגיטציה, שימור ומחקר של תחומי תרבות אלה לצד חשיפתם של כל האוספים המתועדים לציבור הרחב. הפרויקט מחולק לארבעה אשכולות – עיצוב בהובלת שנקר, תאטרון בהובלת החוג לתאטרון והספרייה באוניברסיטת חיפה, ארכיטקטורה בהובלת בצלאל ומחול בהובלת להקת בת שבע. דובר על האתגרים המיוחדים הכרוכים בתיעוד ושימור של ארכיונים של אנשים פרטיים וגופים כגון קיבוצים, להקות מחול, משרדי אדריכלים, אנשי תאטרון וכדומה. מגוון החומרים והמדיה הוא עצום, מצבם לא תמיד מזהיר והמידע עליהם אינו מלא. במסגרת הפרויקט חומרים אלו יעברו דיגיטציה איכותית, המידע עליהם יועשר והם יהיו נגישים לכל באמצעות הפלטפורמה הדיגיטלית. הודגשה הגמישות והאינטרדיסיפלינריות הגלומה בפורמט הדיגיטלי, המאפשר השוואה בין פריטים ממקורות שונים, יצירת הקשרים חדשים ואוספים וירטואליים חוצי גבולות.

בנוסף, הוצגו כלים דיגיטליים חדשים לחוקרים ולמוזיאונים בתחומי מדעי הרוח והאמנויות –

IMareCulture – פרויקט בשנתו הראשונה, שמטרתו היא העלאת המודעות לארכיאולוגיה תת ימית באירופה וחשיפת האתרים, שברובם לא ניתן לבקר בקלות, לקהל הרחב. המיזם המורכב משותפים מכל רחבי היבשת מתרכז בפיתוח כלים דיגיטליים מתקדמים ליצירת חווית ביקור מועצמת במוזיאונים ימיים, להוראה ולמחקר. בין הפיתוחים – משחקים המדמים חפירות תת ימיות וביקורים וירטואליים באתרים תת ימיים (מבוסס על ממצאים אמיתיים ומפוקח אקדמית); פאזלים תלת ממדיים של ממצאים מאתרים אלו; ספרייה דיגיטלית של ספינות טרופות משוחזרות ושל אמפורות; משחקים לימודיים של ניווט בספינות עתיקות, כשהמטרה היא להרוויח כמה שיותר ממסחר תוך התחשבות בתנאי הים והשייט העתיקים וכן כלי דיגיטלי לשיפור איכות סרטים שצולמו תחת המים. המטרה היא שכל הכלים הללו פתוחים לציבור, כולל הקוד, בהתאם להתוויות האיחוד האירופאי לפרויקטים מסוג זה.
ArchAide – בפיתוח קונסרציום מכל אירופה, כולל בית הספר למדעי המחשב מאוניברסיטת תל-אביב. מטרת המיזם היא ליצור כלי לזיהוי חרסים אוטומטי באמצעות צילום, ובכך להוריד משמעותית את הזמן המוקדש במחקר לפעולה הפרטנית של זיהוי חרסים באמצעות קטלוגים מודפסים. הרעיון הוא להשתמש בשיטת הזיהוי הקלאסית – על פי סוג החומר, צורה עיטור אבל בצורה ניידת ווירטואלית, אפילו כבר באתר החפירה עצמו. בשלב הראשון הוכנסו לאתר קטלוגים של אמפורות רומיות בעזרת OCR, והאיורים בקטלוגים עובדו למודלים ב3D; היות והאתר הוא רב לשוני היה צורך גם ליצור מושגים מוסכמים ומילון זהויות ולהשתמש במילונים מבוקרים כגון גטי ופליאדס. השאיפה היא ליצור מאגר מידע פתוח לשימוש, שיוזן ממצאים של המשתמשים בשטח. בקרוב תתחיל בחינת האפליקציה באתרי חפירה פעילים.
Parthenos – מיזם אירופאי משותף נוסף, שמטרתו לחזק ולאחד פרויקטים דיגיטליים בתחומי היסטוריה, בלשנות, מורשת תרבותית, ארכיאולוגיה ושדות קרובים במדעי הרוח. הכוונה היא ליצור תשתית אינטגרטיבית שתתמוך בארכיבים הדיגיטליים הגדולים שנוצרו בשנים האחרונות ובמתודולוגיות מחקר חדשניות, וזאת כדי לקדם מחקר דיגיטלי שיתופי. פרתנוס תומך בשתי תשתיות מחקר אירופאיות מרכזיות – dariah בתחומי מדעי הרוח ו clarin בתחומי חקר השפה. המיזם מקדם יצירת סטנדרטים משותפים, מתאם בין פרוייקטים מחקריים שונים, מקדם קביעת מדיניות והטמעתה, מרכז שיטות מחקר ושירותים מתקדמים ומפיץ פתרונות לבעיות משותפות.

מושב נוסף בכנס הוקדש לחידושים באתר אירופיאנה, להם יוקדש פוסט נפרד.

הכנס המעניין חשף בפני הבאים את העשייה הנמרצת בתחום המחקר, השימור וההנגשה בתחומי מדעי הרוח והאמנויות בישראל ואת שיתופי הפעולה הפוריים המתקיימים בין הזירה המקומית לבין האיחוד האירופי והרווארד. שיתופי פעולה אלו מאפשרים לפרוץ גבולות של חומר, זמן ומקום, להגיע לקהלים חדשים, לחשוף אוצרות חבויים ולהעלות שאלות מחקר חדשות ופורצות דרך. נמשיך לעקוב ולעדכן!

הקונגרס העולמי ה-17 למדעי היהדות – פרויקטים וכלים דיגיטליים

download

בשבוע שעבר התקיים בקמפוס הר הצופים של האוניברסיטה העברית בירושלים הקונגרס העולמי השבעה-עשר למדעי היהדות. הקונגרס, המתקיים אחת לארבע שנים מאז 1957 (הקונגרס הראשון נערך ב1947) הוא הכינוס הגדול ביותר במדעי היהדות בעולם ובמדעי הרוח בארץ. במסגרתו מתקיימים מאות מושבים המתפרסים על פני חמישה ימים עמוסים בתכנים הנוגעים למקרא, תולדות עם ישראל, ספרות חז"ל, תלמוד ומשפט עברי, מחשבת ישראל ותפילה, ספרויות, לשונות, אמנויות, וכל היבטי החברה היהודית בת זמננו. בקהל המרצים והמאזינים ניתן למצוא אורחים רבים מחו"ל, חוקרים, סטודנטים, אנשי חינוך, מתעניינים מהקהל הרחב וכן ספרנים, מידענים ואנשי מדע המידע.

במסגרת הכנס הוקדשה חטיבה נושאית שלמה ל"מפעלי מחקר וידע", ובה נסקרו, בין היתר, מפעלי ארכיונים, פרויקטים של מחשוב וההדרה דיגיטלית של טקסטים קדומים, חינוך בעידן הדיגיטלי, כלים דיגיטליים למחקר ולהנגשה במדעי היהדות, הנגשת אוספי יודאיקה וכן הוצג מבחר רחב של פרויקטים דיגיטליים במושב פוסטרים.

מבין הפרויקטים הדיגיטליים שהוצגו בכנס –

  • השקת "כתיב" – האוסף הבין לאומי של כתבי יד עבריים דיגיטליים מבית הספרייה הלאומית. זהו פרויקט המעלה לרשת סריקות איכותיות של כתבי יד עבריים מכל העולם בגישה חופשית. באתר אפשרויות חיפוש מתקדמות וכן סביבת עבודה מותאמת אישית.
  • ספרדתא – מפעל הפליאוגרפיה העברית – מפעל שמטרתו לאפיין ולסווג את כל כתבי היד העבריים מימי הביניים. כתבי היד מסווגים על-ידי מאות מאפיינים פיזים וטקסטואליים שונים, כדוגמת נתונים על הדיו, קודקסים, מסורות העימוד של הטקסט, ממדי דף וטקסט והפרופורציות שביניהם, ניהול השורה וסימנים גרפים הנלווים לכתב. כך נוצרה טיפולוגיה היסטורית המאפשרת לחוקרים לזהות את מוצאו ותקופתו של כתב היד. לכך מתקשר פרויקט בתהליך המתבצע באוניברסיטת בר-אילן מבקש ליצור "אונתופדיה" של כתבי היד היהודיים, בהתבסס על מיפוי אירועים לאורך חייהם של כתבי היד – פרסום, צנזורה, העתקה, מכירה וכדומה.
  • Epidat – מאגר כתובות מצבה יהודיות ממזרח אירופה מהמאה ה11 ועד אחרי מלחמת העולם השנייה. במאגר אפשרויות חיפוש מגוונות, על פי תקופה, מיקום גיאוגרפי (גם על פני מפה), טקסט מלא, דימויים ועוד. הרשומות מאוחדות על ידי שימוש באוצרות מילים מבוקרים, כגון אלו של מכון גטי או קובץ הזהויות של הספרייה הלאומית. באותו הקשר כדאי לציין גם את אתר הכתובות מישראל/פלסטין, המאגד כתובות שנוצרו במרחב הגיאוגרפי הזה מהתקופה הפרסית ועד לכיבוש האסלמי.
  • Forever Project – פרויקט של מרכז ומוזיאון השואה הלאומי באנגליה. אלו הם ראיונות עומק מקיפים שנערכים עם ניצולי שואה ומצולמים בתלת ממד. טכנולוגיות של זיהוי קולי ושל מציאות מדומה מאפשרות ליצור מעין "שיחה" חיה עם דמותו של הניצול. הכוונה היא להשתמש בטכנולוגיה זו למטרות חינוכיות בבתי ספר.
  • האתר החדש של מוזיאון ישראל מאפשר "חיפוש באוספים", צפייה בפריטים מהאוסף ברזולוציה גבוהה לצד מידע מפורט על כל פריט ופריט. בהקשר זה הוזכר הניסיון המוצלח של הרייקסמוזיאום באמסטרדם. מאות אלפי תמונות ברזולוציה גבוהה שהועלו לאתר המוזאון, ללא כל הגבלת שימוש וזכויות יוצרים, יצרו תנועה משמעותית באתר, הופיעו במגוון פלטפורמות אינטרנטיות כגון ויקיפדיה, והגדילו עד מאוד את חשיפתם של המוזיאון והאוסף שלו בעולם כולו.
  • Understanding Sin and Evil – פודקאסט של מרים ברנד, חוקרת אמריקאית העוסקת בתפיסת הרוע והחטא ביהדות של תקופת בית שני. ד"ר ברנד דיברה על חשיבותו של הפודקאסט ככלי להפצת ידע לקהלים מגוונים בכל העולם, וחלקה טיפים מניסיונה. הכי חשוב לדעתה – זה לא המדיום המתאים להרצאה אקדמית ודידקטית! נהלו שיחה, פנו לקהל בגובה העיניים וזכרו שרוב המאזינים עוסקים בפעילויות שונות תוך כדי האזנה.
  • נדונה תרומת המהפכה הדיגיטלית ליצירת מהדורת מקראות גדולות המקוונת.
  • Europeana – הוא אתר אינטרנט המספק גישה למיליוני ספרים, ציורים, סרטים, פריטי מוזיאון וחומרים ארכיוניים שעברו דיגיטציה באירופה. האוספים המקוונים הכלולים בו מונים יותר מ50 מיליון פריטים דיגיטליים; כלי דלייה מתקדמים מאפשרים חיפושים ממוקדים באוספים העצומים, הכוללים אמנות, ספרים, מוזיקה ועוד. באתר שותפים למעלה מ1,500 מוסדות תרבות אירופאים כגון מוזיאונים, ארכיונים וספריות. חלק מהדימויים הכלולים בו פתוחים לשימוש חופשי, וכל המטא-דאטה של הפריטים האצורים בו פתוח לכל המעוניין. החומרים הכלולים באתר מאורגנים באוספים נושאיים, כשאחרון שבהם, שעלה לאוויר לפני כמה חודשים, הוא אוסף האופנה. כעת שוקדים באתר על פורטל שיאגד את החומרים הקשורים ליהדות.

כמה כלי מחקר בגישה פתוחה –

  • Open Refine (לשעבר Google Refine) – כלי לעבודה עם מידע "מבולגן", המאפשר לנקות אותו, להעביר אותו מפורמט אחד לשני ולהעשיר אותו בעזרת מידע חיצוני.
  • Hspell – כלי חופשי לבדיקת איות בעברית וכן לביצוע ניתוח מורפולוגי.
  • With – פלטפורמת חיפוש המסוגלת להגיע ל API של מאגרים ופורטלים בתחומי התרבות בכל רחבי העולם. בעזרת with ניתן לדלות, בחיפוש אחד, תוצאות ממאגרים שאינם מקושרים זה לזה כגון Europeana, DPLA, Rijksmuseum  ורבים אחרים.

פרויקטים אלו ואחרים שהוצגו בקונגרס הדגישו את חשיבות הכלים המחקריים הדיגיטליים והשיתופיים, המסייעים בידי החוקרים לפנות לכיוונים מחקריים חדשים וגם להנגיש את מחקריהם לציבורים חדשים ומגוונים. וכשפונים לכיוונים חדשים, לפעמים יש הפתעות! כך מצאו חוקרי לבוש ימיביניימי דווקא במאגר כתובות המצבה היהודיות דימויים נדירים של נעליים מהתקופה, שהופיעו על מצבותיהם של סנדלרים; מרים ברנד הופתעה מאוד לגלות שיפן היא ארץ בה זוכה הפודקאסט שלה לפופולריות גדולה. כך הטכנולוגיה הופכת לכלי מחבר, המאפשר קשר אנושי, לימוד והפרייה הדדית וחשיפה למגוון רחב ועשיר של חומרים ומקורות.

פוסטים קודמים בנושא מדעי הרוח הדיגיטליים – כאן וכאן

מדעי הרוח הדיגיטליים – כלים לחוקר ולספרן

The Programming Historian

The Programming Historian

השימוש בכלים, בשיטות ובתוכנות מעולם מדעי המחשב על ידי חוקרים המתמחים במדעי הרוח הולך ותופס תאוצה בשנים האחרונות, והוא מאפשר פתיחת כיוונים חדשים והעלאת שאלות מחקר מקוריות ומלהיבות. בהתאם לכך נפתחות תכניות לימודים משולבות (כמו באוניברסיטת חיפה בארץ), כנסים בנושא מתקיימים בכל רחבי העולם (גם בכנס טלדן השנה הוקדש מושב לנושא), ופרויקטים שיתופיים מעניינים עולים לרשת (לדוגמא – Mapping the Republic of Letters). גם הספריות האקדמיות, המצטיינות בהון אנושי המתמחה בחיפוש ובארגון מידע, מנסות למצוא את הדרך להשתלב במגמה זו הן כמסייעות למחקר והן כיוזמות ומקדמות פרויקטים דיגיטליים שונים.

סקר שנערך בספריות מחקר אקדמיות בסוף 2015 הדגיש את חשיבותה של המעורבות הספרייתית בקידום מדעי הרוח הדיגיטליים, ועמד על האתגר הכרוך בכך, היות ומדובר בתחום צעיר, גדל ומשתנה תדיר. תוצאות הסקר מדגישות את מרכזיותן הרבה של התעדכנות מתמדת והתמקצעות של צוותי הספרייה. על הספרנים לשאוף להכיר את החוקרים העוסקים בתחומים אלו במוסד שלהם ובמוסדות אחרים, וכך ליזום וליצור שיתופי פעולה. בנוסף, מומלץ שהספרנים יתעדכנו באופן שוטף בשיטות ובכלים חדשים בתחום, וכך יהיו מסוגלים לתמוך במחקר באופן אקטיבי. מודגשת גם החשיבות של שיתוף פעולה בין ספריות מחקר ביצירת רשתות של העברת מידע, רעיונות, השראה ותמיכה.
כראוי לתחום שאבני היסוד שלו הן שיתופיות, גישה פתוחה וקוד פתוח, ניתן למצוא ברשת אתרים מצוינים ומלאי מידע שימושי ומעודכן להתמקצעות בנושאים אלו.

לחוקרים כדאי להכיר את –
The Programming Historian
באתר זה מגוון עשיר ומתחדש תדיר של הדרכות מקוונות שמטרתן לסייע לחוקרים במדעי הרוח להכיר שיטות ועקרונות תכנות בסיסיים וכלים דיגיטליים שימושיים. כל ההדרכות עוברות ביקורת עמיתים והן מותאמות למתחילים בתחום. בנוסף, צוות העורכים מעודד חוקרים להציע נושאים להדרכות ואף לכתוב אותן בעצמם. באתר, הפועל תוך קידום גישה פתוחה וקוד פתוח, ניתן למצוא גם בלוג פעיל, ביבליוגרפיה רלוונטית והפניות לכנסים, ימי עיון וסדנאות.

Digital Humanities Awards
אתר המרכז פרויקטים דיגיטליים מקוונים שזכו בפרסי מצוינות בהצבעה פתוחה ברשת.

ספרנים ימצאו עניין ב-
dh+lib הוא אתר שצמח מתוך קבוצת הדיון הרלוונטית בACRL, ומטרתו היא ליצור מרחב פומבי ופתוח שבו יוכלו ספרנים, ארכיונאים, סטודנטים לספרנות ומידענים לתרום לדיון בנושאים הללו ולהפצתם. באתר תוכלו למצוא המלצות קריאה, קולות קוראים, הצעות עבודה וקישורים מעניינים אחרים.

ארגון ספריות המחקר האירופאיות ערך לא מזמן כנס שהוקדש למחקר דיגיטלי, ובו הוקדש יום שלם למדעי הרוח. בנוסף, השיק הארגון קבוצת עבודה שתתמקד בתחום.

כנס שנערך לאחרונה בסקנדינביה עסק במדעי הרוח הדיגיטליים בספריות האקדמיות הנורדיות.
כנס IFLA שיערך באוגוסט בברלין יקדיש תוכנית לנושא.

ברוח זו, גם אנו בספרייה המרכזית באוניברסיטת תל-אביב רואים חשיבות רבה בהשתלבות בתחום צעיר וצומח זה ובהובלת תהליך של שיתוף פעולה חדשני בין החוקרים לבין הספרייה. השיפוץ הנרחב שעוברת קומת הגלריה בימים אלו מהווה חלק מרכזי בהגשמת חזון זה, היות והוא יאפשר לנו להעמיד לרשות החוקרים והסטודנטים חללי לימוד מתקדמים ומאובזרים, כיתות מחשבים וחדרי הדרכה. המרחב החדש והחדשני שלנו יהיה, בין השאר, מכוון לתמיכה טכנית ומקצועית בפרויקטים דיגיטליים במדעי הרוח והאמנויות, והחללים המתקדמים יאפשרו עריכת סדנאות הרצאות וסמינרים בנושא. יהיה מעניין!

פוסט קודם בנושא כאן

האתגר של ספריות כיום – שימור והנגשה:  פרויקט לאזארוס ופעילות "דורות"

שניים מהאתגרים הגדולים של ספריות הם:

  1. לשמר תוכן ישן, כך שגם אם החומר הפיזי מתבלה התוכן נשמר.
  2. הנגשת החומר לקהילות גדולות.

אתגרים אלו מקבלים מענה בעזרת טכנולוגיות שונות אותן מאמצות הספריות במטרה להישאר מעודכנות ורלוונטיות בעולם דיגיטלי, כפי שניתן לראות בדוגמאות המוצגות כאן.

סריקה ושימור של חומר ישן – פרויקט לאזארוס

לספריות, מוזיאונים וארכיונים יש ספרים וכתבי יד אשר נפגעו או הפכו לבלתי קריאים. כדי לפתור בעיה זו משתמשים בין השאר בטכנולוגית multispectral imaging. באמצעות הטכנולוגיה הטקסטים ניסרקים תחת מספר תחומים של אורכי גל. התמונות מעובדות וחושפות פרטים שלא ניתן היה לראות בעין בלתי מזויינת ואף מסוגלות להפוך טקסט שקודם לכן לא היה קריא כלל, לקריא.

The Vercelli Book כתב היד העתיק ביותר שקיים אשר נכתב באנגלית ישנה. תמונה מאת - פרוייקט לאזארוס

The Vercelli Book – כתב היד העתיק ביותר שקיים אשר נכתב באנגלית ישנה. תמונה מאת – פרוייקט לאזארוס

הפיכת החומר לקריא חשובה מכיוון שהיא מאפשרת מיון ומפתוח טובים יותר אשר הופכים את החומר לחפיש ונגיש. כך גם עולה הסיכוי שחוקרים יעשו בחומר שימוש.

  טכנולוגיה זו כבר קיימת ונעשה בה שימוש במוסדות גדולים, אך העלות הגבוהה שלה מביאה לכך שמוסדות קטנים לא יכולים להשתמש בה. כדי לפתור בעיה זו הוקם פרוייקט לאזארוס. הפרויקט מנגיש לספריות ומוסדות קטנים בחו"ל את הטכנולוגיה החדישה והיקרה ביותר של דיגיטציה איכותית של תמונות ומידע. הפרויקט מביא ציוד נייד אל ספריות וארכיונים קטנים ומאפשר להשתמש שם בטכנולוגיה, בלי להוציא את כתבי היד העתיקים מהספרייה. כך, כתבי היד השבריריים והפגיעים נחשפים לכמויות אור מינימליות ואינם נחשפים לאור רב, אשר עלול להזיק להם.

תוכן נגיש – פעילות "דורות", המחלקה היהודית בספרייה הציבורית של ניו יורק

פרויקטים שונים נעשים כדי להפוך את הטקסט לנגיש. לדוגמא, "דורות" – המחלקה היהודית של הספרייה הציבורית של ניו יורק עשתה לאחרונה דיגיטציה ל 11 כתבי יד עבריים ושני ספרים במהדורות מוקדמות. המסמכים – אשר נפרשים על פני תקופה של 400 שנה, מימי הביניים המאוחרים ועד  העת החדשה המוקדמת – מכסים נושאים כגון קבלה, ספרות, מחזאות, מדע, רפואה ופרשנות אודות פילוסופיה ואסטרולוגיה. באוסף יותר מ- 2000 דפים המתעדים את הלמדנות היהודית בתקופות עתיקות וניתן לגשת אליהם בגישה חופשית באתר של אוספי הספרייה הציבורית של ניו יורק.

האוסף כולל לדוגמא:

הדיגיטציה של כתבים קדומים היא עוד דרך לשמר ולהנגיש ידע קיים. היכולת לגשת אל כתבים אלו באופן חופשי ומכל מקום בעולם מאפשרת לחוקרים להעמיק את הידע שלהם באמצעות טקסטים ממקור ראשון.

 מאחר שמדובר בטקסטים הקשורים להיסטוריה היהודית, עותקים דיגיטליים נשלחו אל הספרייה הלאומית של ישראל ונמצאים עכשיו בספרייה הדיגיטלית הבינלאומית של כתבי יד עבריים.

 

 

ערכה ליצירת ארכיון תוכן ממדיה חברתית

הספריות של אוניברסיטת צפון קרוליינה פיתחו ערכה ליצירת ארכיון של מדיה חברתית. מטרת הערכה לעזור לארגונים של מורשת תרבות ליצור ולפתח אסטרטגיות לאיסוף מידע ממדיה חברתית, לצבור ידע על האופן בו מוסדות אחרים אוספים מידע ברשתות חברתיות, להבין איך חוקרים יכולים להשתמש בתוכן הנאסף מהמדיה החברתית, לנסות ולהעריך מה ההשלכות החוקיות והאתיות של איסוף ואכסון התוכן הנאסף ולפתח טכניקות להעשרת האוספים של תוכן ממדיה חברתית בעלויות מינימליות. הערכה מאגדת כלים לאיסוף מידע מטוויטר ואינסטגרםlogoNCSU

הרעיון מאחורי ערכת הארכיון של המדיה החברתית, כפי שבוטא בהודעה לעיתונות, הוא לאפשר לאסוף מידע בהתבסס על תגים, מיקום, תיעוד וכדומה. מדובר במידע שללא כלים אלו לא ייאסף ולא יקבל ביטוי במחקר. מדיה חברתית הפכה למקום בו אנשים מבטאים רעיונות ומתדיינים על אירועים. דברים שבעבר נעשו בתכתובת פיזית עברו אל המדיה החברתית. שיח אודות אומנות, אקדמיה, אקטיביזם פוליטי, העלאת מודעות ואינטראקציה אישית ומקצועית מתרחשים דרך מדיה חברתית. אלו דברים שיתכן והיסטוריונים ירצו להתייחס אליהם בעתיד. ללא ארכיון המידע יאבד מאחר ובניגוד לנייר, לא ניתן לאסוף אותו רטרואקטיבית.

החל משנת 2014 ועד נובמבר 2015 נאספו 1.2 מיליון ציוצים אשר משויכים למעל 380,000 חשבונות  291a93dטוויטר. בנוסף נאספו 29,000 תמונות ומידע נוסף מאינסטגרם המשויכים לכ-18,000 חשבונות. הספרנים העוסקים בפרויקט מעוניינים לעודד ספריות אחרות להשתמש בכלים ובאוספים לצרכי ארכיון המדיה החברתית של כל ספרייה.  מאחר ומדובר בסוג חדש של אוספים, הרי שאין עדיין פרקטיקות טובות או נכונות ביחס לחופש השימוש באוסף, שאלות אתיות וחוקיות ופרקטיקות אכסון, שימור ואחזור לטווח ארוך שספריות אחרות יוכלו ליישם מיד.

לקריאה נוספת

פורטל בינלאומי לאוצרות תוכן ואוצרות דיגיטלית עלה לאחרונה לאוויר

portal-curפורטל בינלאומי לאוצרות תוכן ואוצרות דיגיטלית עלה לאחרונה לרשת .הפורטל  הוקם על ידי עמי סלנט  שמשמש גם העורך הראשי של המיזם הבינלאומי.

על פי מה שכתוב באתר המטרה לספק מידע מעשי רלוונטי.   מקורות המידע באתר כוללים 3 סוגי עיקריים של תכנים: כלים לאוצרות, דוגמאות ומודלים ומדריכים.

מנוע החיפוש באתר והתגיות מסייעות מאוד בניווט באתר והתוצאות  מוצגות בצורה ויזואלית מזמינה. אפשר להירשם לקבלת עדכונים בדוא"ל  ולהתעדכן גם באמצאות RSS

מדברי עמי סלנט על המיזם:

"הפורטל מבוסס על איסוף , סריקה , סינון ותמצות של סקירות ומחקרים על תחומי אוצרות התוכן בעולם , כלים מתוקשבים בתחומי אוצרות התוכן , מיזמים , ותהליכי עבודה.

הפורטל הבינלאומי לאוצרות תוכן ואוצרות דיגיטלית הוא המאגר השיטתי היחיד מסוגו באינטרנט והוא מבוסס על איסוף שיטתי של סקירות על כלים מתוקשבים , מתודולוגיות לניהול ידע אישי , סקירות השוואתיות והמלצות מומחים ברחבי העולם . "

תודה לעמי סלנט על המידע

לסקירה המלאה של עמי סלנט

לפורטל

Darwin Online – ספריית אונית הוד מלכותו ביגל נוספה לאוסף

biglמסע החקר המדעי   של דרווין באונית הוד מלכותו ביגל שהחל בשנת 1831  מפורסם  בשל תרומתו  לתורת האבולוציה שלו. אין ספק שגם לאוסף הספרים שבאוניה במסע זה  הייתה השפעה על חשיבתו של דרווין

האוסף עבר דיגיטציה  והועלה לאחרונה לאתר   Darwin Online . אוסף זה של האוניה ביגל כולל למעלה מ- 195000 ספרים ו-   5000 איורים.

bhlאוסף נוסף שהפך לאחרונה למקוון הוא הספרייה המדעית האישית של דרווין  שכוללת 1480 ספרים ונגישה דרך  האתר Biodiversity Heritage Library

פרטים נוספים בכתבה בנושא

פרויקט הספרים של גוגל – הקץ למאבק?

google-books   מאז שנת 2004  מתנהל מאבק משפטי בין גוגל , מחברים ומו"לים. המחברים והמו"לים ראו בסריקת הספרים על ידיGoogle  לצורך Google Books הפרה בוטה של זכויות היוצרים. הם מחו כנגד תוכנית הדיגיטיציה של Google, האפשרות הניתנת למשתמשים לראות קטעים מספרים מוגנים בזכויות יוצרים, ושיתוף פעולה עם ספריות ללא הרשאה מפורשת מבעלי זכויות היוצרים על כך.

 במסגרת המאבק המשפטי היו מספר התפתחויות עליהם גם דיווחתי בעבר בבלוג. . באוקטובר 2008  הועלתה    הצעה להסכם פשרה לישוב הסכסוך  בכל הקשור לפרויקט הדיגיטציה של הספרים. ב- 2009  ספרנים, משפטנים, מחברים, מו"לים וחברות טכנולוגיות שהתנגדו  להצעת ההסכם במתכונת שהושגה  חברו יחדיו והקימו את – Open Book Alliance ששם לו למטרה לידע את עושי המדיניות והציבור בדבר היבטיה השונים של ההצעה להסכם הפשרה.

 בסופו של דבר ב-14 בנובמבר 2013  גוגל נחל ניצחון כפי שניתן ללמוד ממסמך עליו חתום השופט Denny Chin    .  ממסמך זה עולה   שבית המשפט מכיר  בסריקת הספרים תוך שיתוף פעולה עם ספריות ציבוריות ואקדמיות והצגת קטעים מסוימים מהם שימוש הוגן ומעלה על נס את התועלת המחקרית של הפרויקט.

כפי שמצוין במסמך:

” In my view, Google Books provides significant public benefits. It advances the progress of the arts and sciences, while maintaining respectful consideration for the rights of authors and other creative individuals, and without adversely impacting the rights of copyright holders. It has become an invaluable research tool that permits students, teachers, librarians, and others to more efficiently identify and locate books. It has given scholars the ability, for the first time, to conduct full-text searches of tens of millions of books. It preserves books, in particular out-of-print and old books that have been forgotten in the bowels of libraries, and it gives them new life. It facilitates access to books for print-disabled and remote or underserved populations. It generates new audiences and creates new sources of income for authors and publishers. Indeed, all society benefits"

במסמך המלא יש  מידע מקיף על הפרויקט, עובדות, השתלשלות העניינים  והתועלת  של הפרויקט. נקודות עיקריות שצוינו בהקשר זה:  פרויקט הספרים של גוגל הוא כלי יעץ חשוב, מקדם ומאפשר כריית טקסט, מרחיב את אפשרות הגישה לספרים, תורם לשימור ספרים והפחת חיים חדשים בספרים, מסיע למחקר   ועל ידי הסיוע באיתור הספרים מועיל בסופו של דבר גם למחברים ולמו"לים.

נשאלת השאלה האם זה יהיה באמת סופו של המאבק ? 

למסמך בנושא

לכתבה בנושא  

למידע נוסף בנושא – תודה לד"ר רות הנדזל על קישור זה  והפנית תשומת הלב לנושא

פרויקט EOD ורשת EOD – פרויקט ספרני בינלאומי ראוי לשבח לשנת 2013 של ALA

eodפרויקט  EOD      – eBooks on Demand   הוא פרויקט לדיגיטציה  על פי בקשה של ספרים ברשות הציבור. במסגרת פרויקט זה  משתמש בכל רחבי העולם שבוחר בספר שנמצא בסטטוס של רשות הציבור כלומר שלא חל עליו זכויות יוצרים יכול לקבלו בתשלום.  רובם המכריע של הספרים הם ספרים שיצאו לאור בשנים – 1500-1900. אפשר לקבל את הספרים כקובץ pdf וכתדפיס נייר של הספר.. ולמי שמעוניין רק בתדפיס נייר של העותק הסרוק ללא העותק האלקטרוני  – אופציה זו קיימת  רק לגבי ספרים שנסרקו כבר קודם ואפשר למצוא אותם גם באתרי אמזון השונים:

   addנכון להיום  30 ספריות מ- 12 מדינות באירופה מציעות שירות זה . אפשר להזמין את הספרים ישירות  ממנוע החיפוש  של השירות או מהקטלוגים של הספריות המשתתפות.  מבחינת הספריות המשתתפות בפרויקט – יש לציין שהעלות של הספרים למשתמש מכסה רק את תהליך הדיגיטציה עצמו  ולא עלויות נוספות כגון: עלויות ציוד ורישיונות תוכנה  . הספרים הסרוקים שייכים לספריות וניתנים לשילוב במאגר המוסדי של הספריות. רשת ה- EOD     משמשת כגוף מייעץ בכל הקשור לדיגיטציה כגון:  עלות  וסטנדרטים . ההשתתפות של הספריות ברשת כרוכה בתשלום מסוים תמורת תחזוקת  שרתים, רישיונות תוכנה  וכו'  

חשיבותו של הפרויקט הוא בהנגשת מיליוני ספרים שנמצאים בספריות באירופה  לציבור ברחבי העולם כולו. בשל חשיבותו,  הפרויקט זכה לצד שני פרויקטים נוספים, בפרס  פרויקטים ספרניים בינלאומיים ראויים לשבח של ALA. הציון לשבח יוענק ביולי 2013.

להודעה על הזכייה

לאתר  הפרויקט

Portico – למעלה מ- 90 הוצאות לאור אוניברסיטאיות משתמשות בשירותי portico לשימור ספרים דיגיטליים

portico2בזמנו כתבתי פוסט על בעיית הארכוב והשימור של אוספים אלקטרוניים ועל  השירות של Portico    בתחום זה.

עם הגידול באוספים האלקטרוניים מתעוררות שתי בעיות עיקריות:
א. בעיית ה- Perpetual access – כיצד להבטיח גישה קבועה לארכיב. בעוד שבמדיה המודפסת יש לנו תמיד גישה לארכיב של החומרים עליהם היינו מנויים הרי במדיה האלקטרונית הדבר אינו מובן מאליו. כך למשל, במקרה של ביטול מנוי לכתב-עת אלקטרוני מסוים קיים חשש שלא תהיה עוד גישה לגיליונות קודמים של כתב העת, עליהם היינו מנויים.

ב. בעיית ה- Long-term Preservation – כיצד להבטיח את הגישה לחומרים האלקטרוניים לדורות הבאים. במדיה האלקטרונית שינויים טכנולוגיים עלולים ליצור מצב שקבצים בפורמטים שונים שקריאים היום, עקב שינויים טכנולוגיים לא יהיו קריאים בעתיד

Portico מספק  שירות ארכיב (dark archive) קבוע של צד שלישי לכתבי עת, ספרים ושאר חומרים דיגיטליים.

במסגרת שירות זה  מתאפשרת גישה קבועה לארכיב רק בעת הצורך והדגש הוא על שימור לטווח רחוק. מבחינה טכנית על פי פתרון זה נשמרים בארכיב הקבצים המקוריים doc, xml – וכו' ופעולות הקשורות לשימור לטווח רחוק כגון הגירת קבצים בטוחה.

בזמנו בעת כתיבת הפוסט מספר המו"לים שהשתמשו בשירות זה היה קטן. כיום מספר המו"לים שמשתמשים בשירות גדל. על פי מה שנכתב באתר למעלה מ- 90 הוצאות לאור אוניברסיטאיות ב- 6 מדינות משתמשו בשירותי השימור של Portico  ביניהן ההוצאה לאור של אוניברסיטת קיימברידג', Books at JSTOR,   UPCC Collections, וההוצאה לאור של אוניברסיטת אוקספורד.

הספריות  הולכות בעקבות ההוצאות לאור ולמעלה משני שליש ספריות אוניברסיטאיות במוסדות של ההוצאות לאור האוניברסיטאיות שמשתמשות בשירותי Portico  משתמשות אף הן בשירותים אלו.

שירות שימור  הספרים האלקטרוניים של Portico כולל למעלה מ- 170000 כותרים מיועדים לשימור. באתר מפורטים המקרים שמשמשים כטריגר לגישה  לחומרים.כאשר מתקיים טריגר  לגישה לספרים האלקטרוניים הם נגישים לכלל השותפים בשירות שימור הספרים.

למידע נוסף בנושא

אוניברסיטת קורנל – הארכיון הגדול של קולות בטבע פתוח לציבור

birdsספריית  Macaulay  שבמעבדה לאוֹרְנִיתוֹלוֹגְיָה (חקר העופות) באוניברסיטת קורנל  הודיעה ב-17 לינואר 2013 על השלמת הדיגיטציה של ארכיון ההקלטות האנלוגיות של קולות בטבע  שלה . האוסף  מאז 1929  נמצא היום בפורמט דיגיטלי בפורמט של קובצי אודיו ווידאו ופתוח כולו לציבור הרחב  בכתובת:  www.MacaulayLibrary.org . כבר ב- 2006  האוסף נפתח לציבור הרחב  . מאז האוסף גדל והוא כולל היום 150000 הקלטות אודיו של כ- 9000 מינים. הדגש הוא על קולות של ציפורים אבל הוא כולל גם קולות של פילים, צפרדעים, לויתנים, פרימטים  ועוד.

 האוסף הוא אוסף מחקרי ומהווה מקור טוב  למחקר הוראה  ולמידה על התנהגות בעלי חיים. עתה  לאחר השלמת הדיגיטציה של אוסף ההקלטות האנלוגיות  הדגש הוא על הוספת חומרים חדשים לאוסף מחובבנים ואנשי מקצוע ברחבי העולם .

sounds2 באתר יש מנוע חיפוש בו  אפשר לחפש הקלטות של קולות על פי מינים. הכוונה היא  לפתח בעתיד  את יכולות החיפוש באתר ולפתח גם כלים שיאפשרו העלאת חומרים ישירות לארכיון .

 לאתר  

WebCite ושימור מקורות אינטרנט אקדמיים

webciteמחברים פעמים רבות מצטטים אתרי ווב ואובייקטים דיגטליים אחרים, שיכולים להיעלם בן לילה.

על פי מחקר שפורסם בכתב העת Science   שלושה עשר אחוזים  מאתרי האינטרנט שצוטטו  במאמרים אקדמיים לא פעילים  כעבור 27 חודשים.

בעיה נוספת היא שהאתרים המצוטטים יכולים להשתנות , כך שהקוראים יכולים לראות תכנים שונים מאלה שהמחבר המצטט ראה.

kadurWebCite  שחברה ב- International Internet Preservation Consortium  באה לתת מענה למצב. WebCite  הינה מערכת לאירכוב  אתרים ודפי ווב או אובייקטים נוספים שנגישים בווב . המערכת מאפשרת למחברים, עורכים מולים של מאמרים מדעיים וספרים ושאר משתמשים להבטיח שחומרי הווב שצוטטו יישארו  בעתיד כמות שהם לקוראים.  היא מספקת כתובת משלה לחומרים שבארכיב , כתובת אותה אפשר להוסיף לפריט המידע  המצוטט . באופן זה הקורא יוכל תמיד להגיע למאמר אליו התכוון המחבר.  

כיום מספר גדל והולך של מו"לים מבקשים מהמחברים כאשר הם מצטטים אתר ווב  לשמור את ה- URL    שלו במערכת כמו WebCite   כדי לאפשר לקוראים גישה ישירה לחומר המצוטט.

לכאורה מבחינות מסוימות ובעיקר התוצאה השירות דומה ל- internet archive אבל בשונה ממנו Webcite   הוא כלי שנועד במיוחד למחברים, קוראים , עורכים ומולים של חומר מדעי לשמר "on   demand  " באופן קבוע ציטוטים של מקורות אינטרנט ואקדמיים במיוחד.  ב- 2005  כתב עת ראשון הודיע על שימוש ב- WebCite באופן קבוע . היום כ- 100 כתבי עת משתמשים בו על בסיס קבוע.

לאתר

יוזמה חדשה של NLM – שימור בלוגים בנושאי בריאות ורפואה ותכנים אחרים בווב

NLM   –  הספרייה הלאומית בארה"ב  שמה לה כיעד לאסוף, לשמר ולהנגיש ספרות ביורפואית. nlmעד כה היא עשתה זאת עם מידע ומאגרי מידע שלה. 

 לאחרונה  היא נקטה ביוזמה חדשה שימור תכנים רלוונטיים  בווב של אחרים. במסגרת יוזמה זו היא משמרת בלוגים וחומרים נוספים בנושאי בריאות ורפואה  שמיצגים פרספקטיבות שונות   – של רופאים, אחיות, אדמיניסטרטורים בבתי חולים, חולים   ועוד.

האוסף כולל בין היתר גם   מידע על התנסותם והתמודדותם של חולים במחלות כגון:  סרטן , סכרת ודלקת מפרקים.  

עם השקתה של יוזמה זו NLM   מצטרפת ליוזמה של  Internet Archive  משנת 1996 וליוזמות אחרות שבאו אחריה  של ספריות לאומיות ציבוריות  ואחרות שהכירו בחשיבות שימור התכנים של הווב לעתיד ותרמו לפיתוח כלים טכניקות וסטנדרטים שאפשרו יצירת ארכיבים.

 NLM   נשכרה מניסיונות אלה ומניסיונם של שותפים מקומיים כגון ספריית הקונגרס שמעורבת באופן פעיל באיסוף ושימו תכנים מהווב 

 נכון להיום האוסף כולל 12 בלוגים ו-  NLM      תמשיך במאמציה לאסוף תכנים  עכשוויים בנושאי רפואה ובריאות מהווב  למען  התועלת  המחקרית  בעתיד. באתר יש קישורים לכל אחד מהבלוגים ויש אפשרות לחפש חיפוש בסיסי בכל האוסף. החיפוש כולל חיפוש במידע על ובטקסט המלא. האוסף היום "יושב"  ב- Internet Archive  אך בעתיד NLM  מתכוונת לשמרו באוספים הדיגיטליים שלה.

 לאוסף

למידע נוסף

גוגל ושימור המורשת – פרויקט הדיגיטציה של מגילות ים המלח – מגילות ים המלח נגישות בצורה מקוונת

scroll2ביום שני 26 בספטמבר 2011 עלו לרשת חמש מגילות ים המלח במסגרת פרויקט דיגיטציה משותף של מוזיאון ישראל וחברת גוגל. חמש המגילות:
Great Isaiah Scroll, Temple Scroll, War Scroll , Community Rule Scroll, Commentary on the Habakkuk Scroll
חושפות את המשתמש לחיי החברה היהודית בישראל בתקופת הבית השני והן הראשונות במסגרת פרויקט דיגיטציה זה. .

באתר החדש של הפרויקט אפשר לראות את המגילות ברזולוציה גבוהה, לקרוא ולצפות בסרטוני וידאו שכוללים הסבר ורקע היסטורי של המגילות.

מן הראוי לציין שאין זה הפרויקט היחידי למען שימור המורשת והנגשתה דרך הרשת, בו שותפה חברת גוגל. פרויקט נוסף שעליו כתבתי בפוסט קודם הוא אוסף יד ושם. על פרויקטים נוספים ברוח זו שבהם מעורבת חברת גוגל , מטרתם והחזון אפשר ללמוד מדברי פרופ' יוסי מטיאס מנהל מרכז המחקר והפיתוח של גוגל בישראל

"The Dead Sea Scrolls Project with the Israel Museum enriches and preserves an important part of world heritage by making it accessible to all on the internet,Having been involved in similar projects in the past, including the Google Art Project, Yad Vashem Holocaust Collection, and the Prado Museum in Madrid, we have seen how people around the world can enhance their knowledge and understanding of key historical events by accessing documents and collections online. We hope one day to make all existing knowledge in historical archives and collections available to all, including putting additional Dead Sea Scroll documents online." 

פורטיקו ואוניברסיטת קורנל – דו"ח בנושא שימור ספרים דיגיטליים ותכנים דיגיטליים אחרים

preservationלספריות רבות בעולם יש היום תוכניות דיגיטציה . כך למשל סקר שערך OCLC בשנת 2010 בקרב 169 מוסדות על האוספים המיוחדים שלהם מצא של- 97% מהן יש פרויקט דיגיטציה כלשהו . דיגיטציה נקשרת תמיד עם שימור שכן חומר דיגיטלי "שביר" יותר מאשר חומר פיזי . שלא כמו חומרים פיזיים – ספרים, כתבי יד או מכתבים שבתנאים סבירים עמידים לאורך זמן , אובייקטים דיגיטליים יהיו בעלי תוחלת חיים קצרה ללא שימור אינטנסיבי. לכן מבינים היום שפעולת דיגיטציה חייבת להיות משולבת עם שימור.

שימור דיגיטלי כולל סדרה של מדיניות ופעולות שחיוניות לאבטחת השימושיות , האוטנטיות הנגישות והגילוי של תכנים לאורך זמן.

מתוך רצון לענות על צורכי השימור פותח מודל לשימור ספרים דיגיטליים ותכנים דיגיטליים נוספים במוסדות למורשת תרבותית. המודל פותח  על סמך הניסיון של פורטיקו בשיתוף עם אוניברסיטת קורנל , סקרים ודיונים של פורטיקו עם מוסדות למורשת תרבותית ועוד. 

המודל מתואר בנייר עבודה בן 72 עמודים שפורסם במרץ 2011 על ידי פורטיקו ואוניברסיטת קורנל והוא מושתת על 6 שלבים עיקריים – תכנון השימור, ניהול התכנים לפני כניסתם לארכיון, הפקדת החומר בארכיון, ניהול הארכיון, עדכון והגירה , ויצוא התכנים למשתמש

אחת ההחלטות החשובות במסגרת מודל זה היא מה יהיה המבנה הארגוני בו ישמרו התכנים – האם לשמר את החומרים באופן עצמאי, האם לשתף פעולה עם גופים אחרים,תוך שימוש בפלטפורמות כגון: DSpace או LOCKSS, או למסור את השימור לצד שלישי כמו Portico, HathiTrust או JSTOR.

המסמך מכיל מידע רב בהקשר לשלבי המודל השונים, ההחלטות והמדיניות כולל נושאים כגון: מידע –על , פורמטים של התכנים, זכויות, עלויות ועוד.. ויש בו כדי לענות על המטרה המוצהרת שלו – לסייע לקהילת הספריות והספרנים להבין טוב יותר את צורכי השימור של ספרים אלקטרוניים ושאר אובייקטים דיגיטליים.

תודה למנהלת הספרייה , מירה ליפשטיין על העדכון

 

 

גישה חופשית לאוספים של אוניברסיטת ייל

yal2ב-10 למאי 2011 אוניברסיטת ייל הצהירה על מדיניות " גישה פתוחה" לאוספים שלה. במסגרת מדיניות זו חוקרים, אמנים ומשתמשים מרחבי העולם יוכלו ליהנות מגישה חופשית לתמונות מקוונות של מיליוני אובייקטים שנמצאים במוזיאונים, בארכיבים ובספריות של אוניברסיטת ייל.

כאשר יושלם תהליך הדיגיטציה של אוספים אלו , הספריות והמוזיאונים יאפשרו גישה חופשית לתמונות שהם בדומיין ציבורי. כיום כבר יש גישה ליותר מ- 250000 תמונות של אובייקטים דרך קטלוג מאוחד חדש.

בקטלוג זה אפשר לדפדף על פי מספר קטגוריות: מוסד, אוספים, נושאים, אזורים ולחפש בחיפוש בסיסי ומתקדם עם אופציה להגביל את החיפוש על פי כותר, יוצר, מלות מפתח ונושא , גישה פתוחה, מוסד, אוספים ועוד. כמו כן אפשר למיין את התוצאות על פי רלוונטיות, כותר ועדכניות הפריט.

פרויקט זה שוב מדגיש את תרומתה של מדיניות הגישה הפתוחה והפעם למען גיוס פוטנציאל של טכנולוגיות לצורך למידה , שימוש יצירתי ושימוש חוזר במורשת התרבותית העשירה. 

להצהרה

לקטלוג המאוחד החדש

למצגת שקופיות

פרויקט הדיגיטציה של האנציקלופדיה לחלוצי היישוב מאת דוד תדהר

encספריות באוניברסיטת טורו בניו-יורק בשיתוף עם משפחתו של דוד תדהר , סיימו לאחרונה פרויקט של סריקת האנציקלופדיה לחלוצי הישוב מאת דוד תדהר (19 כרכים במקור) והעלאתה לאינטרנט.

המידע פתוח לצבור הרחב.

 האנציקלופדיה היא מקור ביוגרפי חשוב וכוללת מידע על כ- 6000 אישים . אפשר לדפדף על פי רשימה אלפביתית של האישים ועל פי כרך ואפשר גם לחפש באתר.

תודה לחוה רמברנד
ספרנית המכללה האקדמית עמק יזרעאל ע"ש מקס שטרן על המידע

לאתר

שימור דיגיטלי – המלצות

report2בשנת 2009 DPC , ULCC ו- PORTICO ערכו ניתוח של תוכנית הדיגיטציה של JISC , במסגרתו נבחנו 16 פרויקטים של JISC בתחום השימור.

תוצאותיו של ניתוח זה כלולות בדו"ח שמשתרע על פני 65 עמודים. הדו"ח כולל בין היתר המלצות ל- JISC – המלצות שיכולות להיות יישומיות לפרויקטים אחרים בתחום השימור

ההמלצות כוללות המלצות למוסדות ולפרויקטים, ולמממנים.
בין ההמלצות למוסדות ולפרויקטים :
• כתיבת מדיניות שימור לכל אחד מהפרויקטים – המדיניות צריכה לכלול מידע אילו תכנים יישמרו, מי אחראי לשימור הקבצים, מידע על מקורות המימון לשימור וכיצד תבחן הצלחת השימור 
• הגדרה של האוסף והתהליכים לניהול התוכן – תוך התייחסות לייצור האוסף, תחזוקתו והעתקתו ומידע העל שלו מפלטפורמות שונות
• שימור התכנים בתשתית מתאימה לשימור דיגיטלי – הרבה מוסדות אינם יכולים לתמוך לבדם בשימור לטווח ארוך. מוסדות חייבים לשקול שיתוף פעולה או שימוש בשירותיו של צד שלישי. חייבים להתייחס לאופן בו יעברו התכנים משירות אחד לאחר במשך הזמן
• הגדרת אופן התחזוקה של האוסף לאורך זמן – מוסדות חייבים להכיר בעובדה שכדי לשמר אוספים דיגיטליים יש לדאוג לתחזוקה שוטפת ולמחויבות פיננסית ברורה לתמיכה בתחזוקה זו
• הכרה בעובדה שהסכמה למימון לדיגיטציה כרוכה במחויבות המוסד בטווח רחוק מעבר לתקופת המימון – מימון קצר טווח כרוך במחויבות ארוכת טווח של המוסד לאספקת גישה, ניהול והפקת תועלת מהתכנים

ללא יישום ההמלצות שלעיל השימושיות והגישה לאוסף הדיגיטלי הוא בסכנה.

פרטים נוספים בדו" ח המלא