מדעי הרוח הדיגיטליים בספרייה המרכזית – סדנת קריאה רחוקה

החל משנת הלימודים תשפ"ב (22-21) מועברות בספרייה המרכזית ע"ש סוראסקי סדנאות בנושאים שונים מתחום מדעי הרוח הדיגיטליים. סדנאות אלו נועדו להקנות לתלמידים ולחברי הסגל הכרות ראשונית עם כלים מרכזיים בתחום דרך תרגול מעשי בתנאי מעבדה. הסדנה הראשונה, שהתקיימה בדצמבר 2021, הוקדשה להכרות עם תחום ה-GIS. את הסדנה השנייה, שהתקיימה במאי 2022, ייחדנו לעולם הקריאה הרחוקה (Distant Reading).

מקובל לייחס את המונח "קריאה רחוקה" למאמרו של פרופ' פרנקו מורטי "השערות על ספרות העולם" (2000). בניגוד לגישה המסורתית לניתוח טקסטואלי, דהיינו קריאה קרובה של מספר מצומצם של טקסטים, מורטי הציע מסגרת אחרת לדיון בקורפוס עצום ממדים כספרות העולם: התמקדות ביחידות שהן קטנות בהרבה או גדולות בהרבה מן הטקסט עצמו (תחבולות, תמות, ז'אנרים) ללא קריאה ישירה של הטקסט, קריאה שבה המרחק הוא תנאי לידע. רק באמצעות התבוננות מרחוק בקורפוס גדול של יצירות ספרותיות, כתב מורטי, נוכל להבין מערכות מורכבות כספרות העולם.

במקור, מורטי כלל לא התייחס במאמרו לטכנולוגיה מבוססת מחשב. יחד עם זאת, במרוצת השנים הפך המונח שטבע לזהה למחקר טקסטואלי בכלים חישוביים. כלים מסוג זה מאפשרים ניתוח אוטומטי של טקסטים (לדוגמה, יצירת קונקורדנציה או איתור דפוסים לשוניים חוזרים). בנוסף לממד האוטומטי, כלים אלו מאפשרים לשלב באנליזה גם היבטים פרשניים, וזאת באמצעות תיוג וסימון ידני של הטקסט. כך, למעשה, מתאפשרת תנועה בין צורת שונות של ניתוח טקסטואלי, אוטומטי וידני.

בסדנה שהועברה בחודש מאי התנסינו בשימוש בשני כלים:

  1. AntConc: תוכנה חופשית למחקר חישובי של טקסטים שפותחה ע"י פרופ' לורנס אנטוני מאוניברסיטת וואסדה, יפן. אל תוכנה זו הטענו קורפוס של כ-400 ביקורות סרטים בשפה האנגלית מן האתר IMDB, אותו ניתחנו בעזרת המודלים השונים של התוכנה: חיפוש מילות מפתח ותצוגתן בהקשר, היקרותן של מילים, יצירת קונקורדנציה והשוואה בין קורפוסים. ניתוח זה אפשר לנו לאתר דפוסים לשונים חוזרים, תבניות, וצירופי מילים בקורפוס.
  2. CATMA: תוכנה חופשית לניתוח אוטומטי ממוחשב ותיוג חופשי של טקסטים מאוניברסיטת המבורג, גרמניה. בניגוד ל-Antconc, שמאפשרת אך ורק ניתוח אוטומטי ממוחשב של טקסטים, תוכנה זו מאפשרת לשלב בין ניתוח אוטומטי לניתוח ידני של טקסט. אל התוכנה הטענו את הסיפור "העוורת" מאת יעקב שטיינברג, אותו המשתתפים הורידו מפרויקט בן-יהודה. בחלק זה של הסדנה התנסינו בוויזואליזציה של הטקסט בעזרת המודל הוויזואלי של התוכנה, וייצרנו גרפים מסוגים שונים: תפוצה, עץ כפול וענן מילים. לאחר מכן ייצרנו ספריית תגים, תגים, תתי-תגים ואף תייגנו את הטקסט עצמו, כל זאת בעזרת מערכת התגים המשוכללת של CATMA.

בסדנה, שנמשכה ארבע שעות, השתתפו שלושה עשר תלמידים לתארים מתקדמים וחברי סגל מהפקולטות למדעי הרוח והאומנויות. בקישור המצוי בתחתית פסקה זו תוכלו לעיין בחוברת העבודה שחיברנו עבורה. במדור הדרכה וייעץ נשמח לסייע פרטנית לתלמידים וחברי סגל המעוניינים להכיר לעומק את עולם הקריאה הרחוקה כדי לשלבו במחקרם.

חומרי הסדנה:

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *