בואו לגלות את עמוד הכתבה החדש שלנו
 

טרם ביצעת אימות לכתובת הדוא"ל שלך. לאימות כתובת הדואל שלך  לחצו כאן

לקרוא ללא הגבלה, רק עם מינוי דיגיטלי בהארץ  

רשימת קריאה

רשימת הקריאה מאפשרת לך לשמור כתבות ולקרוא אותן במועד מאוחר יותר באתר,במובייל או באפליקציה.

לחיצה על כפתור "שמור", בתחילת הכתבה תוסיף את הכתבה לרשימת הקריאה שלך.
לחיצה על "הסר" תסיר את הכתבה מרשימת הקריאה.

מלה אחר מלה: חוקרי האקדמיה מתעדים אלפי שנות שפה עברית

מפעל חסר תקדים של האקדמיה ללשון עוסק בקטלוג של כל מלה שנכתבה במקורות העבריים, ויוצר קונקורדנציית ענק, מהמגילות הגנוזות ועד עגנון

97תגובות

שלשום בבוקר, כשרוב עם ישראל עסק בניקיונות אחרונים לפני החג, מצאה דורית קדרי-דוידוב, עובדת האקדמיה ללשון העברית, את המלה "חמשין" בכתבי י.ח. ברנר. "היה יום שבת בסוף חודש תמוז עם הבל חום קשה מנשוא דמתקרא חמשין", כתב ברנר ב-1911 ברומן "מכאן ומכאן".

קדרי-דוידוב עמלה על אחד השלבים האחרונים של הכנסת כל אלפי המלים ב"מכאן ומכאן" למאגר המלים העצום של המילון ההיסטורי של האקדמיה ללשון. החמשין, שהפכה ל"חמסין", הושאלה מהערבית המדוברת, כפי שמציין ברנר כשהוא כותב "דמתקרא". בדיקה מהירה במאגר הקיים העלתה שהחמשין של ברנר הוא, ככל הידוע, השימוש הכתוב הראשון במלה בעברית.

כך הצטרפה לה המלה חמסין למיליוני המלים שמעובדות באחד הפרויקטים המחקריים הגדולים שיצאו לפועל אי-פעם בישראל - המילון ההיסטורי. כבר 58 שנה נמשך המפעל הזה של האקדמיה ללשון העברית. להערכת נשיא האקדמיה, הפרופסור משה בר אשר, הוא יימשך עוד "חצי דור עד דור" לפחות.

באחרונה רווח מאוד השימוש בדיגיטציה של טקסטים עתיקים, הנסרקים למחשב ומעובדים באמצעותו. אך כאן אין מדובר בדיגיטציה, אלא בעבודה עתירת כוח אדם אנושי, שקורא, מפרש ומפרק מלה אחר מלה כדי ליצור את המפה המדויקת ביותר של השפה העברית. "אנחנו רוצים להגיע למאה אחוז ולא ל-70 אחוז שהמחשב יכול להגיע, ובשביל זה צריך בני אדם. דווקא לפינות החשוכות והמסובכות שהמחשב אינו יכול להגיע אליהן", מסבירה דורית לרר, מרכזת מפעל המילון. המפעל הוא שילוב של עבודת נמלים סיזיפית של קריאה והגהה אין סופית של טקסטים בעברית מכל התקופות עם עבודת בלשנות מדעית של ניתוח המלים.

מטרת הפרויקט המונומנטלי היא ליצור מילון מקיף של ערכים לשוניים ולמפות את כל המלים בעברית באמצעות הקמת מאגר עצום בגודלו מחד גיסא, אך מעובד בדקדקנות מאידך גיסא, של מלים עבריות כתובות. עד היום הוכנסו למאגר יותר מ-20 מיליון מלים מ-7,919 חיבורים. אלא שהמלה חיבור מטעה, שכן חיבור יכול להיות מסכת מהתלמוד שיש בה עשרות אלפי מלים, שיר של כמה שורות ואפילו מטבע עתיק שעליו מלה אחת. בין החיבורים שהוכנסו למאגר אפשר למצוא את המשנה והתלמוד (כבר עם תחילת הפרויקט הוחלט שלא לכלול בו את המקרא, שכן כבר יש לו קונקורדנציות רחבות ויעילות), המגילות הגנוזות, ספרות הגאונים, שירת ימי הביניים ועד ברנר וש"י עגנון. בר אשר כבר מזכיר את חיים באר, א.ב. יהושע ועמוס עוז ככותבים שגם מלותיהם יצטרפו למאגר בבוא היום. יוצא אם כך שהמקור הקדום ביותר במאגר הוא המגילות הגנוזות, והחדש ביותר - עגנון.

עשו לנו לייק בפייסבוק וקבלו את מיטב הכתבות ישירות אליכם

כל טקסט שנכנס למאגר עובר עיבוד קפדני שכולל שני שלבים: קריאה והזנה למחשב, וניתוח המלים על פי המשמעות, השורש והמבנה. על פי חוקי המילון, כל שלב נעשה על ידי שלושה אנשים, כך שהטקסט נקרא לכל הפחות שש פעמים לפני שהוא זוכה להיכנס למאגר. התוצאה היא מעין קונקורדנציית-על לשפה העברית על כל רובדיה. "כך אתה יכול לקחת כל מלה, לדעת מה הגיל שלה, איך היא מתגלגלת לאורך השנים ואילו משמעויות היא מקבלת. הערך של המילון הוא לא רק כמילון, אלא כבסיס למחקר גם של דברים לא מילוניים", מסביר הד"ר חיים כהן, העורך הנוכחי של המילון, והשלישי מאז היווסדו.

בשלב הבא והסופי נכתבים הערכים המילוניים כמלים. המפעל הזה, כאמור, לא יגיע לסופו בשנים הקרובות - אם בכלל - אך בעוד כמה חודשים, ובתנאי שיימצא לכך המימון החסר, יוכל הציבור הרחב להשתמש במאגר באמצעות אתר אינטרנט מחודש. עד היום כלל המאגר את הספרות העתיקה בלבד (זו שנכתבה עד לשנת 1050), והיה פתוח לחוקרים ולמנויים בלבד.

החזון השאפתני של יוזמי המילון חייב החלטות קשות בשאלה אילו טקסטים ייכללו בו ואילו יישארו בחוץ. בנוגע לטקסטים העבריים שנכתבו עד ל-1050 אין התלבטות, כולם נכנסים למאגר. הכוונה אינה רק לספרות הקודש, אלא גם לאיגרות, מגילות גנוזות, כתובות על גבי חרסים ואפילו מלים שהוטבעו על מטבעות עתיקים עד למאה ה-11. יוזמי המילון גם אינם מסתפקים במהדורות המדעיות או המוכרות של הספרים, אלא מחפשים את המהדורה המוקדמת ביותר והמהימנה ביותר של הטקסט. כך, למשל, הראל וחבריה למדור ספרות גאונים קוראים את הטקסטים של הגניזה הקהירית אות אחר אות בטקסטים שבורים ומחוקים מתוך תצלומים של הקלף המקורי, וגם את התלמוד הבבלי קראו מתוך כתבי יד עתיקים.

דוגמאות לפעילות מפעל המילון ההיסטורי
שונות

ד"ר יחיאל קארה, מוותיקי העובדים במפעל, מצליח לשחזר מלים גם במקומות שקוראי עברית מהשורה רואים בהם רק כתמים של דיו. "כאן כתוב "בירושלים", אתה רואה את שלושת השברים של השי"נים? אם ,סתכל טוב, הגרש הזה הוא המ"ם", הוא שואל בהצביעו על טקסט מאיגרת מגניזת קהיר בסביבות שנת 1055, שבו נכתב: "מוטב לאכול בצל בירושלים ולא תרנגול במצרים".

הבעיה מתחילה אחרי 1050. אז החלה השפה מתרחבת, ולא ניתן להכניס את כל הטקסטים שנכתבו בעברית למאגר. מאז ועד ימינו נכתבו להערכת פרופסור בר אשר בין חצי מיליארד למיליארד מלים בעברית. הכלל הקובע הוא מידת ההשפעה של הטקסט על הטקסטים העבריים שבאו אחריו ואם הטקסט פותח צוהר למלים עבריות ייחודיות, כמו למשל ספרות מדעית מימי הביניים.

ב-1969 הוקם המדור לספרות חדשה במילון. המדור מעלה ומנתח טקסטים מ-1750 ואילך. 600 חיבורים נבחרו להיכנס למאגר ובהם מלותיהם של ביאליק, עגנון, אחד העם וז'בוטינסקי הוכנסו. כך נוצר מעין פער של 700 שנה בין 1050 ל-1750 ועתה משקיעים אנשי המילון מאמץ בסגירת הפער.

30 עובדים, רובם לא במשרות מלאות, מועסקים במילון ההיסטורי שתקציבו השנתי כחמישה מיליוני שקלים בלבד. 40% מהעובדים הם דווקא לא דוברי עברית כשפת אם. נטלי אקון, למשל, ילידת מרוקו ששפת אמה היא צרפתית, מתמחה בקריאה ובעיבוד של טקסטים עבריים שתורגמו מצרפתית. בטקסט "מסתרי פריס" של הסופר הצרפתי אז'ן סי, שתורגם על ידי קלמן שולמאן, היא איתרה את המלה "סיטע", שפרושה עיר. "אבל אני יודע שבתקופה הזו המלה הצרפתית לובשת מטען תרבותי - זו עיר שיש בה פושעים", מסבירה אוקון.

בדרכם הזהירה מבקשים אנשי האקדמיה שלא להקדים להסיק מסקנות על המילון, גם אחרי 50 שנות עבודה. למרות זאת קובע העורך כהן כי "אין עברית חדשה בלי עברית עתיקה. העברית שלנו בעצם מיוסדת על העברית העתיקה". במסך המחשב שמאחוריו נראה הביטוי התלמודי "מאי אכפת לך". אי אפשר שלא לחשוב על גלגולו ל"מה כפת'ך" של ימינו. "אם תיקח את שירת דבורה, שנחשב לאחד הפרקים הקדומים בתנ"ך, ואת עיתון ‘הארץ' מהבוקר, אני יכול להזין את שניהם למאגר ולהשתמש באותה מערכת קודים כדי לנתח אותם", מוסיף דורון רובינשטיין, מרכז המדור לספרות החדשה.



תגובות

דלג על התגובות

בשליחת תגובה זו הנני מצהיר שאני מסכים/מסכימה עם תנאי השימוש של אתר הארץ

סדר את התגובות
*#
בואו לגלות את עמוד הכתבה החדש שלנו