ארכיון המדינה מתכנן לפרסם מאות מיליוני מסמכים בעזרת בינה מלאכותית

הטכנולוגיה נועדה לאתר מידע מסווג, ותאפשר לארכיון לעבור על מסמכים במהירות שהיתה דורשת אלפי שנות עבודה. המידע יועבר למומחים שיקבעו אם ניתן לפרסמו

עופר אדרת
עופר אדרת
שתפו כתבה במיילשתפו כתבה במייל
שתפו כתבה במיילשתפו כתבה במייל
מעבר לטוקבקים
סריקת מסמכים של ארכיון המדינה במפעל בפתח תקוה, ב-2018
סריקת מסמכים של ארכיון המדינה במפעל בפתח תקוה, ב-2018צילום: דודו בכר
עופר אדרת
עופר אדרת

ארכיון המדינה ישתמש בטכנולוגיית בינה מלאכותית כדי לאתר מידע מסווג במסמכיו. המידע יועבר למומחים, שיקבעו אם ניתן לפרסמו. גנזת המדינה, רותי אברמוביץ, אמרה היום (רביעי) כי התוכנית תאפשר לארכיון לחסוך אלפי שנות עבודה, שדרושות לו כדי לחשוף לציבור את המסמכים השמורים בו.

ביום העיון השנתי של האיגוד הישראלי לארכיונאות ולמידע חשפה אברמוביץ את התוכנית של הארכיון להמשך המהפכה הדיגיטלית בה החל קודמה בתפקיד, ד"ר יעקב לזוביק. במסגרת המהפכה, נסרקים בשנים האחרונות מאות מיליוני מסמכי הארכיון, ועוברים מהדפים אל צג המחשב. ואולם, גם לאחר סריקתם הארכיון לא יכול להנגישם לציבור באופן מיידי, משום שחלקם מכילים חומרים מסווגים, אשר נדרש לבחון אותם בטרם הפרסום.

"חקרנו את השוק, בדקנו מה החברות הטכנולוגיות יודעות לתת ומצאנו כי השיטה הנכונה ביותר (להנגיש את חומרי הארכיון לציבור, ע"א) היא בינה מלאכותית", אמרה אברמוביץ. לפי התוכנית, מערכת ממוחשבת של בינה מלאכותית, ש"מדברת" עברית, תקרא בעצמה את מאות מיליוני המסמכים השמורים בארכיון כיום - משימה שכוח האדם המוגבל שעומד לטובת הארכיון כיום אינו יכול לעשות בעצמו - ותדע לאתר בהם מידע מסווג ביטחונית או מידע רגיש מבחינת צנעת הפרט, אשר מונע את חשיפת המסמכים כיום. המידע הזה יועבר לעיון של מומחים, אשר יקבעו אם ניתן לחשוף אותו ובאילו תנאים. אנשי ארכיון המדינה "ילמדו" את המערכת את רזי המקצוע והיא "תעשה את החשיפה במקומנו", כדברי אברמוביץ.

מסמכי ארכיון המדינה, ב-2016
מסמכי ארכיון המדינה, ב-2016צילום: עופר אדרת

בימים אלה ארכיון המדינה נמצא במגעים עם עשר חברות פוטנציאליות, לקראת הוצאת מכרז בנושא. אברמוביץ מסרה עוד, כי בעולם קיימים ארכיונים לאומיים שמשתמשים במערכות בינה מלאכותית לחשיפת חומרים, אך הדבר מתבצע בהיקף קטן ומצומצם. "אנחנו רוצים לעשות שימוש טוטאלי במערכת, ומקווים להיות אורים ותומים בינלאומיים לפרויקט הזה", אמרה. בינה מלאכותית היא מושג רחב, המתייחס לכלים, שיטות ודרכים המאפשרות להעניק למחשב יכולות הדומות לאלו של בני אדם ובכללם למידה. 

אברמוביץ התייחסה גם לאתגר נוסף שמעמיד העידן הדיגיטלי בפני ארכיון המדינה: המסמכים, שבעבר נכתבו והודפסו על ניירות, נוצרים כיום באופן דיגיטלי באמצעות אימיילים, ווטסאפ ותוכנות מחשב, וכלל לא מגיעים לנייר. לדבריה, ארכיון המדינה עדיין מחפש את הטכנולוגיה שתאפשר לו לקלוט את התוצרים הדיגיטליים האלה, חרף העובדה שכבר כמה עשורים שמשרדי הממשלה מפיקים תוצרים דיגיטליים שאינם על הנייר. "רק השנה התחלנו לקלוט חומר דיגיטלי. המערכות שלנו לא כל כך יודעות איך לעשות את זה. אנחנו מנסים להבין איך עושים את זה", אמרה. 

לדבריה, ללא בינה מלאכותית יהיה בלתי אפשרי להשתלט על כמות החומר שיספק העידן הדיגיטלי לארכיון - כמות גדולה פי כמה בהשוואה למסמכי הנייר. עם זאת ציינה אברמוביץ, כי בעידן הנוכחי, שבו החומרים הם דיגיטליים, יש אפשרות לשמור את הכל, "כולל הכל". זאת, בניגוד למצב הנוכחי, בו חלק מהחומר מושמד, מפני שאין בו צורך או עניין. "ייפתח כאן אופק מחקרי עצום ובלתי סופי כמעט", אמרה.

על מנת לקבל מסמכים ארכיוניים, הציבור יכול להיכנס לאתר הארכיון ולהגיש בקשה לסריקת המסמכים על מנת שיוצגו באתר. עם זאת, אברמוביץ הודתה כי הדיגיטציה של הארכיון עדיין לא מאפשרת לחוקרים שימוש מיטבי בו, בין היתר משום שעובר זמן רב מדי בין הבקשה לסריקת החומר, שמגישים המשתמשים מהמחשב הביתי, ועד להעלאתו למחשב.

סריקת מסמכים של ארכיון המדינה במפעל בפתח תקוה, ב-2018
סריקת מסמכים של ארכיון המדינה במפעל בפתח תקוה, ב-2018צילום: דודו בכר

הגנזת גילתה גם כי עשרות אלפי מכלים, המכילים מסמכים ארכיוניים, תקועים בצוואר-בקבוק וטרם הגיעו לארכיון המדינה, משום שאזל בו המקום לאחסן אותם. לדבריה, בשנים הקרובות תחודש התוכנית להקים מחסן חדש לארכיון המדינה, שיאפשר לקלוט את החומרים שמשרדי הממשלה רוצים להפקיד בו אך לא יכולים מסיבה זו.

עוד אמרה אברמוביץ, כי בימים אלה הושלמה הכנתו של "חוק ארכיונים" חדש, שאמור לעדכן את החוק הקיים, המיושן והלא רלוונטי, ולהתאימו לעידן הנוכחי. היא הוסיפה כי אתר האינטרנט של הארכיון, שירד מהאוויר לאחר שנפרץ, כדבריה, יעלה שוב עוד היום.

אברמוביץ הבטיחה כי עד חודש ינואר ייפתח מחדש אולם העיון, שנסגר לפני כשלוש שנים כחלק מהמעבר לעידן הדיגיטלי בארכיון המדינה. מעתה הוא יהיה נגיש רק לחוקרים ולא לציבור הרחב. לדבריה, הרקע להחלטה לפתוח את האולם מחדש היתה המחאה שקמה באקדמיה נגד סגירתו, והחשש של ארכיון המדינה ש"גזרנו על עצמנו גזירת מוות כמעט מוחלטת בכל הקשור לחוקרים חדשים וותיקים". היא הודתה כי בארכיון הבינו כי אילולא היו פותחים מחדש את האולם, החוקרים היו עלולים לוותר מראש על מחקרים אקדמיים שמצריכים שימוש בחומרים שבארכיון המדינה.

תגובות

הזינו שם שיוצג באתר
משלוח תגובה מהווה הסכמה לתנאי השימוש של אתר הארץ