בונים את ספריית אלכסנדריה של העידן הדיגיטלי

למרות האמונה שהאינטרנט זוכר הכל, יש החוששים שבתוך השטף האינסופי של המידע אנו מאבדים הרבה. הספריה הפתוחה מנסה לוודא שלפחות לספרים זה לא יקרה

אקונומיסט
שתפו כתבה במיילשתפו כתבה במייל
שתפו כתבה במיילשתפו כתבה במייל
מעבר לטוקבקים
אקונומיסט

לא קל למצוא דפים משחר ההיסטוריה של האינטרנט. דף הבית הראשון של האקונומיסט למשל, נבנה על-ידי כתב העיתון בקליפורניה ועלה לאוויר במארס 1994. כעבור 18 חודשים, האתר שודרג, ומסד הנתונים הועבר למערכת שבאנגליה. כתוצאה מהשינוי, אבדו לצמיתות נתוני האתר המקורי. אז למרות הדעה השגורה שהאינטרנט זוכר הכל, מסתבר שהוא לא.

לא נשתמרו אפילו צילומי מסך המתעדים את אתר האינטרנט הראשון בהיסטוריה – דף הרשת שהשיק למעשה את הרשת הכלל עולמית ב-1991. הקלידו את השם בחלונית הכתובת ותגיעו לאתר מודרני המציג מידע אודות פועלו של חלוץ הרשת, האנגלי טים ברנרס-לי, שפיתח את דפדפן הרשת ושרת הנתונים הראשון במעבדת המחקר השווייצרית CERN - המרכז האירופאי לחקר הגרעין.

בתוך השטף העצום של שירותים מבוססי רשת, דוגמת דואר אלקטרוני, הורדות מוסיקה וצפייה ישירה בוידאו, הגדל בד בבד עם התרחבות הרשת, מעט מחשבה הוקדשה לשמירת מידע עבור הדורות הבאים. קצב החלופה המהיר של התוכן המקוון לא מותיר סיכוי רב לקביעת נורמה. "כתוצאה מכך, התרבות האנושית מפתחת אמנזיה", אומר סטיוארט ברנד מעמותת ההווה המתמשך (The Long Now). דני היליס, חלוץ בתחום העיבוד המקבילי ואינטליגנציית מכונה, חושש כי העולם תקוע בימי ביניים דיגיטליים, ונשען על כמה נכסי תרבות מעברו להוראת הדרך.

בהעדר נכסים רוחניים או תרבותיים שהפכו ליסוד שריר וקיים שאין לערער עליו, אין לחברה מנגנון ללימוד מטעויות עבר. לא קשה לתאר לאן מגמה זו עלולה להוביל. בין הסיפורים שנפוצו על הספרייה הגדולה של אלכסנדריה, שנבנתה במאה ה-3 לפנה"ס כמשכן לאכלוס ידע בן מאות שנים ומתחם של השכלה ומחשבה - מסופר כי היה בה עותק אחד (לעיתים, גם יחיד) מכל ספר שנכתב בעת העתיקה. הספרייה נשרפה עד היסוד אי-שם בין מסעות הכיבוש של יוליוס קיסר ב-48 לפנה"ס, לכיבוש מצרים על ידי המוסלמים ב-640 לספירה.

ספריית אלכסנדריה. איור: מוויקיפדיה, O. Von Corven

לא ברור כיצד, מתי או מדוע פרצה האש, אבל היא כילתה רבים מכתבי אריסטו, אייסכילוס, אוריפידס, סופוקלס ואינספור יצירות קדומות של אסטרונומים, מתמטיקאים, משוררים, מחזאים ופילוסופים. כל מה שנותר שייך לחלק קטן ששרד מגנזך הספרייה באלכסנדריה, ונשתמר בספריית בת, שנמצאה במקדש הסראפאום. לדברי היסטוריונים, חורבן הספרייה הגדולה ופיזור קהילת המשכילים שפקדו אותה, יצרו את התנאים לימי הביניים ששררו באירופה עם קריסת האימפריה הרומית. חשכת ימי הביניים ארכה אלף שנים שהתבטאו בסבל, בורות ועוני, ואשר הסתיימו רק בתקופת הרנסנס.

איש לא אומר שימי הביניים הדיגיטליים בזמננו, מזכירים ולו במעט אסון בסדר גודל דומה. יחד עם זאת, למגמה עשויות להיות השלכות מהותיות שישפיעו על החינוך, על מתן המלגות, על הממשלה ואף על הביטחון הלאומי. העתיד הצפון לכל אחד מתחומים האלה מהווה סיבה לגיטימית לדאגה.

באופן לא מפתיע, ניסיונות שחזור דף הבית הראשון של האקונומיסט העלו חרס. דפי הרשת של האתר נעשו לא זמינים שנים לפני הופעת מנועי החיפוש העדכניים. מנועי החיפוש של התקופה (Aliweb, JumpStation, WebCrawler) כבר מזמן לא פעילים, או ששולבו בתוכנות אחרות. הפעם לא צלחה אפילו בדיקה במנוע החיפוש Wayback Machine, המאפשר בדרך כלל החייאה של דפים ישנים.

ברוסטר קאל, יזם אינטרנט וממציא ה-Wayback Machine , סייע לדני היליס בשנות ה-80 בפיתוח מכונת החיבורים (Connection Machine) , המצאה פורצת דרך בתחום המחשוב המבוזר. ב-1996, ייסד קאל ארגון שלא למטרות רווח, ארכיון האינטרנט, כספריית רשת ללא תשלום, שתאכסן עותק מכל דף, של כל האתר, שאי פעם עלה לאינטרנט. מנוע החיפוש Wayback Machine מאפשר למשתמשים לאתר דפי רשת כפי שהופיעו ביום שעלו לאוויר. נכון להיום, ארכיון האינטרנט כולל מסמכים, קבצי מוסיקה, תמונה נעה ותוכנה. לפי נתונים עדכניים, אוסף הספרייה מונה למעלה מ -150 מיליארד פריטים.

הספרייה הפתוחה (Open Library) היא יוזמה עכשווית הפועלת ברוח ארכיון האינטרנט, ומכוונת לבנות דף רשת מכל ספר שאי-פעם ראה אור. אין לבלבל עם זאת, בין הספרייה הפתוחה לפרויקט גוטנברג- ארגון שייסד מייקל הארט המנוח, ממציא הספר האלקטרוני הראשון ב-1971. פרויקט גוטנברג מציע כ-40 אלף עותקים דיגיטליים של ספרים, הזמינים להורדה בכל אחד מהפורמטים המרכזיים של הקוראים האלקטרוניים.

בשונה מהפרויקט, הספרייה הפתוחה היא בעיקר קטלוג הפתוח לעריכה. הארגון פועל בשיתוף עם מגוון רחב של ספריות בעולם, לקטלוּג אוספי ספרים וסריקת מסמכים כתובים. עד היום, הצליחה הספרייה לרכז פרטים על כ-20 מיליון כותרים, ולסרוק כ- 1.7 ספרים הפתוחים לרשות הציבור וזמינים להורדה. אם ספר עדיין שמור בזכויות יוצרים, ניתן לשאול אותו מהספרייה לכמה שבועות – ממש כמו בספרייה רגילה.

אבל מדוע בכלל טורח קאל להוביל מהלך כזה, כשחברות כמו גוגל, אמזון, אפל ואחרות מציעות עולם תוכן וגישה למוצרי תרבות באותה מהירות? התשובה המובנת מאליה היא כי החברות המסחריות גובות כסף תמורת הגישה לתוכן, ואילו הגישה לארכיוני הרשת בדרך כלל לא כרוכה בתשלום. אלא שחוץ מהכסף, ישנם טעמים נוספים לעידוד ארכיוני קוד פתוח. סיבה אחת היא שחברות מסחריות יכולות להגביל את הגישה לתוכן בפני מנועי חיפוש של חברות אחרות. וגם כשזה נוגע ליצירה ישנה המותרת לשימוש הציבור, חברות מסחריות המחזיקות ארכיונים בתשלום, עדיין רשאיות לאסור על שימוש והפצה חופשית של התוכן.

ובהתאם לכתוב בדף הבית של ארכיון האינטרנט, ללא ספריות, אנשים יתקשו לממש את "זכותם לזכור". ככל שמידע ציבורי מתועד עובר מן הכתב והדפוס לתצורה דיגיטלית, כן חיוני שספריות וירטואליות מכל הסוגים ישקיעו בהגנה על אינטרס העיון, ההתמצאות ומראה המקום גם עבור הדורות הבאים. ככל הנוגע לאקונומיסט, הארכיון של שבועון החדשות הבריטי מציע גישה חופשית לעותקים דיגיטליים החל מיום היווסדו ב-1843. אבל בה בעת, זה גם לא האתר היחיד שחסר כל עותק מתועד של דפי רשת שיוצרו רק לפני שנים אחדות.

תרגום: יותם מורציאנו

תגובות

הזינו שם שיוצג באתר
משלוח תגובה מהווה הסכמה לתנאי השימוש של אתר הארץ