בואו לגלות את עמוד הכתבה החדש שלנו
 

אתם מחוברים לאתר דרך IP ארגוני, להתחברות דרך המינוי האישי

טרם ביצעת אימות לכתובת הדוא"ל שלך. לאימות כתובת הדואל שלך  לחצו כאן

לקרוא ללא הגבלה, רק עם מינוי דיגיטלי בהארץ  

רשימת קריאה

רשימת הקריאה מאפשרת לך לשמור כתבות ולקרוא אותן במועד מאוחר יותר באתר,במובייל או באפליקציה.

לחיצה על כפתור "שמור", בתחילת הכתבה תוסיף את הכתבה לרשימת הקריאה שלך.
לחיצה על "הסר" תסיר את הכתבה מרשימת הקריאה.

ללמד את המחשב להבחין בין עיקר לטפל, על פי המודל היעיל של החיידק והזבוב

עיבוד המידע של האדם דומה בעיקרון לזה של אורגניזמים אחרים. המודל של פרופ' נפתלי תשבי מחקה את יעילותן של מערכות עיבוד המידע הביולוגיות

תגובות

יכולת התעופה של זבובים מרתקת ילדים ומדענים כאחד. בעת המעוף הזבוב נתקל במכשולים נייחים, יצורים אחרים חוצים את נתיב התעופה שלו וחייו תלויים ביכולת התמרון הווירטואוזית שלו. בעשר אלפיות השנייה הוא מסוגל לקלוט ולפרש תנועת עצמים במרחב ולתרגם אותה לשינוי בכיוון ובמהירות התעופה שלו. באופן מפתיע, המידע הראייתי של הזבוב מנותב אל מערכת התעופה שלו דרך "צוואר בקבוק" המורכב בסך הכל משישה תאי עצב.

עיבוד המידע הראייתי של הזבוב משמש מודל לאופן שבו מידע מעובד במערכות ביולוגיות. "מבחינתנו", אומר פרופ' נפתלי תשבי, מבית הספר להנדסה ומדעי המחשב באוניברסיטה העברית, "עקרונות דומים לאלה שפועלים אצל הזבוב פועלים לאורך כל שדרת החיים, החל בחיידקים וכלה בתקשורת התוך-מוחית במסלולי השמיעה, הראייה ועיבוד השפה של האדם. כשהזבוב מעבד גירוי ראייתי מיוצג רק חלק קטן מהמידע הראייתי בפעילות תאי העצב שלו. סינון דומה של מידע משמעותי, כך אנחנו מניחים, מתרחש גם כשאדם נוהג במכונית או קורא מסמך במשרד. השאלה הכללית שמעסיקה אותנו היא כיצד מערכת ביולוגית מחלצת את המידע הרלוונטי מתוך מכלול המידע שמגיע אליה. איזה מנגנונים מאפשרים לאורגניזם להבחין בין עיקר לטפל, 'לאבד' את המידע המיותר ו'לעבד' ולעשות שימוש במידע חיוני".

במפתיע, המגבלות המתמטיות על סינון יעיל של מידע אינן משתנות מאורגניזם לאורגניזם. "המגבלות הללו הן במידה רבה אוניוורסליות", מסביר תשבי. "אנחנו מוצאים בתצפית על מערכות ביולוגיות שונות, החל בתאי העצב של הזבוב, דרך מערכת השמיעה של חתולים ועד לשימוש במלים בשפה האנושית, שיעילות עיבוד המידע מתקרבת ליעילות המרבית האפשרית. תוכנות מחשב כפופות אף הן לאותן מגבלות מתמטיות, ולכן המחשב, שהוא כלי העבודה העיקרי במעבדה שלנו, יכול לשמש בהצלחה כמודל לחקר עיבוד מידע ביולוגי".

פרופ' תשבי פיתח מודל מתמטי שמתאר מערכת ביולוגית המסננת מידע ביעילות מרבית. היעילות של כל מערכת תלויה ביחס בין כמות המשאבים שהיא משקיעה ליכולת הניבוי שהיא מפיקה מאותם משאבים. ככל שמערכת ביולוגית יעילה יותר, סיכויי ההישרדות שלה גדלים. המערכת הממוחשבת שפיתח תשבי חוסכת במשאבים כמו זיכרון ומתמחה בזיהוי ושמירה של מידע רלוונטי בלבד. "מטרתנו היא לפתח מודל ממוחשב המעבד מידע ביעילות המתקרבת לזו הנצפית במערכות ביולוגיות", מסביר תשבי. "כדי לבחון את המודל בדקנו כיצד מערכת התוכנה שלנו מעבדת את המידע שאצור בשפה האנושית. במחקר משותף עם ד"ר נועם סלונים חקרנו את אופן ארגון השפה ואת שכיחות המלים בשפת היום-יום וניסינו להבין כיצד המוח האנושי מעבד את המידע שאצור בשפה ומסנן מתוכו את העיקר".

המחקר התבסס על 20 אלף מסמכים שנלקחו מהאינטרנט. המסמכים סווגו, בהתאמה לתוכן שלהם, וחולקו לעשרים קטגוריות תחת כותרות כמו ספורט, פוליטיקה, מדע ורפואה. "בשלב הבא הסתכלנו על הסטטיסטיקה של המלים במסמכים", מסביר תשבי. "בדקנו את השכיחות של אלפי מלים בקבוצות השונות, והתוצאות אישרו שככל שהקטגוריה מובחנת יותר השימוש במלים בה מדויק יותר". מלים כלליות כמו "או" ו"את" שכיחות מאוד בכל הקבוצות ולעומתן מלים כמו "יהודי" או "מוסלמי" מופיעות מעט פעמים ובמספר מצומצם של קטגוריות. התברר לנו שכדי לסווג מסמך לאחת הקטגוריות שהוגדרו לא צריך להבחין בין אלפי מלים אקראיות, אלא מספיק להשתמש במספר קטן של קבוצות מלים שמאפיינות כל אחת מהקטגוריות. לדוגמה, במקום לבדוק את שכיחות המלה 'אריק', המלה 'שאול', המלה 'חאלד' או המלה 'ערפאת', די לבדוק את שכיחות הקבוצות 'שם יהודי' ו'שם מוסלמי' כדי להבחין בין הקטגוריות שבחרנו.

"התוצאות שלנו מלמדות שכשתוכנת מחשב או מערכת ביולוגית מעבדת מידע ביעילות היא יכולה להתעלם מההבדלים בין מלים בתוך כל קבוצה ולרכז מאמץ כדי להבדיל בין קבוצות מלים. תוכנת המחשב שפיתחנו מתייגת מסמכים בדיוק גבוה, גם אם מדובר במסמך שהתוכנה לא פגשה מעולם".

המחקר של תשבי עוסק גם בעיבוד השפה האנושית. "אנחנו מניחים שמנגנון יצירת המלים דומה בכל השפות", הוא אומר, "ונובע מהצורך לייצג מידע רלוונטי באופן יעיל. מתי נוצרת מלה חדשה? כשיש צורך לעשות הבחנה שקודם לא עשינו". באופן פשטני, תינוק בשלבי ההתפתחות המוקדמים שלו מבחין, למשל, בין קבוצת החיות לקבוצת הצעצועים. בשלבים מוקדמים של ההתפתחות כלולים בקבוצת החיות החתול, הכלב, אביו של התינוק וחיות אחרות. בשלב מסוים התינוק מבין שכדאי לו להבחין בין אביו ליתר בעלי החיים, ואז הוא מקצה צליל מיוחד למלה 'אבא' ומתחיל להשתמש בה. אם הוא יקרא לאביו כפי שהוא קורא לחתול, הוא לא יזכה לתגובה המצופה; אם הוא יקרא לו 'אבא', ייתכן שדרישותיו ייענו. "התינוק עושה הבחנה חדשה ומשתמש במלה חדשה כשהמחיר על שימוש במונח כללי יותר נעשה יקר", אומר תשבי. "כדי לעשות את ההבחנה שקודם לא היתה קיימת, התינוק יוצר מלה חדשה ומתחיל להשתמש בה".

המנגנון הזה פועל גם בשלבים מאוחרים יותר בחיים. כשנער מתגייס לצבא, למשל, הוא רוכש במהירות קבוצה גדולה של מלים חדשות, מכיוון ש"כדאי" לו לדייק במינוחים הצבאיים שאליהם הוא נחשף. לכל שגיאה במתן משמעות למלה יש מחיר, ומספר השגיאות הממוצע שאדם יכול לסבול נשאר פחות או יותר קבוע לכל אורך חייו. "בעזרת תוכנת המחשב שלנו ניתחנו אלפי מסמכים שנכתבו על ידי בני אדם שונים", מסביר תשבי, "ומצאנו את הסף הממוצע של שגיאות שמחייב בני אדם ליצור מלה חדשה. מעניין לציין שסף רגישות כזה התגלה בעיבוד מידע ראייתי של זבובים, במערכת השמיעה של חתולים ובמערכות ביולוגיות רבות נוספות".

מערכת עיבוד המידע של האדם, בדומה לייצוג מידע במערכות ביולוגיות אחרות, מצמצמת ודוחסת את המידע ל"משפך" של קטגוריות, והיא תרחיב את המשפך רק כשהיא תתחיל לשלם מחיר אם לא תעשה זאת. הסביבה מכתיבה את הצורך בהבחנות חדשות, ומערכת עיבוד המידע שלנו מגיבה ומיישרת קו עם הדרישות שהסביבה מציבה. המלה "דת" כוללת בתוכה את המוסלמי והיהודי. אך ההתפתחויות הפוליטיות והדתיות במזרח התיכון הופכים את האבחנה בין "יהודי" ל"מוסלמי" לכדאית, ומי שלא יודע להבחין בין השניים עלול לשלם על כך מחיר כבד.

בסופו של דבר מתגבש שיווי משקל בין הדחף לייעל את מערכת עיבוד המידע לבין הצורך של המערכת לדייק. שיווי המשקל נגזר מתנאי הסביבה, וכל יצור נעצר בנקודה אחרת על העקומה הנעה בין יעילות לדיוק.



תגובות

דלג על התגובות

בשליחת תגובה זו הנני מצהיר שאני מסכים/מסכימה עם תנאי השימוש של אתר הארץ

סדר את התגובות
*#
בואו לגלות את עמוד הכתבה החדש שלנו