בואו לגלות את עמוד הכתבה החדש שלנו
 

אתם מחוברים לאתר דרך IP ארגוני, להתחברות דרך המינוי האישי

רשימת קריאה

רשימת הקריאה מאפשרת לך לשמור כתבות ולקרוא אותן במועד מאוחר יותר באתר,במובייל או באפליקציה.

לחיצה על כפתור "שמור", בתחילת הכתבה תוסיף את הכתבה לרשימת הקריאה שלך.
לחיצה על "הסר" תסיר את הכתבה מרשימת הקריאה.

במעבדה קטנה בתל אביב, חוקרים מנווטים באוקיינוס המידע האין סופי

המומחים לכריית מידע אומרים שלמרות הסכנות, בתחום יש פוטנציאל עצום

תגובות

 

מימין: החוקרים ד''ר יבגני קגן, אביב גרובר, חבצלת טרייסטר, נעה רושין-רומיני, פרופ' בן-גל וגל גורן
תצלום: ניר קידר

לא בקלות מוצאים את המעבדה של פרופ' עירד בן-גל והצוות שלו. היא שוכנת בקומה האחרונה והמבוכית של אחד מבנייני הפקולטה להנדסה באוניברסיטת תל אביב. רוב הסטודנטים לתואר ראשון לא מגיעים לשם אלא בשנה האחרונה ללימודיהם. "הם מופתעים לגלות שקיים בכלל מקום כזה", אומרת נועה רושין-רימיני, דוקטורנטית וחוקרת במעבדה. יש שמץ של אירוניה במיקומה הנסתר של המעבדה, משום שהחוקרים שעובדים בה עוסקים כולם בכריית מידע - או בשפה האקדמית, מכונות לומדות ואנליטיקה.

 

אצל רבים צמד המלים הזה, "כריית מידע", מדליק נורות אזהרה אדומות. עוד לפני כרייתו, יש את איסופו השנוי במחלוקת. מאז התגברו חברות הטכנולוגיה והמידע על הקושי שבאגירה דיגיטלית של כמות כמעט אינסופית של מידע ונתונים, יכולת האיסוף, השליפה והניתוח שלהם רק משתכללת. "לפי מחקרים של IBM, כמות המידע הדיגיטלי מכפילה את עצמה כל 11 שעות", אומר פרופ' בן-גל. "זה נתון שיש ויכוחים עליו, אבל דבר אחד ברור: המידע כל כך עצום, שכבר אי אפשר לעבד ולנתח אותו באופן אנושי. התחום כולו נע לעבר בינה מלאכותית שתפיק תובנות אוטומטיות מהמידע".

הרגלים במעקב

חיישנים, כרטיסי אשראי וכרטיסי מועדוני לקוחות, מצלמות רחוב, שבבים בטלפונים הסלולריים, רשתות חברתיות - כל אלה הם צינורות שמובילים ללא הרף מידע על הרגלינו. במילותיו של בן-גל, "אי אפשר להתעלם מהעובדה שכולנו משאירים אחרינו שובל דיגיטלי. בכל רגע נתון יודעים איפה את נמצאת, מה את קונה, כמה כסף משכת - יודעים הכל", אומר בן-גל. "אני מודה שזה קונפליקט לא פתור. יש היבטים מאוד מסוכנים בטכנולוגיות האלה, אפילו בלי לחדור לפרטיות של האדם".

האתגר הבא

אבל הוא, כמו שמונת החוקרים שעובדים לצדו, סבורים שכריית מידע, כמו כל טכנולוגיה, אפשר לנצל גם לחיוב. "אנחנו מפתחים טכנולוגיה לצרכים מאוד מסוימים, אני מניח שכמו בכל דבר אחר ובכל סוג אחר של רכישת ידע, אפשר להשתמש בה לכל מטרה - גם לטוב וגם לרע", אומר המאסטרנט גל גורן, שיחד עם ד"ר יבגני קגן עוסק במחקר מודיעיני. הפיתוח שלהם עוסק בחיפוש מטרות ניידות - מבני אדם ועד מרבצי גז תת-ימיים - על ידי איסוף נתונים ממגוון של חיישנים ומקורות מידע לכדי מפה שמראה היכן ההסתברות הגבוהה ביותר למצוא את המטרה המבוקשת.

התעשייה העולמית, מכל מקום, כבר רואה בניתוח מידע את האתגר הגדול הבא. רק בשבוע שעבר פרסם מכון מקנזי דו"ח שהוכן במשך תשעה חודשים, ומסקנתו העיקרית היא ש"ניתוח מאגרי מידע גדולים יהיה בעתיד עמוד התווך של התחרות, ויעמוד בבסיס גלים חדשים של צמיחה, חדשנות ורווחת הצרכן". לפי הדו"ח, בסקטור הציבורי, מערכת הבריאות האמריקאית תוכל לחסוך מאות מיליארדי דולרים בשנה, והרבה זמן, על ידי שליפה ועיבוד יעילים של מידע; אלגוריתמים יוכלו לבצע החלטות בהתבסס על מאגרי המידע העצומים, שהמוח האנושי לעולם לא יוכל לעבד בזמן סביר; לקוחות יוכלו לחסוך כסף וזמן על ידי שירותים מבוססי-מיקום; גורמי סיכון כמו רמאים וזייפנים יאותרו במהרה.

שיטות ניתוח המידע של היום, מעוררות השתאות ככל שיהיו, עדיין פשוטות יחסית לאלו שיביא העתיד. "כבר היום זה דבר בסיסי לזהות שיש תבנית קבועה, שקבוצה של צרכנים קונה שני דברים יחד", אומר בן גל. "יש תמיד את הסיפור הידוע על בירה וחיתולים, שמתברר שבדרך כלל קונים אותם יחד. לרשתות קמעונאיות מאוד חשוב לדעת אילו מוצרים נמכרים יחד. אם אתה רואה שיש תבנית קבועה, שקבוצה של צרכנים קונה שני דברים יחד, אולי תשים אותם במרחק זה מזה כדי להכריח אותם לעבור על פני מוצרים אחרים".

במעבדה של פרופ' בן-גל החוקרים כבר צוללים למעמקים המתוארים בדו"ח של מקנזי. "האתגר הגדול הבא הוא שכלול בינה מלאכותית לרמה שתוכל לנתח ולחתוך את מאגרי הנתונים העצומים, ולייצר מתוכם תובנות באופן אוטומטי", אומרת רושין-רימיני, שבשיתוף עם פרופ' עודד מימון ופרופ' בן-גל פיתחה שיטה ויזואלית לאיתור תבניות חריגות עבור ג'נרל מוטורס. האלגוריתם שפיתחו איפשר להם להבין כיצד מערכות ייצור, שלכאורה אין כל קשר ביניהן, משפיעות זו על זו וגורמות לתקלות בייצור.

שמירה על פרטיות

מחקר אחר, בשיתוף ד"ר טל רביב וזוהר פוסטלניקו, מבשר על עתיד של אתרי אינטרנט דינמיים, שיתאימו את עצמם לגולשים על פי מידע שנאסף אודותיהם מהיסטוריית השימוש שלהם ברשת. בפיתוח של הדוקטורנט אביב גרובר, שמשמש לצורכי מודיעין וביטחון, אלגוריתם מאפשר לעקוב אחר תבניות של שימוש בטלפונים סלולריים לפי משתנים כמו שעות ההתקשרות ומשך השיחה.

בן-גל מקווה שהתאוצה בתחום המידע תביא גם לטכנולוגיות לשמירה על פרטיות. "אפשר להסתתר ולומר תמיד שאנחנו עוסקים ברובד המתמטי האבסטרקטי. גם בעבודות אלגוריתמיות החלק התיאורטי הוא טהור מסיפור. אחר כך אתה יכול להלביש על זה סיפור של רופא וחולה שכולם יזדהו אותו, אבל זה ברור שאפשר לעשות בזה שימוש לרעה. ובסופו של דבר זה יהיה חייב לבוא לידי איזון. חלק מהפתרונות יהיו טכנולוגיים: יש כיום תחום של גילוי ידע בלי לפגוע בפרטיות: איך אתה מזהה למשל מאפיין של קבוצה ובתנאי שהקבוצה הזו היא גדולה מ-K פריטים, כך שאתה לא יכול לשים אצבע על אדם מסוים".



תגובות

דלג על התגובות

בשליחת תגובה זו הנני מצהיר שאני מסכים/מסכימה עם תנאי השימוש של אתר הארץ

סדר את התגובות
*#
בואו לגלות את עמוד הכתבה החדש שלנו