שתפו בפייסבוק
שתפו כתבה במיילשליחת הכתבה באימייל

פריצת דרך באינטליגנציה המלאכותית: תוכנה חדשה מסוגלת ליצור ידע עצמאי

חברת בת של גוגל חשפה תוכנה שהגיעה לרמת מיומנות של אמן במשחק החשיבה הסיני גו, על ידי ניסוי וטעייה בלבד ומבלי לצפות בשחקנים אנושיים. בסיס התוכנה ברשת נוירונים המדמה מוח אנושי

גרדיאן והארץ
שתפו כתבה במיילשליחת הכתבה באימייל
מעבר לטוקבקיםכתוב תגובה
הדפיסו כתבה
לי סדול משחק נגד אלפא-גו, ב-2015
לי סדול משחק נגד אלפא-גו, ב-2015צילום: אי־פי
גרדיאן והארץ

DeepMind, חברת הבת של גוגל האחראית על פיתוח אינטליגציה מלאכותית, חשפה כי תוכנה בשם AlphaGo, שמשחקת את משחק החשיבה הסיני גו, מסוגלת לחשוב בעצמה על מהלכים חדשים מבלי שלימדו אותה. התוכנה מסוגלת להבין מה הם צעדים מנצחים ואלו דווקא יובילו אותה להפסד על ידי הצבת אבני הגו על לוח המשחק, אלפי פעמים, פעם אחר פעם, ובכל פעם ללמוד משהו חדש על המשחק.  

ההתקדמות המשמעותית בתוכנת האינטליגנציה המלאכותית היא היכולת שלה ללמוד לבד את המשחק, ללא עזרה אנושית. יכולת זו של התוכנה, "אלפא-גו זירו", מעלה את האפשרות להציב בפניה בעיות אמיתיות - ובינתיים משתמשים בה על מנת לפתור את התעלומה לגבי אופן קיפול חלבונים בגוף. "עבורנו, אלפא-גו היא יותר מתוכנה שמשחקת גו", הסביר מנכ"ל DeepMind, דאמיס הסאביס.

החוקר הראשי דיוויד סילבר מסביר על ההתקדמות של אלפא-גו

מרבית תוכנות האינטליגנציה המלאכותית נחשבות למוגבלות, שכן הן מסוגלות לבצע רק משימה אחת, כמו תרגום שפות או זיהוי פנים, אבל תוכנות רחבות יותר מסוגלות לגבור על החוכמה האנושית במשימות רבות. הסאביס מאמין שהתוכנות שיפותחו בעקבות אלפא-גו יעבדו לצד בני אדם במדע ובניסויים רפואיים.

גרסאות קודמות של אלפא-גו למדו את המשחק דרך צפייה באלפי משחקים ששוחקו על ידי שחקנים חובבנים ומקצוענים. הגרסה הקודמת של אלפא-גו הצליחה להביס ב-2016 את המאסטר לי סאדול, בתוצאה 0-100. החוקר הראשי בצוות אלפא-גו, פרופסור דיוויד סילבר, אמר כי הדבר המשמעותי בגרסה זו של התוכנה היא היכולת שלה ליצור ידע עצמאי. "התוכנה לא ניזונה מידע אנושי בכלל", הסביר סילבר. 

אלפא-גו רוכשת כישורים דרך למידה באמצעות חיזוקים. כפי שבני אדם לומדים איך לרכוב על אופניים באמצעות שמירה על שיווי משקל, ובמקביל, נפילות כואבות - כשהתוכנה מצבעת מהלך טוב, יש סיכוי גבוה יותר שהיא תתוגמל בניצחון, ואילו מהלך לא טוב יגמול לה בהפסד. כך, היא לומדת.

בלב התוכנה נמצאים "נוירונים", הקשורים אלה לאלה כמו רשת נוירונים במערכת העצבים האנושית. לאחר כל מהלך, המערכת מקבלת פידבק ומחזקת קשרים מסוימים בין ה"נוירונים" שהועילו לה בדרך לניצחון במשחק. 

כתבה על אלפא-גו והניצחונות שלו

במאמר בעיתון המדעי הנחשב "Nature", תיארו החוקרים כיצד התוכנה התחילה ללא ידע בכלל, ברמה של חובבן מתחיל, ותוך ימים הצליחה להגיע להישגים מרשימים. בתוך שלושה ימים מתחילת הניסיונות, הסבירו במאמר, התוכנה הגיעה לרמת מיומנות של התוכנה הקודמת, שהביסה את המאסטר לי סדול.

החוקרים מצאו שמהלכים מוכרים במשחק החלו להופיע כעשר שעות מתחילת הנסיונות, ובימים שלאחר מכן, התוכנה המציאה מהלכים שכעת נלמדים על ידי שחקנים אנושיים. מעניין היה לראות, נכתב, שאלפא-גו למדה מהלכים מורכבים מאוד הרבה לפני שלמדה מהלכים פשוטים, שבני אדם לומדים בדרך כלל בתחילת דרכם במשחק. 

תגובות

הזינו שם שיוצג באתר
משלוח תגובה מהווה הסכמה לתנאי השימוש של אתר הארץ