אובמה, האם אתה באמת אומר את מה שאתה אומר?

על טכנולוגיה חדשה של מניפולציות מסוכנות בצילום וידיאו

יגאל באום
יגאל באום
שתפו בפייסבוק
שתפו כתבה במיילשליחת הכתבה באימייל
שתפו כתבה במיילשליחת הכתבה באימייל
מעבר לטוקבקיםכתוב תגובה
הדפיסו כתבה
עיבוד הבעות הפנים של אובמה מתוך המחקר של קים, גארדיו, טאוורי, סו, ת'ייס, ניזנר, פרז, ריקארד, סולהופר ות'יבולט
עיבוד הבעות הפנים של אובמה מתוך המחקר של קים, גארדיו, טאוורי, סו, ת'ייס, ניזנר, פרז, ריקארד, סולהופר ות'יבולטקרדיט: אתר אוניברסיטת סטנפורד
יגאל באום
יגאל באום

באוגוסט השנה, בכנס SIGRAPH 2018 לאנימציה ועיצוב במחשב תוצג טכנולוגיה חדשנית שפותחה באוניברסיטת סטנפורד שהיא כשלעצמה שיפור של טכנולוגיה דומה שפותחה באוניברסיטת וושינגטון ב-2017 שמבצעת מניפולציה על סנכרון שפתיים והתאמה לפס קול של דמויות. הסרטון הראשון והמפורסם יצא כבר בסוף השנה שעברה והציג אובמה "מדבר" בנאום מסוים, אלא שהקול והטקסטים שיצאו מפיו בסרטון היו למעשה פסקול מסרטון של נאום אחר.

כאמור, השיפור החדש בטכנולוגיה (שהשימוש בה בסרטונים נקרא גם Deep fake Video) מציג סט שלם של אפשרויות חדשות ושיפורים של היכולת הבסיסית של סנכרון השפתיים (סינק) וכולל גם: מחוות ראש, הצללה מותאמת שמטיל הראש על הרקע, תנועות סנטר, גבות, מחוות של העיניים וכד', יתירה מכך, הטכנולוגיה החדשה מאפשרת גם להשתמש בשחקן מקור דמה שישמש כדמות שממנה "נשאבות" התנועות ומועתקות בטכנולוגיה מורכבת לפנים אחרות, כך שניתן כעת בעזרת הטכנולוגיה החדשה לא רק לקחת את הסאונד ולייצר מניפולציה בנושא הליפסינג - אלא גם לשלוט בכול התנועות והמחוות של כל אברי הפנים בעזרת שחקן חיצוני שתנועותיו "מניעות" את התנועות בדמות היעד.

המשמעות בפועל היא שאפשר לדוגמא לקחת קטע קול של טראמפ שבו הוא נאם באירוע ספציפי נאמר מתקופת תוכנית הריאליטי שלו ובעזרת הטכנולוגיה להעתיק אותו לאירוע שבו טראמפ נואם באירוע נוכחי בהווה, למשל בוועידה בסינגפור ואף אחד לא יכול לעלות על השינוי הזה. אין ספק שהפיתוח הזה מציב את כל הרעיון של פייק ניוז באור לגמרי אחר.

כמו הרבה פיתוחים טכנולוגיים, גם במקרה הזה תעשיית הפורנו שימשה כזרז משמעותי של הטכנולוגיה ומזה כמה שנים הטכנולוגיה של החלפת פנים פורחת בעולם הפורנו והיא משמשת במיוחד לשתילת פרצופיהם של סבליריטאים על שחקנים בסצינות פורנו, כמו במאמר הזה שמרחיב בנושא ומציג דוגמה שעושה שימוש בלא פחות מגל גדות.

כולנו משתעשעים ביכולת החלפת הפנים בסנאפצ'ט למשל ומתייחסים לזה כגימיק משעשע, אלא שכפי שנכתב כאן - אנו יכולים לראות לאן הכיוון הכללי מתפתח והוא לא משעשע כלל. בקרוב מאוד לא נוכל לדעת אם התוכן שאנחנו רואים אותו בתקשורת הוא אכן תוכן אמיתי, מה שמציב את כל הקונספט של המושג "תוכן חדשותי" באור לגמרי אחר.

גם היום התכנים שאנחנו רואים עוברים מניפולציות שונות ובעיקר עריכה מאסיבית, אך בדרך כלל לנו כצופים ברור (לפחות אנחנו רוצים להאמין) אלו מהסרטונים הם תיעוד "אמיתי" של מציאות ומה פיקציה מוחלטת. אנחנו מבינים מהם סרטונים אותנטיים שצולמו על ידי אנשים באינסטגרם או שמועלים לפייסבוק, מהם סרטי פרסומת, מהו אייטם חדשותי במגזין חדשות בטלוויזיה, מהי פרסומת ומהו סרט שהוא בדיון מוחלט.

פניו של דונלד טראמפ מוטמעים בדמותו של מייקל סקוט מ"המשרד"

אנחנו מוצפים בסרטים מכל מיני סוגים ואולם כולם "מקוטלגים" באופן כזה שנוכל למסגר אותם לפי השיוך שלהם, יחד עם זאת אנחנו מאמינים אינטואיטיבית למה שמוצג לפנינו, כולנו מסתכלים בכתבה חדשותית בטלוויזיה למשל ומאמינים למה שאנחנו רואים, למרות שכל תחקיר ולו הקטן והשטחי ביותר על הדרך בה מייצרים כתבה יביא את הצופה להבנה כי מה שמוצג לפניו איננו בהכרח מידע אותנטי אמיתי ו"אובייקטיבי" – אלא מוצר ערוך באופן מהודק והרמטי וכתבה של דקה וחצי המוצגת במהדורה לבסוף - נערכה מחומר גלם של כמה שעות צילום. שיקולי העריכה מתחילים בהחלטת המסגור הכללית של העורך ששלח את הצוות ומסתיימים בשיקולים נוספים, כמו החלטות אסתטיות ועריכתיות-טכניות וההשפעה הגדולה והאולטימטיבית על כל התהליך - היא כמובן לחץ הזמן, כתבות חדשותיות בטלוויזיה נערכות עד ממש זמן קצר לפני שידורן.

כך שברור כבר היום שגם מוצרים חדשותיים, מקובלים ומוסכמים הם לא בדיוק תיעוד נאמן של המציאות, אלא סוג של פרשנות ממוסגרת.  אך לא רק מוצרים חדשותיים, אפילו סרטים דוקומנטריים הם מוצר ערוך הפועל לפי חוקים ברורים ומנוהל על ידי תסריט קפדני. כלומר – לנו כצופים מוצגים באופן קטגורי גס – שלושה סוגים של סרטים בטלוויזיה ובאינטרנט: פיקטיביים (סדרות, סרטי קולנוע), חדשותיים או מוסדיים (חדשות ממוסדות וערוכות למשל) וסרטונים "חופשיים" – שמועלים על ידי הגולשים ברשתות החברתיות למשל לכאורה ללא צנזורה או פיקוח.

אם הטכנולוגיה כבר היום מאפשרת לנו להחליף בין פרצופים לגוף שאליו הם שייכים, לשים טקסטים בפה של דמויות מתאריכים אחרים וסרטים אחרים שלהם, ברור לכולנו שזאת רק ההתחלה ואולי אנחנו לפני עידן שבו חלקים שלמים מהמציאות יעברו מניפולציה על מנת שיתאימו לצרכים ומטרות שונות, מממשלות ועד תאגידים, או מוסדות ומשטרים.

הטכנולוגיה החדשה הזאת, מצטרפת לטכנולוגיות אחרות שכבר קיימות באופן מאסיבי בתעשיית הקולנוע למשל – כמו שימוש בטכנולוגיות מתקדמות של CGI המאפשרות שימוש במניפולציות אינסופיות של גרפיקת מחשב, כך שכיום כמעט שאין לנו יכולת לדעת מה ממה שאנחנו רואים הוא אמיתי ומה לא, אלא שכולנו נמצאים בתחושה שיש לנו יכולת להבחין למשל בין כתבה "אמיתית" בחדשות לבין מוצר מניפולטיבי, לפעמים אולי גם נהיה צודקים. ה"הסכמה" הכללית היא שמידע חדשותי ממוסד הוא נאמן ל"מציאות", אך היכולות הטכנולוגיות הולכות ומשתכללות - ובעולם הטכנולוגי הרבה מהיכולות הללו הופכות להיות נגישות יותר ויותר לציבור הרחב, כבר היום אנשים עם הרבה כישרון ותעוזה יכולים לברוא עולמות שלמים במחשבים שלהם ולייצר מניפולציות על תוכן מצולם ופעולות אלה אינן בהכרח נחלתם הבלעדית של גופי הפקה גדולים.

הטכנולוגיה החדשה הזאת, רק ממחישה לנו עד כמה חשוב היום ואולי יותר מאי פעם בעבר להיות ביקורתיים, פרופסור זולהוף מאוניברסיטת סטנפורד פיתח ביחד עם צוות שלם ומוסדות נוספים את הטכנולוגיה כדי להמחיש ולהזהיר עד לאן יכולות מניפולציות אלה להגיע. בבלוג שלו הוא מתריע ומסקנתו היא שיש ליצור טכנולוגיות איתור זיופים על מנת להיות מוכנים מראש לתרחיש זה. יחד עם זאת לכל פיתרון שימצא זיוף כנראה תמצא תמיד טכנולוגיה שתעקוף אותו.

כפי שציינתי עד כה, המחקר רק ממחיש שלמעשה בעתיד, יתכן שלעולם לא נוכל להבדיל בין מציאות לפיקציה ומניפולציה איננה רק עניין טכנולוגי.

יגאל באום

יגאל באום | |מחוץ לרשת

מומחה לשיווק, מעצב תקשורת חזותית, בוגר בצלאל, חוקר תקשורת ומחלוצי האינטרנט הראשונים בישראל, לומד לתואר שני בתקשורת מחקרית, מורה ומרצה בתחום.

חוקר את הרשת יותר מ-20 שנה ומלווה את התפתחותה: ההתפתחות הטכנולוגית מהירה עד כדי כך שהיא מציבה את האנושות בפני אתגרים מורכבים מאי פעם, אלא שבני האדם נוהגים להתייחס לטכנולוגיה כפי שדג מתייחס למים.

הבלוג יציג נקודת מבט ביקורתית לאור המצב הזה.

תגובות

הזינו שם שיוצג באתר
משלוח תגובה מהווה הסכמה לתנאי השימוש של אתר הארץ