בואו לגלות את עמוד הכתבה החדש שלנו
 

רשימת קריאה

רשימת הקריאה מאפשרת לך לשמור כתבות ולקרוא אותן במועד מאוחר יותר באתר,במובייל או באפליקציה.

לחיצה על כפתור "שמור", בתחילת הכתבה תוסיף את הכתבה לרשימת הקריאה שלך.
לחיצה על "הסר" תסיר את הכתבה מרשימת הקריאה.

האם גוגל Translate שוביניסט?

תמונה שהופצה בפייסבוק בסוף השבוע גילתה שכלי התרגום של גוגל שולח נשים למטבח, בעוד הגברים הולכים לעבודה. אבל, הבעיה היא לא בו, אלא בנו

11תגובות

תמונה אחת עוררה עניין רב בפייסבוק בסוף השבוע, והרימה לא מעט גבות. נראה היה שהתמונה, של נטלי איגור דובקין, חשפה את השוביניזם החבוי ב-Google Translate, כלי התרגום של גוגל.

היא תרגמה ארבע פעולות בגוגל טרנסלייט:

I am making dinner שתורגם ל"אני מכינה ארוחת ערב"

Iam washing dishes - "אני שוטפת כלים"

I am driving a car - "אני נוהג במכונית"

i am going to work - "אני הולך לעבודה"

את העניין סיכמה ב"רצף של הקלדות מקריות בגוגל טרנסלייט הובילה אותי לתגלית המפחידה הבאה. OMG! WTF?!".

גוגל

אז האם בתוך גוגל טרנסלייט אכן מסתתר שוביניסט קטן?

כדי להבין איך זה קורה, צריך להבין איך מנגנון התרגום עובד. "השירות של גוגל הוא סטטיסטי בעיקרו, והוא סורק הרבה מאוד מסמכים שקיימים בשתי השפות", הסביר ל"הארץ" ד"ר גלעד רביד מהמחלקה להנדסת תעשייה וניהול בפקולטה להנדסה באוניברסיטת בן גוריון. "התרגום נעשה על ידי השוואה בין משפטים הקיימים בשתי לשונות או יותר".

גוגל משתמש במיליוני המסמכים הזמינים במאגרים שונים ברשת כבמעין אבן רוזטה, כדי ללמוד את הדפוסים של השפה, וגם באתר גוגל מסבירים כי איכות התרגום תלויה בכמות המסמכים הקיימים בשפה זו. רביד סיפר כי במובנים רבים גוגל חוללה מהפכה, מפני ש"עד אמצע שנות ה-90 האמינו שיש צורך בהבנה של סמנטיקה ואונתולגיה כדי ליצור תרגום מכונה טוב. התרגום של גוגל מוכיח שדי בסטטיסטיקה כדי לייצר תרגומים טובים".

אבל זה לא תמיד מספיק. רביד מסביר כי השירות מסתמך על מאגרי מידע קיימים כמו מסמכים של האו"ם או מאגרים דומים. "רובם נכתבים בלשון מדעית, שבדרך כלל נוטה לכיוון המגדר הגברי ולכן רוב המשפטים יתורגמו ללשון זכר, גם מפני שכך נהוג לרשום במסמכים טכניים". צריך לזכור דרך אגב, שבאנגלית אין לפעלים הטיה מגדרית כמו בעברית, כך שהוא מסתמך על התרגום כפי שהוא מופיע במסמכים.

רביד ציין שהמצב יחמיר עוד יותר אם יהיה מדובר בתרגום משפה כמו סינית לעברית, אז התרגום יעבור דרך התווך של האנגלית - מה שייצור הרבה יותר "רעש" בתרגום. הוא הוסיף כי ההסתמכות על מסמכים טכניים ומדעים מקשה על גוגל טרנסלייט להתמודד עם פרוזה. "הוא לא מסוגל לזהות סגנונות שונים של כתיבה", אמר , "במקום סיפור, אתה מקבל כתיבה מדעית".

בסופו של דבר, אמר רביד, מה שנחשף כאן הוא לא הבעיה של גוגל, "מה שצריך להדאיג אותנו הוא למה קיימת ההטיה הזו במסמכים בעברית". או במילים אחרות, גוגל לא שוביניסטי, אלא אנחנו.

מגוגל נמסר בתגובה לשאלה, כי כלי התרגום פועל באופן אוטומטי ללא התערבות של מתרגמים אנושיים. "אפילו התוכנות הכי מתוחכמות לא מגיעות ליכולות של דובר שפת אם או של מתרגם אנושי. אנחנו פועלים כדי לשפר את איכות התרגומים שלנו, אבל זה עשוי לקחת הרבה זמן עד שמישהו יוכל להגיע לתרגומים ברמה אנושית. בינתיים אנחנו מקווים שהמשתמשים מוצאים את השירות שאנו מספקים מועיל למטרותיהם".

ד"א, רביד ציין שגם לכך יש יתרון. "בעוד שבתרגום אנושי קשה להבחין בתרגום גרוע, כשהתרגום בתוכנה לא מוצלח זה ברור לעין. או שהוא נכון מאוד או שהוא גרוע מאוד, אין לו גוונים".



תגובות

דלג על התגובות

בשליחת תגובה זו הנני מצהיר שאני מסכים/מסכימה עם תנאי השימוש של אתר הארץ

סדר את התגובות
*#
בואו לגלות את עמוד הכתבה החדש שלנו