הפיל שבחדר

בעבודתי מול לקוחות בשנים האחרונות, אני מודע תמיד לנוכחותו של יצור אפור עם חדק ארוך, שהתחיל קטן למדיי וחמוד, אך גדֵל עם השנים למימדים שכבר לא ניתן להתעלם ממנו – ובכ’”ז איש לא מזכיר אותו או שואל עליו. אני מדבר, כמובן, על

Google Translate

image

על הפרוייקט של גוּגל טראנסלייט נודע לי לראשונה ב–2008, ממאמר על הבלשן פראנץ יוסף אוֹך, שגוּייס כמה שנים לפני-כן ע”י גוגל לפתח את המערכת אחרי שזכה בפרס ראשון בתחרות לתרגום מכונה (המונח הרשמי ל׳תרגום ע”י מחשב׳), שנערכה בחסות סוכנות מיזמי המחקר המתקדם של משרד ההגנה האמריקאי ב–2003. השיטה של אוֹך מתבססת על ניתוח סטטיסטי של מאגר גדול של טקסטים, במקום על כללים, כפי שהיה מקובל עד אז בתוכנות תרגום אחרות. מכאן הקשר הטבעי לגוּגל, המחזיק במאגר ענק של טקסטים ברוב שפות העולם. למטרה זו, גוּגל טראנסלייט משתמש בראש ובראשונה בטקסטים בפרסומים של האו”ם, בכל שש השפות הרשמיות.

לנוכח המשאבים ויכולת התיכנות של חברת גוּגל, סימנתי לעצמי את ההתפתחות הזו כאיום אפשרי לעתיד, אבל לא סיבה לדאגה של ממש. לנגד עיניי ראיתי את הדוגמאות הראשונות תרגום ממוחשב, כגון הפסוק הידוע מהברית החדשה:

The spirit is willing, but the flesh is weak

אשר תורגם

׳הוודקה טובה, אבל הסטייק – על הפנים׳.

ובכ”ז, מחובתו של כל בעל עסק או עצמאי להיות מודע תמיד לאיומים על מחייתו, ולהיערך בהתאם. גם אם אני יודע שיש לתרגום מכונה מגבלות רציניות, לא כל הלקוחות יחשבו כך, וחלקם, לפחות, יתפתו לנסות את השירות של גוגל – או תוכנות תרגום אחרות – ע”מ להמנע מההוצאה על מתרגם אנושי, או לפחות למזער אותו – וטבעי שכך.

לכן, לפני כשנתיים-שלוש, תוך כדי עבודה, התחלתי לערוך ניסויים מזדמנים על היכולות של גוגל טראנסלייט לגבי טקסטים שונים שנתבקשתי לתרגם, ולעקוב אחר התוצאות.

למדתי שגוגל טראנסלייט הוא הרבה יותר טוב מהדורות הראשונים של תרגום מכונה –  לעיתים (רחוקות, אמנם), בצורה מדאיגה::

׳דיאלקטיקה זו בין שני הנרטיבים הסותרים לכאורה׳

תורגם נכון ל–

This dialectic between two seemingly contradictory narratives

ובמקרה אחר לחלוטין, הוא הפגין שהוא אפילו יודע מה זה ׳פיצוציה׳:

׳האם בשנה האחרונה השתמשת ב’סמי פיצוציות׳

תורגם ל

During the past year, used also in Sammy convenience stores?

הוא גם הוכח כשימושי לאיוּת של שמות של חוקרים המצויינים בהפניות של מאמרים אקדמאיים, במקרים שבהם הלקוח לא סיפק זאת בעצמו. אך לרוב, התרגום של גוגל ושל תוכנות תרגום אחרות לוקה במספר מגבלות בסיסיות, שחלקן אולי תיפתרנה במרוצת הזמן, וחלקן – במיוחד אלו המיוחדות לעברית, מעצם טבעה, או בגלל היעדר הניקוד – לא יתוקנו עד לפיתוח אינטליגנציה מלאכותית די נרחבת.

ניתן לחלק את הטעויות למספר קטגוריות:

א) בלבול בין שמות לבין מילים. כך, למשל: מעצב במה בשם שלום סֶבָּא הוּמר ל–

Hello Grandpa

השחקן חיים אמיתי תורגם ל–

The actor in real life

מיכל הובנה כ–

container

אריה ארוך וחיה שווארץ הפכו ל

Long life Schwartz

הביטוי ׳שוקט על שמריו׳ ל–

Not quiet on Mario

ואולי הכי חביב: ׳לבעל ולאשרה ולכל צבא השמיים

A husband and a visa and the whole host of heaven

ועוד דוגמאות למכביר, עד שהדבר דומה לציד דגים בחבית – אין בכך חכמה או אתגר

לעיתים, הטעות גדולה אך נדמה שהתוכנה מנסה להרשים בבקיאותה בהיסטוריה או תרבות – למשל, ׳התבוננות בקרתית׳ מובנת –כ

observation of McCarthy

או ׳מאבק של נערה בדוד רודן׳ מתורגם כ

Struggle of a girl in David Rodin

ב) טעויות בגין היעדר ניקוד

אלו טעויות דומות לסוג הראשון, די צפויות, וייחודיות לשפות כגון עברית וערבית שבהן בד’’כ לא כותבים עם ניקוד – וקשה לראות כיצד הן יתוקנו בעתיד בלי רמה גבוהה של אינטליגנציה מלאכותית.

גם כאן יש אינספור דוגמאות, כגון:

 ׳בן המשפחה של המאמצים׳ |  a family member of the efforts

 ׳גבר אחד מחלל, השני מתופף׳ |  one man in space, two drums

 ׳ההתלבטות של העובדות׳  | the dilemma of the facts

 ׳אדריכלי הנוף ומעצבי הגנים׳ | landscape architects and designers of genes

 ׳דמותה של מריה כאישה נעלה שהנה |the image of Mary as a woman wore that here

 גורמי סיכון בהשוואה לנערים ותיקים |susceptible to risk factors than boys and bags

 המונחים ׳עובר׳, ׳תינוק׳ ו׳ילד׳ |references to the child as ‘pass’, ‘baby’, and ‘boy

’וכיו’’ב. המעניין הוא, שגם כאשר מציינים את הניקוד, זה לא עוזר, כי מסתבר שהתוכנה אינה  רואה  ואינה מבחינה בניקוד. כך, ׳האיבּוּן והזרות המתעוררת לנוכח׳ תורגם כ–

Yvonne and strangeness that arise in the face of

ג) טעויות ברמת ההבנה

. אלו אולי סוג הטעות הנפוץ ביותר, שהרי התוכנה אינה ׳מבינה׳ דבר. לדוגמא:

 ׳דעת המבקרים על יצירותיהם׳ | knowledge of visitors about their work

 ׳להקל על ההיגוי בפי השחקנים׳ | ease the steering by the actors

 ׳השליח מקורינת׳  | The Apostle at Corinth

 יוצר אפי למופת | It creates a perfect nose 

 התוקף התרבותי של המחזה | the attacker culture of the spectacle

 שיחים חברתיים לגבי אימהות | social shrubs for mothers

 תלמוד בבלי, מסכת שמחות | Babylonian Talmud, hydrating mask

 גורמים חברתיים המחבלים במאמצי האמהות | social terrorists’ efforts of the mothers

 ׳אחי הגיבורים לנשק׳ | Heroes kiss my brother

וכיו’’ב

ד) בלבול מוחלט בהתמודדות עם מבנה משפט עברי שאינו מקובל באנגלית

  צייר הבמה סיגל לעצמו את כוונתו המונומנטלית של הבמאי׳ | Draw stage adopted completely the intention monumental director

ה) לעיתים – ומסיבות לא מובנות – התרגום הוא ההיפך הגמור של המקור, או משהו מוזר):

< ׳הצגת אדיפוס המלך לא היתה ההצגה הראשונה

View Oedipus Rex was the first performance

< ׳אלוני הפעיל את הצופים בכוחה של תאטרליות חסרת–תקדים

Aloni started the audience without the power of theatricality

< מאז שנות השבעים של המאה

since the 70th century

מעבר לכל אלה, יש גם מקרים רבים של השמטות של מילים, וכמובן אי-תפיסה של טעויות דפוס, הברורות למתרגם האנושי.

ולמרות כל זאת, ייתכן ואתם תוהים: ׳בהנחה שהיית תופס את כל הטעויות הללו, לא תשתמש בגוּגל טראנסלייט ודומיו ליצירת טיוטה ראשונית?׳

ובכן, זו שאלה ששאלתי את עצמי, ולשם כך ערכתי ניסויים עם מאמרים וספרים שונים, תוך מדידת התפוקה בסוף התהליך, מבחינת מילים לשעה. גיליתי שהחיסכון בזמן לכאורה ביצירת טיוטה ראשונית אבד לחלוטין ויותר בתהליך הבדיקה והעריכה שלה –  וגרוע מכך, שפת ה׳תרגומית׳ של הטיוטה מנעה ממני ׳לשמוע׳ בראש את האנגלית המתבקשת, כך שנאלצתי לתרגם את הטקסט מחדש ע”מ ליצור את הנוסח הרצוי. ולראיה, הנה דוגמא של קטע מתוך פיסקה של ספרה של פרופ׳ גילה בלס על אמנים ישראליים מתנועת ׳אופקים חדשים׳ בשנות החמישים והששים של המאה העשרים. בתרגום מכונה:

I do not think Abramovich wanted to describe the exoticism that attracts many artists to the East. It seems to me that the cause of the innocent child's inner perception IDE spontaneous meeting with the world around Oriental. Copious pictures nice picturesque details, fusing coloured rug that recalls — particularly the characters — the folk art.

בתרגום שלי (באופן עצמאי)

I don’t think that Abrahamovitch set out to describe the exoticism that attracts many artists to the ‘East’. It seems to me that the childish, innocent element in his internal outlook rejoiced at the spontaneous encounter with the surrounding Oriental world. His paintings are full of beguiling painterly details, merging together into a colourful tapestry that is reminiscent—especially in its figures—of folk art.

אילו נאלצתי לעבוד עם תרגום המכונה, הניסוח הקלוקל של הטקסט היה רק מפריע לי להגיע לנוסח של התרגום העצמא. למניעת התופעה, אני נאלץ לתרגם את הקטע מחדש בעצמי – אז מה הרווחתי בזה?

לסיכום, אם אתם משתמשים בגוגל טראנסלייט או תוכנות תרגום אחרות, כדאי שתהיו מודעים לסכנות, וכן לאפשרות שהתוצאה יכולה למנוע יצירת תרגום טוב.

לשאלה, הייתכן שיום אחד גוּגל טראנסלייט יהיה חכם מספיק להבין נכון ולתרגם לאנגלית אידיומטית, אומָר רק שייתכן, ביום מן הימים – אבל יש עוד כברת דרך ארוכה, ואם התוכנות תגענה לדרגה כזו של אינטליגנציה מלאכותית, יהיו לנו הרבה סיבות לדאוג.

בינתיים, אם בזירוז תהליך התרגום עסקינן, יש טכניקה הרבה יותר שימושית, והיא היכולת של מחשבים בימינו לשכתב בזמן אמת את מה שאתם מכתיבים לו, בדיוק די מפתיע. לא הערכתי עד כמה התוכנות הללו יעילות עד שבני הבכור הפנה את תשומת ליבי לזו המובנית בתוך מערכת ההפעלה של המק שלי. מאז – אני בכלל לא שם לב לפיל שבחדר, כי אני יותר מדיי מתפעל מהקומביין שיושב על השולחן…–  אבל על כך, בהזדמנות אחרת.

נ.ב. תודתי נתונה לפרופ׳ נורית יערי, פרופ׳ גילה בלס, ד”ר נירה טסלר, ד”ר נורית ליסובסקי, ד”ר מילי מאס, ולמרצים והפרופסורים של ביה’’ס לעבודה סוציאלית של אוניב׳ ת”א על השימוש בדוגמאות מתוך עבודתם.

מודעות פרסומת

3 מחשבות על “הפיל שבחדר

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *