הפיל שבחדר

הפיל שבחדר

(blog.wwpaul.com :מקור)

בעבודתי מול לקוחות בשנים האחרונות, אני מודע תמיד לנוכחותו של יצור אפור עם חדק ארוך, שהתחיל קטן למדיי וחמוד, אך גדֵל עם השנים למימדים שכבר לא ניתן להתעלם ממנו – ובכ’”ז איש לא מזכיר אותו או שואל עליו. אני מדבר, כמובן, על

Google Translate

image

על הפרוייקט של גוּגל טראנסלייט נודע לי לראשונה ב–2008, ממאמר על הבלשן פראנץ יוסף אוֹך, שגוּייס כמה שנים לפני-כן ע”י גוגל לפתח את המערכת אחרי שזכה בפרס ראשון בתחרות לתרגום מכונה (המונח הרשמי ל׳תרגום ע”י מחשב׳), שנערכה בחסות סוכנות מיזמי המחקר המתקדם של משרד ההגנה האמריקאי ב–2003. השיטה של אוֹך מתבססת על ניתוח סטטיסטי של מאגר גדול של טקסטים, במקום על כללים, כפי שהיה מקובל עד אז בתוכנות תרגום אחרות. מכאן הקשר הטבעי לגוּגל, המחזיק במאגר ענק של טקסטים ברוב שפות העולם. למטרה זו, גוּגל טראנסלייט משתמש בראש ובראשונה בטקסטים בפרסומים של האו”ם, בכל שש השפות הרשמיות.

לנוכח המשאבים ויכולת התיכנות של חברת גוּגל, סימנתי לעצמי את ההתפתחות הזו כאיום אפשרי לעתיד, אבל לא סיבה לדאגה של ממש. לנגד עיניי ראיתי את הדוגמאות הראשונות תרגום ממוחשב, כגון הפסוק הידוע מהברית החדשה:

The spirit is willing, but the flesh is weak

אשר תורגם

׳הוודקה טובה, אבל הסטייק – על הפנים׳.

ובכ”ז, מחובתו של כל בעל עסק או עצמאי להיות מודע תמיד לאיומים על מחייתו, ולהיערך בהתאם. גם אם אני יודע שיש לתרגום מכונה מגבלות רציניות, לא כל הלקוחות יחשבו כך, וחלקם, לפחות, יתפתו לנסות את השירות של גוגל – או תוכנות תרגום אחרות – ע”מ להמנע מההוצאה על מתרגם אנושי, או לפחות למזער אותו – וטבעי שכך.

לכן, לפני כשנתיים-שלוש, תוך כדי עבודה, התחלתי לערוך ניסויים מזדמנים על היכולות של גוגל טראנסלייט לגבי טקסטים שונים שנתבקשתי לתרגם, ולעקוב אחר התוצאות.

למדתי שגוגל טראנסלייט הוא הרבה יותר טוב מהדורות הראשונים של תרגום מכונה –  לעיתים (רחוקות, אמנם), בצורה מדאיגה::

׳דיאלקטיקה זו בין שני הנרטיבים הסותרים לכאורה׳

תורגם נכון ל–

This dialectic between two seemingly contradictory narratives

ובמקרה אחר לחלוטין, הוא הפגין שהוא אפילו יודע מה זה ׳פיצוציה׳:

האם בשנה האחרונה השתמשת ב’סמי פיצוציות׳

תורגם ל

In the past year, have you also used Sammy convenience stores?

הוא גם הוכח כשימושי לאיוּת של שמות של חוקרים המצויינים בהפניות של מאמרים אקדמאיים, במקרים שבהם הלקוח לא סיפק זאת בעצמו. אך לרוב, התרגום של גוגל ושל תוכנות תרגום אחרות לוקה במספר מגבלות בסיסיות, שחלקן אולי תיפתרנה במרוצת הזמן, וחלקן – במיוחד אלו המיוחדות לעברית, מעצם טבעה, או בגלל היעדר הניקוד – לא יתוקנו עד לפיתוח אינטליגנציה מלאכותית די נרחבת.

ניתן לחלק את הטעויות למספר קטגוריות:


א) בלבול בין שמות לבין מילים. כך, למשל:

התרגום ב׳גוגל טראנסלייט׳ הטקסט במקור
A stage designer by name of Hello Grandpa מעצב במה בשם שלום סֶבָּא
The actor in real life השחקן חיים אמיתי
Long live Schwartz אריה ארוך וחיה שווארץ
Not quiet on Mario  שוקט על שמריו
A husband and a visa and the whole host of heaven לבעל ולאשרה ולכל צבא השמיים

ועוד דוגמאות למכביר, עד שהדבר דומה לציד דגים בחבית – אין בכך חכמה או אתגר

לעיתים, הטעות גדולה אך נדמה שהתוכנה מנסה להרשים בבקיאותה בהיסטוריה או תרבות – למשל, ׳התבוננות בקרתית׳ מובנת –כ

observation of McCarthy

או ׳מאבק של נערה בדוד רודן׳ מתורגם כ

Struggle of a girl in David Rodin

ב) טעויות בגין היעדר ניקוד

אלו טעויות דומות לסוג הראשון, די צפויות, וייחודיות לשפות כגון עברית וערבית שבהן בד’’כ לא כותבים עם ניקוד – וקשה לראות כיצד הן יתוקנו בעתיד בלי רמה גבוהה של אינטליגנציה מלאכותית.

גם כאן יש אינספור דוגמאות, כגון:

התרגום הטקסט במקור
A family member of the efforts ׳בן המשפחה של המאמצים׳
one man in space, two drums ׳גבר אחד מחלל, השני מתופף׳
the dilemma of the facts ׳ההתלבטות של העובדות׳
landscape architects and designers of genes ׳אדריכלי הנוף ומעצבי הגנים׳
the image of Mary as a woman wore that here ׳דמותה של מריה כאישה נעלה שהנה
susceptible to risk factors than boys and bags גורמי סיכון בהשוואה לנערים ותיקים

’וכיו’’ב. המעניין הוא, שגם כאשר מציינים את הניקוד, זה לא עוזר, כי מסתבר שהתוכנה אינה  רואה  ואינה מבחינה בניקוד. כך, תורגם כ–

Yvonne and strangeness that arise in the face of ׳האיבּוּן והזרות המתעוררת לנוכח׳

ג) טעויות ברמת ההבנה

. אלו אולי סוג הטעות הנפוץ ביותר, שהרי התוכנה אינה ׳מבינה׳ דבר. לדוגמא:

התרגום הטקסט במקור
knowledge of visitors about their work ׳דעת המבקרים על יצירותיהם׳
ease the steering by the actors ׳להקל על ההיגוי בפי השחקנים׳
The Apostle at Corinth ׳השליח מקורינת׳
It creates a perfect nose יוצר אפי למופת
the attacker culture of the spectacle התוקף התרבותי של המחזה
social shrubs for mothers שיחים חברתיים לגבי אימהות
Babylonian Talmud, hydrating mask תלמוד בבלי, מסכת שמחות
social terrorists’ efforts of the mothers גורמים חברתיים המחבלים במאמצי האמהות
Heroes kiss my brother ׳אחי הגיבורים לנשק׳

וכיו’’ב

ד) בלבול מוחלט בהתמודדות עם מבנה משפט עברי שאינו מקובל באנגלית

  צייר הבמה סיגל לעצמו את כוונתו המונומנטלית של הבמאי׳ | Draw stage adopted completely the intention monumental director

ה) לעיתים – ומסיבות לא מובנות – התרגום הוא ההיפך הגמור של המקור, או משהו מוזר):

התרגום הטקסט במקור
Oedipus Rex was the first performance ׳הצגת אדיפוס המלך לא היתה ההצגה הראשונה
Aloni started the audience without the power of theatricality ׳אלוני הפעיל את הצופים בכוחה של תאטרליות חסרת–תקדים
since the 70th century מאז שנות השבעים של המאה

מעבר לכל אלה, יש גם מקרים רבים של השמטות של מילים, וכמובן אי-תפיסה של טעויות דפוס, הברורות למתרגם האנושי.

ולמרות כל זאת, ייתכן ואתם תוהים: ׳בהנחה שהיית תופס את כל הטעויות הללו, לא תשתמש בגוּגל טראנסלייט ודומיו ליצירת טיוטה ראשונית?׳

ובכן, זו שאלה ששאלתי את עצמי, ולשם כך ערכתי ניסויים עם מאמרים וספרים שונים, תוך מדידת התפוקה בסוף התהליך, מבחינת מילים לשעה. גיליתי שהחיסכון בזמן לכאורה ביצירת טיוטה ראשונית אבד לחלוטין ויותר בתהליך הבדיקה והעריכה שלה –  וגרוע מכך, שפת ה׳תרגומית׳ של הטיוטה מנעה ממני ׳לשמוע׳ בראש את האנגלית המתבקשת, כך שנאלצתי לתרגם את הטקסט מחדש ע”מ ליצור את הנוסח הרצוי. ולראיה, הנה דוגמא של קטע מתוך פיסקה של ספרה של פרופ׳ גילה בלס על אמנים ישראליים מתנועת ׳אופקים חדשים׳ בשנות החמישים והששים של המאה העשרים.

בתרגום שלי (באופן עצמאי)׳ בתרגום מכונה
I don’t think that Abrahamovitch set out to describe the exoticism that attracts many artists to the ‘East’. It seems to me that the childish, innocent element in his internal outlook rejoiced at the spontaneous encounter with the surrounding Oriental world. His paintings are full of beguiling painterly details, merging together into a colourful tapestry that is reminiscent—especially in its figures—of folk art. I do not think Abramovich wanted to describe the exoticism that attracts many artists to the East. It seems to me that the cause of the innocent child’s inner perception IDE spontaneous meeting with the world around Oriental. Copious pictures nice picturesque details, fusing coloured rug that recalls — particularly the characters — the folk art.

אילו נאלצתי לעבוד עם תרגום המכונה, הניסוח הקלוקל של הטקסט היה רק מפריע לי להגיע לנוסח של התרגום העצמא. למניעת התופעה, אני נאלץ לתרגם את הקטע מחדש בעצמי – אז מה הרווחתי בזה?

לסיכום, אם אתם משתמשים בגוגל טראנסלייט או תוכנות תרגום אחרות, כדאי שתהיו מודעים לסכנות, וכן לאפשרות שהתוצאה יכולה למנוע יצירת תרגום טוב.

לשאלה, הייתכן שיום אחד גוּגל טראנסלייט יהיה חכם מספיק להבין נכון ולתרגם לאנגלית אידיומטית, אומָר רק שייתכן, ביום מן הימים – אבל יש עוד כברת דרך ארוכה, ואם התוכנות תגענה לדרגה כזו של אינטליגנציה מלאכותית, יהיו לנו הרבה סיבות לדאוג.

בינתיים, אם בזירוז תהליך התרגום עסקינן, יש טכניקה הרבה יותר שימושית, והיא היכולת של מחשבים בימינו לשכתב בזמן אמת את מה שאתם מכתיבים לו, בדיוק די מפתיע. לא הערכתי עד כמה התוכנות הללו יעילות עד שבני הבכור הפנה את תשומת ליבי לזו המובנית בתוך מערכת ההפעלה של המק שלי. מאז – אני בכלל לא שם לב לפיל שבחדר, כי אני יותר מדיי מתפעל מהקומביין שיושב על השולחן…–  אבל על כך, בהזדמנות אחרת.

נ.ב. תודתי נתונה לפרופ׳ נורית יערי, פרופ׳ גילה בלס, ד”ר נירה טסלר, ד”ר נורית ליסובסקי, ד”ר מילי מאס, ולמרצים והפרופסורים של ביה’’ס לעבודה סוציאלית של אוניב׳ ת”א על השימוש בדוגמאות מתוך עבודתם.

4 thoughts on “הפיל שבחדר

  1. Pingback: הכירו את תָרְגוֹ – עוזרי ומחליפי לעת מצוא – רשומות לאור־סתיו

  2. Pingback: פדיחות תרגום סיניות – רשומות לאור־סתיו

  3. Pingback: לא זינה ולא צוקרברג – אל פדיח

  4. Pingback: המרצע הוא חתול – אל ףדיח

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.