על האגודה | פעילויות | הצטרפות | צרו קשר | כתבו לאתר | English Site | בפייסבוק
עוד בקטגוריה זו:

אל ''המרחב''
מאמרים / איתי ליבנה
13/09/14
תגובות: 0  
אלים וז'אנר
מאמרים / ניקולה גריפית'
02/08/14
תגובות: 2  
האם איבדנו את העתיד?
מאמרים / ג'ו וולטון
22/02/14
תגובות: 4  
הכפירה הקדושה נוסח מאדים
מאמרים / אבינועם ביר
01/02/14
תגובות: 2  
האם יש ''גל חדש'' חדש במדע הבדיוני?
מאמרים / דייויד ברנט
29/06/13
תגובות: 4  
בילבו בגינס: גיבור עם חרב ומטפחת
מאמרים / רחל מרדכוביץ'
26/01/13
תגובות: 12  
מקדים את המאוחר
מאמרים / אהוד מימון
24/11/12
תגובות: 11  
הסכנות שבדמיון פעיל יתר על המידה
מאמרים / גיא חסון
13/10/12
תגובות: 4  
קולר האשמה
מאמרים / אהוד מימון
25/08/12
תגובות: 11  
הכוח חזק עמו
מאמרים / רז גרינברג
15/03/12
תגובות: 1  
המוסר הרובוטי של דוקטורוב
מאמרים / אהוד מימון
31/12/11
תגובות: 0  
השתלהבויות מדע בדיוני של ימים עברו
מאמרים / ג'יימי טוד רובין
08/04/11
תגובות: 5  
מחזור 2010
מאמרים / שריל מורגן
12/02/11
תגובות: 3  
גיהינום חדש
מאמרים / לורה מילר
28/08/10
תגובות: 4  
קדימה במלוא הקיטור
מאמרים / פול די פיליפו
24/04/10
תגובות: 8  

דג בבל
מאמרים / אהרון האופטמן
יום שישי, 24/08/2001, שעה 10:14

כשהעברית לא תהיה סינית עבור המלצר מטהיטי: כמה רחוק מימוש חזון התרגום הסימולטני הממוחשב?


מאמר זה פורסם (בשינויים קלים) בעיתון ''הארץ'', 21.8.01


את יושבת במסעדה בטהיטי. ''מה תשתי, גברתי?'' שואל המלצר בעברית צחה. לא, זה לא תרמילאי מישראל הממלצר קצת לפרנסתו, אלא יליד טהיטי מבטן ולידה - עברית היא בשבילו סינית. אבל העגיל שבתנוך אוזנך משמיע לך את דבריו בעברית, לאחר שתקשר עם המחשב שבחגורתך, המחובר אל ''המתרגם הסימולטני הרב-לשוני המקוון'' באינטרנט אשר זיהה במהירות את הניב המקומי. ''על מה אתה ממליץ ביום חם כזה?'' את שואלת, בעברית כמובן, והשיחה ממשיכה לקלוח (למלצר, שאינו חובב עגילים, יש משקפיים המתפקדים באופן דומה).
אתה נוסע במבואות שדה התעופה שארל דה-גול, ליד פאריס, תוהה איפה לעזאזל מחזירים את הרכב השכור. כל השילוט בצרפתית, כמובן, אך לחיצה קלה על כפתור מקרינה מול עיניך (בעזרת מערכת חכמה המשולבת בעדשות המגע שלך) את כל הנאמר בשלטים (המקושרים לאינטרנט) ו-''voitur location'' הופך באורח פלא ל''החזרת רכב''.

את המכשור הנ''ל לא תוכלו לקנות מחר בבוקר, אך סביר להניח כי אמצעים לתרגום סימולטני (או כמעט סימולטני) ממוחשב יכנסו בהדרגה לשימוש מעשי נרחב תוך עשר או עשרים השנים הקרובות. התרגום הממוחשב היה אחד הנושאים הרבים שנבחנו לאחרונה בסקר ''דלפי'' של המרכז לתחזית טכנולוגית ליד אוניברסיטת תל-אביב (בסקר שכזה מעריכים מומחים את מימושן של טכנולוגיות עתידיות). על פי ההערכה הקולקטיווית של מומחי טכנולוגיות מידע ותקשורת בארץ, בסביבות שנת 2009 צפויות מערכות תרגום ממוחשב עברית-אנגלית המשולבות ברשתות הטלפון, ברמה דומה לזו של תרגום סימולטני אנושי. סקר דומה שנערך ביפן לפני שנים אחדות (שהתייחס לתרגום אנגלית-יפנית) צפה כי הדבר יתממש בשנת 2011 (אלה מבין המומחים שעסקו בעצמם במחקר ופיתוח בתחום זה היו זהירים מעט יותר ו''דחו'' את המועד לשנת 2021. חלקם סברו כי הדבר לא יתממש לעולם).

תרגום סימולטני ממוחשב מכל שפה לכל שפה הוא חלום עתיק יומין עוד משחר נעוריו של המחשב. ''המתרגם האוניברסלי'' הוא אמצעי שגרתי במדע הבדיוני. באמצעותו יכולים בני תרבויות שונות המפוזרות ברחבי היקום לתקשר בקלות. בספר ההיתולי ''מדריך הטרמפיסט לגלאקסיה'' תאר הסופר המנוח דגלס אדמס יצור מופלא בשם ''דג בבל'': אתה תוקע אותו באוזן, והופ - אתה מבין את כל השפות שבעולם. המושג הפך מאז לנכסי צאן ברזל, וגם אומץ כשם לתוכנת Babelfish הצמודה למנוע החיפוש ''אלטה-ויסטה'', באינטרנט, והמתרגמת דפי-רשת משפות אחדות לאנגלית. עיון בתוצאות של תכנה זו עשוי להיות משעשע למדי - ולהצביע על הקושי העצום שבתרגום ממוחשב של טקסטים. יש לזכור כי אנו מדברים כאן על תרגום של דיבור טבעי, להבדיל מטקסט כתוב, כלומר - משימה קשה בהרבה.

מחקר אינטנסיבי בתרגום הממוחשב נעשה כבר בשנות ה-‏50, לאחר שפיתוח המחשבים הראשונים עורר את דמיונם של המדענים באשר ל''בינה מלאכותית''. התוצאות היו מאכזבות. אחד הראשונים שהתעמקו בהיבטים התיאורטיים של הבעיה היה הפילוסוף והבלשן המנוח פרופ' יהושע בר-הלל. מסקנתו היתה כי תרגום ממוחשב אינו מעשי. מדוע? ובכן, כדי לתרגם נכון לא די במילון ואף לא בזיהוי ההקשרים, ניתוח הסבירות של מילה מסוימת לבוא בעקבות מילה אחרת וכולי. המתרגם זקוק למידע נוסף, רב ועצום, שאינו מצוי בדברים הנאמרים עצמם, וליכולת החלטה על הרלוונטיות של כל פרט מידע כזה. נסו לדמיין תרגום של משפט כמו ''אני קונה את 'הארץ''', או ''הוא קרע את העיר'' - עם ובלי מרכאות. המחשב יצטרך להכיל מידע על שמות כל העיתונים כדי לתרגם כהלכה משפט פשוט שכזה, וגם אז הצלחתו לא מובטחת. זו, כמובן, רק דוגמה קטנה אחת מתוך מיליונים. שאלו את עצמכם - האם יוכל מחשב להתחרות בעמנואל לוטם בהמצאות כמו ''אבריינים'' ו''פגרטיקים''?...
לזכותו של בר-הלל יאמר כי הוא לא טען שתרגום ממוחשב אינו אפשרי באופן עקרוני, אלא כי הוא אינו מעשי, כיוון שהוא דורש מחשב בעל יכולת של מוח אנושי, כאשר את אופן פעולתו של זה האחרון איננו מבינים עדיין.
אך זה היה לפני כ-‏40 שנה, לפני ''חוק מור'' שאיבחן וניבא את הכפלת עוצמת המיחשוב של מעבד בגודל (או מחיר) נתון מדי שנה וחצי. כיום חוזים מדענים כמו ריי קורצווייל, מחלוצי זיהוי הדיבור הממוחשב, כי תוך 20 שנה תהיה למחשב שמחירו 1000 דולר עוצמת חישוב הדומה לזו של מוח אנוש וכי כל המיכשור בו אנו משתמשים בחיי היום יום יהיה מרושת. שיטות חישוביות כמו ''רשתות נוירונים'' או ''לוגיקה עמומה'' כבר מחקות היבטים מסויימים של חשיבה אנושית. תרגום סימולטני ממוחשב לצרכים מוגבלים אך מעשיים נחשב בר-מימוש, אף כי תרגום מושלם של שירה וספרות עודנו רחוק מאד. למעשה, קיימות כבר מערכות עובדות לצרכים ספציפיים בהם ניתן להסתפק באוצר מילים ומשפטים מצומצם יחסית. למשל, מערכת ''יאנוס'' שפותחה באוניברסיטת קרנגי-מלון בארה''ב, מתרגמת היטב באופן כמעט סימולטני שיחות בנושאי נסיעות ותיירות, בין אנגלית, גרמנית, יפאנית וספרדית. הקונסורצים הבינלאומי CSTAR עוסק בפיתוח נמרץ של מערכות פרקטיות של תרגום ממוחשב. מערכת הבטחון האמריקנית תומכת אף היא בפיתוח מערכות תרגום רב-לשוני המוגבלות לנושאים צבאיים, ומשולבות ב''מחשב לביש''. דגמים ראשונים כבר נוסו במספר הזדמנויות. הצי האמריקני הודיע לאחרונה על פיתוח תוכנה כזאת, לתרגום בין מספר שפות, לרבות סרבית, ערבית, קוריאנית, וסינית.

בהנחה שאבני הנגף הטכנולוגיות יבואו על פתרונן, מעניין לחשוב מה תהיה השפעתו של תרגום ממוחשב רב-לשוני ''אמיתי'' על החברה האנושית. במאמר מרתק שפרסם לאחרונה פרופ' שמואל ליימן-ווילציג מהמחלקה למדעי המדינה באוניברסיטת בר-אילן, הוא מנתח את ההשלכות התרבותיות, הכלכליות והפוליטיות העתידיות של ''מערכות תרגום אוטומטי סינכרוני'' (SATS). הוא צופה השלכות חשובות במיוחד על השפה האנושית עצמה. כיום מרבים לדבר על השתלטות האנגלית על העולם בגלל האינטרנט, ועל כפר גלובלי שבו השפות השונות נעלמות (מתוך כ-‏6000 הלשונות הקיימות, כשליש נמצאות על סף הכחדה). תרגום רב-לשוני משוכלל יפעל בכיוון הפוך: שימור השפות והניבים למיניהם, ועמם היחוד התרבותי של דובריהם. יש שיאמרו כי הדבר אינו בהכרח חיובי - הבדלים בשפה ובתרבות היו מקור לאינספור סכסוכים ומלחמות. אולם כאן מדובר בתופעה חדשה - תקשורת נוחה, מיידית וטבעית בין בני אדם ברחבי תבל, תוך שימור המגוון תרבותי העצום והמפרה. בעולם שבו כולם שומעים, רואים ומבינים מה יש לאחרים לומר ובמה הם מאמינים, גדול יותר הסיכוי לסובלנות ולהסכמה על ערכי יסוד משותפים - שלא לדבר על ההשפעה המובנת מאליה על קידום התיירות הבינלאומית.

זאת - אלא אם כן צדק דאגלס אדאמס בציניות המושחזת האפיינית לו: ''דג בבל'' הופך לסיבה עיקרית למלחמות בהסטוריה העתידית ההזויה שלו, שהרי אבוי לנו אם נבין באמת מה חושב כל אחד מאתנו על זולתו...



CSTAR : הקונסורציום הבינלאומי
יאנוס : מערכת תרגום
תרגום ממוחשב : הסטוריה קצרה
מאמר מרתק של פרופ' ש. ליימן-ווילציג (תקציר)
דג בבל

 
חזרה לעמוד הראשי         כתוב תגובה

 
מעניין מאד  (חדש)
שלמקו יום שישי, 24/08/2001, שעה 10:48
האם גם מאמר זה עבר גרך הארץ, או שמא הוא נכתב ישירות לאתר?

בכל מקרה, מאמר מעניין. נראה כי הבעייה העיקרית בתרגום סימולטני הוא אכן הבנת מקומו של תרגום ספציפי- מתי מילה א' אומרת ב' ומתי היא אומרת ג'. אבל זה עניין לפיתוח- לא דרישה לפריצת דרך.

פריצת דרך מעניינת (ועדיין רחוקה מאד) תהיה פיתוח של מתרגם אוניברסלי אמיתי, כלומר שישמע שפה חדשה לחלוטין ויוכל לתרגם אותה בלי נתונים מוקדמים (מן הסתם אחרי שיצבור אוצר מילים מספיק גדול ע''י הקשבה לשפה עצמה). אבל זה באמת מדע בדיוני.
   כתוב תגובה
והמתרגם האוניברסלי שלך...  (חדש)
איה יום שישי, 24/08/2001, שעה 11:42
בתשובה לשלמקו
יכול להיות פתרון מעולה בחקר ארכיאולוגי, לצורך פענוח כתבים בשפות עתיקות יותר. אבל כמו שאמרת: זה עדיין מדע בדיוני בלבד.
   כתוב תגובה
המאמר פורסם ב''הארץ''  (חדש)
אהרון ה. יום ראשון, 26/08/2001, שעה 10:30
בתשובה לשלמקו
בתאריך 21.8.01 (בשינויים קלילים). הדבר היה צריך להיות מצוין בראש במאמר, כמקובל. כנראה שההערה נשמטה במקרה (נכון, ניר?)
   כתוב תגובה
מסוג המאמרים המפיחים בי תקווה  (חדש)
רז גרינברג יום שישי, 24/08/2001, שעה 11:10
שלא נצטרך לחכות יותר מדי זמן לפלא הטכנולוגי המתואר בו...
   כתוב תגובה
אולי זה מדע בדיוני  (חדש)
דוד ש יום שישי, 24/08/2001, שעה 14:59
ואולי זה כבר קיים (מן הסתם) בגירסה מצומצמת יותר אצל הסי.אי.אי
   כתוב תגובה
לפרטים נוספים ראה wired  (חדש)
ג. שמעון יום שישי, 24/08/2001, שעה 15:36
מאמר טוב, נושא מעניין. למעוניינים בפרטים נוספים ראו:
   כתוב תגובה
הצחקתם אותי  (חדש)
טל כהן יום שישי, 24/08/2001, שעה 23:24
בעית התרגום היא AI-complete, דהיינו, לא ניתן לפתור בעיה זו ללא יצירת בינה מלאכותית אמיתית.

כמה מאותם מדענים שהימרו כי תרגום מאנגלית ליפאנית יתאפשר בשנת 2011 באמת מאמינים כי בשנה זו נגיע לבינה מלאכותית? רק חלקם הקטן (והאופטימי), לדעתי.

חוקר הבינה המלאכותית (או ''המדע הקוגניטיבי'', כפי שהתחום מכונה כיום) דאגלס הופשטטר, בספרו
Le Ton beau de Marot: In Praise of the Music of Language
- ספר טרחני מבחינות רבות אך באופן כללי מהנה לקריאה - מדגים עד כמה רחוק חלום התרגום הממוחשב (קל וחומר תרגום ממוחשב סימולטני!). תרגום ''מכאני'', ללא בינה מאחוריו, לא יוכל לפענח כל דבר ש''נגוע'' בטיפ-טיפה הומור, התחכמות, אירוניה או משחק מילים. נסו לתאר כיצד יראה הדיאלוג האנושי ללא כל אלה! וגם בלעדיהם, עדין תרגום מוצלח של משפטים שלמים, ולא קטעי-מילים או משפטי שבלונה, הוא בלתי-אפשרי (ללא בינה מלאכותית, כאמור).

המאמר גם מתעלם באלגנטיות משתי בעיות מיחשוב נוספות הכרוכות בתיאור שהוצג: זיהוי קול וייצור קול. תוכנות לייצור קול אנושי (כדי שהעגיל האמור יוכל להשמיע את הטקסט המתורגם) הן במצב עגום מאד כיום, וההתקדמות איטית: הבעיה קשה בהרבה ממה שחשבו לפני-כן (אחרת, לא היו זקוקים להקלטה של כל ספרה וספרה בקול אנושי כדי לספר לכם, ב- 144, מה מספר הטלפון המבוקש!). הוספת אינטונציה (רצינות, הומור, קלילות, כעס וכו') היא בכלל חזון מרוחק. לגבי זיהוי קול, תוכנות לזיהוי קול קיימות כיום, ואיכותן מפתיעה לטובה. עם זאת, הצלחת הזיהוי שלהן (באנגלית) נמוכה משל אדם ממוצע; הן כמעט ולא קיימות בשפות למעט אנגלית; והן לא מסוגלות להתגבר על מבטאים מסויימים (מכירות התוכנות האמורות בטקסס, למשל, נמוכות להפליא) וקולות מסויימים (כמו ילדים קטנים ונשים בעלות קול גבוה). כמה זמן יקח עד שהתוכנות האמורות תשוכללנה מספיק כדי לזהות את כל 6000 השפות והניבים המדוברים כיום? הרבה יותר סביר שהמערכת, אם וכאשר תתקיים, תוגבל למספר מצומצם של (לכל היותר) עשרות שפות, ואולי פחות. (שוב, בינה מלאכותית מלאה פותרת בעיה זו: תן לתוכנה ללמוד לבד את כל השפות הרלוונטיות).

בעיה מעניינת נוספת של תוכנות זיהוי קול: הן דורשות מקור קול ''נקי'' (ללא כל רעשי רקע). כלומר, אם בזמן שהמלצר מספר לך על סוגי היין, מלצר אחר שומט צלחת, קולות ההתנפצות ישבשו לחלוטין את פעולת זיהוי הקול. חמור מכך הוא המקרה של כמה דוברים בו-זמניים: כששני אנשים מדברים לידך, אתה מסוגל להחליט למי להאזין. גם אם נניח שהעגיל מצוייד בבינה מלאכותית מושלמת, כיצד *הוא* ידע למי אתה מעדיף להאזין? הרי אפילו מתרגם סימולטני *אנושי* יתקשה להחליט במקרים כאלה. וללא הבינה המושלמת האמורה, שני דוברים בו-זמנית (או סתם רדיו ברקע) פשוט ישבשו את פעולת הזיהוי לחלוטין.

לסיכום: Don't hold your breath.

החלק היחיד שהוא אכן ריאלי, וניתן למעשה למימוש כבר כיום, הוא שלטי מידע המחוברים לאינטרנט (או לרשת אחרת, למשל רשת אזורית בטכנולוגיית בלו-טות'), שניתן יהיה לקבל ''גרסה מתורגמת'' שלהם בלחיצת כפתור.

למידע נוסף על הספר האמור (שדן רק בבעית התרגום, ולא בבעיות האחרות שהצגתי כאן):
   כתוב תגובה
תגובה: הצחקתם אותי  (חדש)
מיקי שבת, 25/08/2001, שעה 1:03
בתשובה לטל כהן
מנסיוני המצב בדיוק הפוך ממה שאתה מתאר: יצירת קול אנושי המקריא טקסט (אם כי באופן חדגוני משהו, ללא דגשים וכו') נעשתה כבר לפני שנים רבות, ומאז חלו התפתחויות רבות, והתוצאות כבר לא רחוקות מדיבור אנושי, ובהחלט מעבר למה שצריך על מנת להבין טקסט מוקרא.

מצד שני, תוכנות זיהוי הקול הן בחיתוליהן - הן זקוקות לאימון רב, וכוח חישוב משמעותי, וכמו שציינת - ישנן בעיות רבות של סינון רעשי רקע (עוד יחסית פשוט), הבחנה בין מקורות ועוד.

כמעט תמיד ניתן להבין את תוכנות יצירת הקול (speech synthesis), בעוד שתוכנות זיהוי הקול טועות לא מעט פעמים - אפילו לאחר אימון.

אבל אני בהחלט מסכים עם הטענה הראשית שלך - בהחלט יש הרבה עבודה רבה גם בנושאים אלה - דבר שהמאמר לא מזכיר כלל.
   כתוב תגובה
ובנושא תוכנת זיהוי הקול...  (חדש)
איה שבת, 25/08/2001, שעה 2:40
בתשובה למיקי
עבדתי בעבר עם תוכנה כזו של חברה ישראלית. אבל הדבר שהכי גרם לפרצי צחוק בחברה בה עבדתי היה ''השוודי השיכור'' שזה כינוי לקול הגברי המונוטוני שעונה לשאלות הקוליות שלנו.
   כתוב תגובה
ימי הקומודור  (חדש)
ניר יניב שבת, 25/08/2001, שעה 3:10
בתשובה לטל כהן
כמעט כל משתמש קומודור 64 שעסק בתכנות יזכור, בחיבה ובגאון, את סופר-בייסיק.
לתכנה זו, שהיתה תוספת לשפת הבייסיק הבסיסית מדי של ה-‏64, היתה תכונה חביבה ביותר - פקודת SAY. פקודה זו ניצלה את הסינטיסייזר הפנימי המשוכלל של ה-‏64 על מנת להפיק דיבור. היה לה אפילו דמו נהדר, בו היא סיפרה בקול רם בשבח עצמה:
''סופר-בייסיק מאה שישים וארבע - אני יהול לעשות כל מה שתבקש ממני...'' (לא היה ח', מה לעשות)
לאחר מכן חיקתה התכנה פוליטיקאים ישראלים (רבין: ''אני יהול לדבר ע-ו-ד י-ו-ת-ר ל--א--ט...'') ועשתה שמייח באופן כללי.
התכנה ידעה לשנות אינטונציה בסוף משפט על מנת לבטא סיום/שאלה וגם פסיקים לא הביכו אותה. אמת, ההגיה היתה רחוקה משלמות, אך הבה נזכור כי מדובר בתכנה מסחרית פשוטה למחשב ביתי זול ונפוץ.

זה היה בערך בשנת 85'.

אין כל סיבה היום, 15 שנה לאחר מכן, לאי קיומה של תכנת דיבור *מושלמת*. גם אם אין כזו במציאות של ימינו (ולדעתי *יש*), הרי שאין כאן דבר שמליון דולר וכמה חודשי פיתוח לא יפתרו.
   כתוב תגובה
ימי הקומודור  (חדש)
טל כהן שבת, 25/08/2001, שעה 8:35
בתשובה לניר יניב
אם זה המצב, מדוע בסרט Final Fantasy נדרשו, לדעתך, מדובבים?

האמת היא שסינתזה ראשונית של קול נעשתה עוד לפני שנות השמונים -- ומאז המחקר בקושי מצליח להתקדם. נסה למשל את Narrator, תוכנית ההקראה (לשם עזרה למתקשים בקריאה) הנכללת עם חלונות 2000. תגלה שמצבה לא רחוק מאד ממצב פקודת SAY, בהתחשב בהשקעת המחקר של MS (הרבה מעל מליון, לדעתי) ובהבדלים בעוצמת המעבד. התוכנה לא מסוגלת אפילו לבטא את שמה שלה!

דוגמא נוספת ל-state-of-the-art היא התוכנה של Bell-Labs. תוכל לנסות אותה:
ולהבין כמה מעט התקדמות היתה מאז שנות השמונים. למעשה, ההתקדמות העיקרית היא במיפוי טקסט כתוב לצלילים (ב-SAY היית צריך לכתוב ב''שפה פונמית'', לא באנגלית; כאן הכתיבה היא באנגלית), והרבה פחות מכך - בייצור הצליל ממש. קשה לי להאמין שמישהו ישתכנע כי מדובר בדובר אמיתי... ואף יותר מכך קשה לי להאמין שקיימת תוכנת זיהוי קול שתוכל להבין את הפלט של תוכנת ייצור קול!
   כתוב תגובה
ימי הקומודור  (חדש)
ניר יניב שבת, 25/08/2001, שעה 12:21
בתשובה לטל כהן
אני משער כי סיבה טובה אחת לקיומם של מדבבים ב-''Final Fantasy'' הוא יחסי ציבור: שמות כדונלד סת'רלנד, אלק בולדווין, ג'יימס וודס וסטיב בושמי מוכרים למדי, וודאי יעזרו לקדם את מכירת הסרט (ותודה למאמרו של רז בעין הדג, http://fisheye.co.il/story.php3?id=522 , על הפרטים).

ניסיתי את התכנה של Bell ואני חייב לציין כי היא צעד גדול בכוון הנכון, אם כי בכמה תחומים סופר-בייסיק עולה עליה (סמני שאלה וקריאה, למשל). הבעיה האמיתי כאן היא חוסר פרמטרים. כאשר הקלט היחיד שאתה נותן לתכנה הוא המשפט עצמו ומעטפת כללית (האם מדובר בגבר, אשה, ילד וכו'), מובן כי התוצאה תהיה מונוטונית משהו. באם יכלול הקלט מעטפת פרטית לכל מלה, תוכל לקבל דיבור חי של ממש. לו היו אנשי Final Fantasy חפצים בכך באמת, אני בטוח כי היו יכולים לארגן דיבוב ממוחשב לתפארת מדינת ישראל.
   כתוב תגובה
ימי הקומודור  (חדש)
מיקי שבת, 25/08/2001, שעה 12:53
בתשובה לניר יניב
וחוץ מזה, המטרה ב-''עגיל מתרגם'' ובמה שדן בו המאמר אינו יצירת חיקוי מושלם של קול אנושי, אלא ביצירת קול המקריא וניתן להבינו. אחת המטרות של הפרוייקט של Bell Labs היתה ליצור קול שניתן להבינו דרך קוי טלפון, אשר מעבירים רוחב פס נמוך. ולדעתי הם הצליחו בכך. נשווה זאת לתוכנות זיהוי הקול, אשר עדיין לא מצליחות לזהות שום דבר ללא אימון, דורשות הקראה מדוקדקת ואיטית ועדיין טועות. (כמובן שזה הגיוני - לבן אדם קל יותק להבין שפה גם אם היא לא מדוייקת, מאשר למחשב).

ובעניין השוודי השיכור - האם הצלחתם להבין מה הוא אומר - הרי זאת המטרה כאן.

החוכמה תהיה ליצור באופן אוטומטי מעטפת לכל מילה בהתאם לתפקידה במשפט - כלומר לשלב חלק מהמידע שהתקבל בתהליך התרגום - ולהפיק ממנו מידע על הדגשה והטעמה.

מישהו זוכר את Dr. SBAITSO ? שעות של כיף.
   כתוב תגובה
אני משער  (חדש)
רז גרינברג שבת, 25/08/2001, שעה 13:35
בתשובה לניר יניב
כי גם אם סינטוז ממוחשב טוטאלי של הקולות - כלומר, כזה שזהה ב-‏100% לקול אנושי (לרבות ניואנסים של דיבור וכו') הוא אפשרי, הוא היה עולה לאנשי הפקת הסרט עוד כמה עשרות טובות של מיליוני דולארים, שלא היו להם (אחרי שהם זרקו מאה ומשהו מיליון על האנימציה). יש להבחין בין מה שאפשרי מבחינה טכנולוגית למה שריאלי כלכלית. השאלה המעניינת היא האם מערכת של זיהוי קולי ותרגום (כפי שמתוארת במאמר) מחייבת השקעה גדולה כמו סינטוז ממוחשב של קול אנושי. אם ישנה מערכת כזו (ושוב אני גולש פה לשלב המשאלות) שמתרגמת באופן מדוייק, העובדה שהיא תדבר בקול מונוטוני נשמעת לי כמו מחיר לא-גדול שאני בהחלט מוכן להשלים אתו.
ותגובה נוספת למיקי למטה - SBAITSO - כיף? אני מכיר אנשים שעד היום מאושפזים בשלוותה בגלל התוכנה הזו...
אחד מהם (אח שלי) כתב על החוויה ב-
   כתוב תגובה
אני מסכים אם טל כי בעית *הזיהוי*  (חדש)
ניר יניב שבת, 25/08/2001, שעה 13:45
בתשובה לרז גרינברג
קשה, וסביר להניח כי לא תפתר במהרה. אני חולק עליו רק בעניין הפקת הדיבור.

SBAITSO היה חביב מאד, אבל די עלוב לעומת סופר-בייסיק...
   כתוב תגובה
הערה קטנה ל- ''הצחקתם אותי''  (חדש)
aRIEL שבת, 25/08/2001, שעה 16:50
בתשובה לטל כהן
רוב הטיעונים שלך מציגים קשיים אמיתיים ומציאותיים אך הייתי רוצה להתייחס לעניין של 2 אנשים שמדברים לידך ולקושי להחליט את מי לתרגם.

לא צריך להחליט.

כבר היום כל מחשב ביתי יכול לבצע יותר מפעולה אחת בו זמנית. אז מדוע המתרגם הסימולטאני הממוחשב לא יוכל פשוט לתרגם את שניהם בעת ובעונה אחת תוך הפקת 2 קולות שונים?
(נסה זאת בעצמך. נסה להריץ 2 קיבצי קול או יותר במקביל על המחשב שלך.)

תן למאזין להחליט למי להאזין.

(דרך אגב, אם אותו מתרגם גם יוכל לחקות את הקולות של המדברים תוך כדי תרגום אז זה בכלל יהיה פטנט נחמד)

וחוץ מזה, רוב האנשים אם ינסו ויתרכזו יצליחו להאזין ולהבין 2 אנשים המדברים בעת ובעונה אחת.
חלוקת קשב כזו אינה בלתי אפשרית.
   כתוב תגובה
הערה קטנה ל- ''הצחקתם אותי''  (חדש)
טל כהן שבת, 25/08/2001, שעה 19:27
בתשובה לaRIEL
נכון, המוח האנושי יודע להפריד בקלות בין מקורות צליל שונים - למשל, שני אנשים המדברים במקביל - ולהתמקד רק באחד מהם. הדוגמה הקלאסית שמשתמשים בה במדע הקוגניטיבי בהקשר זה הוא ''שיחה בזמן מסיבת קוקטייל'' - אתה מצליח להבין את מי שמדבר אתך למרות כל רעש הרקע.

הבעיה עם זיהוי דיבור היא לא עוצמת מחשוב (תן עוד CPU, קבל זיהוי של שני דוברים במקביל) אלא ההפרדה בין הקולות השונים, כדי שנוכל לעבד אפילו רק אחד מהם. כרגע, אלגוריתמים להפרדה שכזו לא קיימים. אין אלגוריתמים לסינון - אפילו לא של רעשי רקע שבבירור *אינם* חלק מהדיבור, או של דיבור של מישהו בעל כל שונה לחלוטין.
   כתוב תגובה
הצחוק טוב לבריאות, אבל  (חדש)
אהרון ה. יום ראשון, 26/08/2001, שעה 10:44
בתשובה לטל כהן
יש לשים לב שהמאמר מבחין בין מה שניתן למימוש בטווח הקצר יחסית (10 - 20 שנה) לבין הצפון בעתיד הרחוק. כתוב במפורש שתרגום מושלם של שירה וספרות הוא רחוק מאוד.לשם כך אכן צריך בינה מלאכותית ''אמיתית''. (אגב, אין חוק טבע השולל את עצם היתכנותה).
לעומת זאת, תרגום של שיחה מוגבלת בנושא ספציפי (כמו סידורי נסיעה ותיירות) הוא דבר מעשי, ומתממש בימים אלה, לרבות זיהוי הדיבור והדיבור הסינתטי הנדרשים. מערכות מסוג זה יכולות להיות מועילות מאוד, גם אם אינן מושלמות ויש להן אחוז מסויים של שגיאות (גם מתרגם בשר ודם טועה, ולפעמים טועה מאוד). זה עדיין עדיף מאשר לא להבין כלום.
   כתוב תגובה
חברות וחברים, קצת יצירתיות!  (חדש)
אהרון ה. יום ראשון, 26/08/2001, שעה 16:25
תגובותיכם קצת אכזבו אותי. במקום להתעסק עם ביצועים טכניים של תוכנה זאת או אחרת, נסו לחשוב על ההשפעה החברתית - תרבותית של תרגום סימולטני ממוחשב אמיתי, ממש ''דג בבל''.זה הדבר המעניין, אם תשאלו אותי. המאמר עוסק בזה קצת, אבל זה המקום לפתח את הנושא הלאה. נו?!
   כתוב תגובה
צודק, צודק...  (חדש)
איה יום ראשון, 26/08/2001, שעה 17:05
בתשובה לאהרון ה.
בקריאת המאמר הדבר הראשון שעלה בראשי היה, מה היה קורה לו היתה טכנולוגיה כזו, שעוד חמישים שישים שנה היתה נחשבת לאמינה במיוחד ולא היו מערערים ביכולתה.
מה היה קורה לו נשיא אינדונזיה היה נפגש עם הרודן העירקי לשיחה ידידותית, האם הם היו מבינים זה את זה בדיוק כפי שהתכוונו להתבטא? או שהתרגום הסימולטני היה גורם לאי אלו אי הבנות כתוצאה ממנטליות שונה, ולמלחמת אינדונזיה עירק. :-)
   כתוב תגובה
חיים ומוות ביד הלשון, והמתרגם!  (חדש)
אהרון ה. יום ראשון, 26/08/2001, שעה 18:02
בתשובה לאיה
והנה חומר למחשבה: יש סברה שהטלת פצצת האטום על הירושימה נבעה עקב אי-הבנה בתרגום. מסתבר שבתגובה לאולטימטום האמריקני (בו נדרשה יפן להיכנע) השיב ראש ממשלת יפן ביפאנית, והשתמש במילה MOKUSATSU
שיש לה שתי משמעויות, שונות למדי. כך שאפשר היה לפרש את התשובה בשני אופנים: ''יפן שוקלת את הדרישה'' או ''יפן מתעלמת מהדרישה''. המתורגמן היפני בחר באפשרות השניה, וההמשך ידוע. (אני לא מבין מילה ביפנית, ואין לי מושג מה היה שם בדיוק -- קראתי את הסיפור המדהים הזה במאמר של פרופ' סם ליימו-וילציג).
אילו היה אז תרגום ממוחשב יעיל, אני מתאר לעצמי שהוא היה לפחות מציג את שתי האפשרויות, ומשאיר פתח להבהרה של הספק, אם היה ספק.
ואולי לא...מי יודע?
   כתוב תגובה
ערכתי חיפוש מהיר  (חדש)
רז גרינברג יום ראשון, 26/08/2001, שעה 19:33
בתשובה לאהרון ה.
במילון אנגלי-יפאני ולא מצאתי את המלה, אך ישנו סיפור מעניין דומה - מתקופה קצת יותר קרובה בהיסטוריה - שממחיש דווקא את הקושי בתרגום ניואנסים. כאשר חזר נשיא ארה''ב ג'ורג' בוש (האב) בראשית שנות ה-‏90 של המאה הקודמת ממסע ליפאן, הוא אמר בראיונות שעניק כי היפאנים הבטיחו ''לשקול ברצינות'' את הנושאים שהעלה בפניהם. באותו ערב מאוחר יותר היה שגריר יפאן בארה''ב עסוק בניסיונות נואשים להסביר לעיתונאים האמריקאים ש-''שוקלים ברצינות'' היא צורה מנומסת ביפאן להגיד ''תשכחו מזה''...
   כתוב תגובה
נו, אז זה באמת מעורר שאלה  (חדש)
Boojie יום ראשון, 26/08/2001, שעה 21:54
בתשובה לרז גרינברג
מעניינת, והיא, עד כמה תוכנות תרגום יהיו מסוגלות להתמודד גם עם הבדלים תרבותיים ועם פרגמטיקה של שפה? הרי חלק גדול מהבנת השפה נובע מהבנת הרקע התרבותי והפרגמטי שמאחוריה - מטאפורות, הקשרים, מקובלויות חברתיות וכדומה.
למשל, זכור לטוב הפרק ''דארמוק'' ממסע בין כוכבים - הדור הבא (הוקרן באייקון הקודם, אם אני זוכרת נכון) - תאווה לחיך לכל בלשן ומתרגם, שמספר על תרבות שכל השפה שלה מורכבת מתזכורות למצבים שהתרחשו בהיסטוריה שלה, ולכן למתרגם הממוחשב של האנטרפרייז אין שום סיכוי להצליח לתרגם את השפה בצורה יעילה. אז אמנם זו הקצנה, אבל הדוגמה היפנית לא כל כך רחוקה מכך. מה הסיכויים שתוכנת תרגום כזו תדע אכן לזהות מתי, מתוך הקונטקסט החברתי, ברור שיפני אומר ''לא'' (מה שיפנים לא ממש נוהגים להגיד בצורה ישירה), ומתי לא?
האמת, אם מגמת הכפר הגלובלי המתפשטת בזכות האינטרנט ותקשורת ההמונים תמשיך בדרכה, סביר להניח שבתוך כמה שנים ממילא ההבדלים התרבותיים יצטמצמו מאד. אבל זה לא דבר שאפשר לדעת אותו בוודאות.
   כתוב תגובה
זו אכן היתה טענתו של בר-הלל  (חדש)
אהרון ה. יום שני, 27/08/2001, שעה 9:02
בתשובה לBoojie
בראשית שנות ה-‏60, כאשר טען שתרגום ממוחשב ''אמיתי'' אינו מעשי - שהרי כדי לתרגם כל דבר בצורה מושלמת צריך מאגר מידע אינסופי עם כל הידע האנתרופולוגי, ההיסטורי, התרבותי, ומה לא.
ועדיין, זה לא שולל את התועלת שבתרגום ממוחשב פרקטי, עם יכולות מוגבלות, ולצרכים מעשיים.
אבל מענינת אותי הטענה (ההגיונית אך לא מוכחת) שתרגום ממוחשב אמיתי (בהנחה שיהיה קיים)אכן יפעל לשימור ההבדלים התרבותיים, והאם יהיו לזה עוד השלכות.
   כתוב תגובה
זה מעניין!  (חדש)
אהרון ה. יום שני, 27/08/2001, שעה 8:49
בתשובה לרז גרינברג
ככל הנראה היפנים השתמשו כאן באותו ביטוי שבו השתמש ראש ממשלתם בימי מלחמת העולם. רק שהפעם בוש לא הגיב בהפצצה גרעינית. נו, משהו בכל זאת השתנה בעולם...
   כתוב תגובה
זו בעיה בכל תרגום (תשובה לרז)  (חדש)
יעל יום חמישי, 04/10/2001, שעה 11:16
בתשובה לרז גרינברג
מי זוכר את הסערונת שהתחוללה אחרי שקלינטון אמר שהוא מחכה לבנימין נתניהו כמו שילד מחכה לצעצוע שלו?
כשדיברתי על זה עם קרובים אמריקאיים, הייתי צריכה להסביר להם כמה פעמים שבעברית המשפט הזה נשמע נורא ואיום עד שהם תפסו. פתגמים הם דבר מאוד קשה לתרגום.
דבר נוסף: הבדלי תרבות הם מדהימים. כשמדברים עם אמריקאים שאינם מכירים אותך, הם אוטומטית יתלהבו מכל דבר שתגיד או תעשה, מטעמי נימוס גרידא, אפילו אם הם חושבים שעומד מולם אידיוט מושלם.

אלה בעיות תרגום שבני אדם בקושי מצליחים להתמודד איתן. איך מחשב יעשה את זה?

כמו שאמרו כאן, התרגום היחיד שיכול להיות ריאלי בתקופה הקרובה, הוא באמת תרגום שלטים, ויש לי הרגשה שזה ילך לכיוון של שבבים שיושתלו בתוך השלטים ובהם תרגום למבחר שפות. התיירים יוכלו להעזר בשלט מיוחד שיקבל את המידע מהשלט, ויקרין את התרגום בשפה המתאימה.

בכל אופן, המאמר המעניין הזה הזכיר לי מאמר אחר שקראתי לפני כחמש שנים, ובו התנבא הכותב שתוך חמש שנים תעלם מקלדת המחשב מחיינו, כי תוכנות זיהוי הקול יגיעו לדרגה כזו שתאפשר לנו לתקשר עם המחשב רק בדיבור. ואני זוכרת שחשבתי ''נראה לכם?''.
   כתוב תגובה
אני לא יודעת.....  (חדש)
איה יום ראשון, 26/08/2001, שעה 21:04
בתשובה לאהרון ה.
....עד כמה זה יכולה להיות אפשרית הצגת שתי האפשרויות, כך התרגום יהיה מסורבל מעודף אפשרויות פירוש לכל מילה. אני רואה את זה כבר עכשיו בתוכנות תרגום קיימות.
   כתוב תגובה
חיים ומוות ביד הלשון, והמתרגם!  (חדש)
מיקי יום ראשון, 26/08/2001, שעה 21:17
בתשובה לאהרון ה.
[off-topic]
יש מספר שאלות רציניות לגבי הסיפור הזה.
הנה לינק לסיפור:
והנה מספר ספקות שהתעוררו במוחי הקודח:
1) מדוע בחר ראש הממשלה סוזוקי במילה דו-משמעית וארכאית להודעתו?
2) מדוע הסתמכו האמריקאים על תרגום של סוכנות הידיעות של יפן ולא על תרגום של המתרגמים האמריקאים?
3) מדוע הסתמכו האמריקאים על הודעה רשמית לציבור, ולא טרחו לפנות בערוצים חשאים יותר בנושא כזה חשוב?
4) עבר מעל שבוע בין ההודעה של סוזוקי לבין ההפצצה - ודאי שזה מספיק זמן לפתור את אי ההבנה הזו.

נראה לי שזו פשוט עוד אגדה אורבנית.

בחזרה לנושא!
   כתוב תגובה
חיים ומוות ביד הלשון, והמתרגם!  (חדש)
Xslf שבת, 17/08/2002, שעה 19:03
בתשובה למיקי
כנראה שכן. עוד אחת שמתווספת לאוסף של
   כתוב תגובה
חיים ומוות ביד הלשון, והמתרגם!  (חדש)
חסוי... יום ראשון, 02/11/2003, שעה 17:30
בתשובה לאהרון ה.
אדוני אני לא הבנתי את כוונתך אני רציתי לדעת מהו הפירוש של המשפט הזה של הפתגם רציתי לדעת מה הוא מסביר ומה הוא מסמל אלה הם שיעורים מאוד מאוד מאוד חשובים למחר והיום ה-‏2 לנובמבר אני חייבת לדעת מהו פירושו של הפתגם אם תוכל בבקשה תחזיר לי תשובה היום אם תוכל
בתודה ... חסוי...
   כתוב תגובה
אם זה כל כך דחוף לך  (חדש)
יעל יום ראשון, 02/11/2003, שעה 18:17
בתשובה לחסוי...
אולי תנסי באימייל... (ד''ר האופטמן פרסם אימייל בהודעתו).
   כתוב תגובה

הדעות המובעות באתר הן של הכותבים בלבד, ולמעט הודעות רשמיות מטעם האגודה הן אינן מייצגות את דעת או אופי פעולת האגודה בכל דרך שהיא. כל הזכויות שמורות למחברים.