نظام نموذج الترجمة الآلية

ترجمة: ليلي القاضى
الترجمة الآلية الفعالة أو الترجمة بمساعدة الحاسوب هي الآن حقيقة واقعة. ومع ذلك فإن معظم أنظمة الترجمة الآلية قادرة على دعم لغات قليلة فقط تصف هذه الورقة نموذجًا جديدًا ومحمولًا قادرًا على التعرف على المفردات غير المحدودة في 6 لغات مختلفة، و الترجمة بين أي متغيرين من 51، وتوليد الكلام في 21 يظهر اختبار تحدث اللغة الإنجليزية إلى الكورية، على الرغم من وجود عدة أخطاء أثناء مراحل التعرف على الكلام والترجمة، إلا أن الكلام الناتج كان لا يزال مقبولًا
المقدمة
الترجمة صعبة ومكلفة وخاصه بالنسبه للغات غير المألوفة نسبيًا، وقد حاولت عدت مشاريع بحثية حل هذه المشكلة بالتكنولوجيا. وقد تم تحقيق خطاب جيد الى حد ما دقة الخطاب، لكن معظم الأنظمة تقتصر على عدد قليل من اللغات والبعض يقتصر على المجالات المقيدة، على سبيل المثال: سياحة و سفر.
|
الجدول 1 دراسة موجزة لأبحاث الترجمة الآلية
النظام المرجع نتائج الدقة
-اسورا موريموتو واخرين 1993 اليابانية إلى الإنجليزية : اليابانية إلى الألمانية دقة عالية و كفاءة جيدة
-يانوس وايبل 1996 70% من الإنجليزية و الألمانية أو الأسبانية إلى الإنجليزية والألمانية والكورية و اليابنية أو الأسبانية
-مترجم اللغات المنطوقة كارتر 1997 72% من الانجليزية الى السويدية، 66% من الإنجليزية إلى الفرنسية، 62% من السويدية إلى الانجليزية، 47% من السويدية إلى الفرنسية، 74% من السويدية الى الدانمركية،55% من الإنجليزية إلى الدانمركية
-تزامن|المتحول ماتسوبرا 1999 82%-84.5%
-فيريمبيل والستر 2000 80% بين الإنجليزية و الألمانية واليابانية
-اترانس باستر 2001 80% بين الإنجليزية و الإيطالية و الأسبانية
– اوكمرا 2002 83%-87% بين الإنجليزية و اليابانية
-تريم اوغدن 2005 (25%) من الصينية إلى اليابانية، (31%) من الكورية إلى اليابانية، (56%) من الإنجليزية إلى اليابانية، (67%) من الإنجليزية إلى الصينية
-اتر ناكمورا 2006 750 من 990 بين الإنجليزية والصينية أو اليابانية
-ماستور مارتينز 2009 الانجليزية إلى الصينية :35: من الصينية إلى الإنجليزية 29
-ارقكم غاريو 2009 70%-80% بين الإنجليزية والعربية
و هنا، نحن نصف نظام النموذج الذي يستخدم البرمجيات التجارية و الحرة لتوفير الترجمة الفورية بين الإنجليزية غير المقيدة و 20 لغة مختلفة مع شراء برامج إضافية، يمكن زيادة عدد أزواج اللغة إلى 200 أو أكثر في اختبار محدود للنظام باستخدام اللغة الإنجليزية المنطوقة لتوليد الكلام الكوري، تظهر النتائج أن الجودة إعتبرت مقبولة لثلاثة مراجع موضوعية
آلية نموذج المترجم
قمنا بتطوير نظام جديد لترجمة الماكينة (دغل) لمكوناته الثلاثة الرئيسية (دراغون سيستمز – غوغل ترانزلات – ليرنوت & هوسبي)، وقد تم وصف كل جزء من هذه الأجزاء بمزيد من التفصيل أدناه.
• التعرف على الكلام – المرحلة الأولى من آلة مترجم، التعرف على الكلام. تم تنفيذه للغة الإنجليزية مع أنظمة التنين يتحدث بشكل طبيعي الإصدار القياسي الإصدار 6. ويمكن شراء البرنامج بحوالي 99 دولار أمريكي للاستخدام مع الهولندية والإنجليزية والفرنسية والألمانية والإيطالية والإسبانية، وقد أظهرت العديد من الدراسات دقة عالية، على سبيل المثال، أظهرت دراسة واحدة أن المتكلم يمكن أن يحقق دقة تصل إلى 99٪ في 150 كلمة في الدقيقة في ظل ظروف مثالية (دراغون، 2009)، ولكن الثانية وجدت دقة 80٪ فقط (بروتون، 2002)، وثالث وجدت 91 فقط ٪ معدلة للفهم (أيكن & وونغ، 2001).
• ترجمة اللغة — كانت المرحلة الثانية تنفذ مجانًا على شبكة الانترنت التي توفر ترجمة تلقائية بين اي 51 لغة مختلفة في 2550 لغة مزدوجة (اوتش 2009) يمكن الحصول على ترجمة جيدة من بين معظم لغات اوروبا الغربية، حتى عندما تكون الترجمة ضعيفة غالبًا يمكن للمستخدمين القول “ما الذي فعل لمن”(غاريو 2009)
• تركيب الكلام–تم تنفيذ المرحلة الثالثة مع وحدات تحويل النص إلى كلام مجانية و ليرنوت و هوسبي التي توفر أصوات الذكور والإناث للغة الهولندية والإنجليزية والفرنسية والألمانية والإيطالية واليابانية والكورية والبرتغالية والروسية والإسبانية ويمكن شراء وحدات إضافية للغات مثل البولندية والصينية، ويمكن تنفيذ العديد من وحدات أخرى مع مكونات السير مماثلة. على سبيل المثال، يمكن استخدام الوحدة الهولندية للغة الأفريكانية والدنماركية والنرويجية والسويدية. الإيطالية للرومانية؛ الروسية للبيلاروسية، و البلغارية، و الأوكرانية، والصربية؛ والاسبانية للفليبينية والجاليكية. وبالتالي، يمكن دعم 11 لغة إضافية مجانًا، ليصبح المجموع 21
تم دمج هذه المكونات على كمبيوتر سطح المكتب ل ميكروسوفت ويندوز اكس بي باستخدام فيسوال باسيك 2008، وإذا تم شراء جميع إصدارات اللغة الست من برنامج سي ار، يمكن تحقيق ما يقرب من 120 تركيبات زوج اللغة على الفور للترجمة.
شكل (1)
ويبين الشكل (1) شاشة عينة من نظام للترجمة بين الإنجليزية والكورية. مع أنظمة دراقون التي تعمل في الخلفية، يضع المستخدم ببساطة المؤشر في مربع النص العلوي ويبدأ الحديث إلى ميكروفون. يقوم برنامج سي أر تلقائيًا بنسخ النص بعد نطق مجموعات من بضع كلمات. إذا تم إجراء أخطاء التعرف، يمكن للمستخدم تحرير النص قبل النقر على زر “ترجمة” المستخدم لديه خيار تحرير النص المترجم قبل النقر على زر “الكلام” للكمبيوتر لتوليد الترجمة الصوتية.
التقييم
شخص بالغ وذكور،و أمريكان و متحدث اللغة الإنجليزية (الموضوع 1) وراشدًا وأنثى وهندية و اللغة الإنجليزية (الموضوع 2) يتم تدريب نظام دراجون بشكل فردي للتعرف على أصواتهم من خلال حوالي ساعة من التدريب. بعد ذلك تحدث كل من 42 عباراة السفر (188 كلمة) باللغة الإنجليزية من فودور (كما هو مبين في الجدول 2
Original | SR – Subject 1 | Korean Translation after SR |
How much does that cost? | How much does that cost? | 비용은 얼마입니까? |
At what time does the store open? | At what time does the store open? | 몇 시에 가게를 열어 무엇입니까? |
At what time does the store close? | At what time does the store close? | 몇시에 저장소를 닫습니까? |
What would you like? | What would you like? | 무엇을 드시겠습니까? |
Can I help you? | And I help you? | 그리고 내가 도와 줄까? |
I would like this. | I would like this. | 제가하고 싶습니다. |
Here it is. | Here it is. | 여기입니다. |
Is that all? | Is that all? | 그게 다야? |
I would like to pay in cash. | I would like to pay in cash. | 내가 현찰로 지불하고 싶습니다. |
I would like to pay by credit card. | I would like to pay by credit card. | 신용 카드로 지불하고 싶습니다. |
Can I order this online? | Can I order this online? | 제가 온라인으로 주문해도 될까요? |
Where is there a good restaurant? | Where is there a good restaurant? | 거기 어디에 좋은 식당입니까? |
A table for 2, please. | A table for 2, please. | 2 테이블하시기 바랍니다. |
The menu, please. | The menu, please. | 메뉴에서하시기 바랍니다. |
The wine list, please. | The wine list, please. | 와인리스트 부탁합니다. |
I would like something to drink. | I would like something to drink. | 마실 것 좀하고 싶습니다. |
A glass of water, please. | A glass of water, please. | 물 한 잔 부탁합니다. |
Do you have a vegetarian dish? | Do you have a vegetarian dish? | 당신이 채식 요리를 가지고 있나요? |
I like my steak well done. | I like my steak well done. | 제가 스테이크를 좋아 잘했어. |
I like my steak rare. | I like my steak rare. | 내 스테이크 희귀 좋아. |
I had a wonderful time. | I had a wonderful time. | 난 멋진 시간을했다. |
This is my girlfriend. | This is my girlfriend. | 이건 내 여자 친구입니다. |
This is my boyfriend. | This is my boyfriend. | 이것은 제 남자 친구입니다. |
This is my friend. | This is my friend. | 이쪽은 제 친구입니다. |
Where do you live? | Where you live? | 넌 어디에 사니? |
I live in New York. | I live in New York. | 난 지금 뉴욕에 살고있다. |
It’s nice to meet you. | It’s nice to meet you. | 만나서 반갑습니다. |
What is your name? | What is your name? | 이름이 무엇입니까? |
How are you? | How are you? | 어떻게 지내세요? |
Is it near? | Is it near? | 근처에 있나요? |
Is it far? | Isn’t far? | 그리 멀지 않은 가요? |
Go straight ahead. | Go straight ahead. | 똑바로 말하라. |
Go that way. | Do that way. | 그런식으로 마십시오. |
Turn right. | Turn right. | 우회전. |
Turn left. | Turn left. | 좌회전. |
Take me to this address. | Take me to this address. | 이 주소로 해주세요. |
What is the fare? | What is the fare? | 어떤 요금입니까? |
Stop here. | Stop here. | 여기를 중지합니다. |
I would like a map of this city. | I would like a map of this city. | 난이 도시의지도를하고 싶습니다. |
Where are the taxis? | Where are the taxis? | 택시는 어디입니까? |
Where is the subway? | Where is the subway? | 지하철은 어디입니까? |
Where is the exit? | Where is the exit? | 출구는 어디인가? |
الجدول 2 نتائج التعرف على الكلام و ترجمته (يظهر خطأ عريض)
النص الأصلي للموضوع – التعرف على النطق -الترجمة الكورية بعد التعرف على النطق
-كم التكلفة؟ كم التكلفة؟
-في أي وقت يفتح المحل؟ في أي وقت يفتح المحل؟
-في أي وقت يقفل المحل؟ في أي وقت يقفل المحل؟
-ما الذي تفضلة ؟ ما الذي تفضلة ؟
-هل يمكنني مساعدتك؟ هل يمكنني مساعدتك؟
-أفضل هذا أفضل هذا
-ها هو ها هو
-هذا كل شي؟ هذا كل شي؟
-أفضل الدفع نقدا افضل الدفع نقدا
-أفضل الدفع بالبطاقة الائتمانية أفضل الدفع بالبطاقة الائتمانية
-هل بامكاني طلبه عبر الانترنت هل بامكاني طلبه عبر الانترنت
-أين يوجد المطعم الجيد أين يوجد المطعم الجيد
-الجدول 2 فضلا الجدول 2 فضلا
-من فضلك أعطني قائمة الطعام من فضلك أعطني قائمة الطعام
-من فضلك قائمة النبيذ من فضلك قائمة النبيذ
-أريد ان أشرب شيئًا أريد أن أشرب شيئًا
-كأس من الماء من فضلك كأس من الماء من فضلك
-هل لديك طبق من الخضار؟ هل لديك طبق من الخضار؟
-أفضل شريحة لحم مطبوخة جيدًا أفضل شريحة لحم مطبوخة جيدًا
-أفضل شريحة لحم غير مطبوخه جيدًا أفضل شريحة لحم غير مطبوخه جيدًا
-قضيت وقت ممتع قضيت وقت ممتع
-هذه صديقتي هذه صديقتي
-هذا صديقي هذا صديقي
-هذا صديقي هذا صديقي
-أين تعيش أين تعيش
-أعيش في نيويورك أعيش في نيويورك
-سعدت بلقائك سعدت بلقائك
-ما اسمك؟ ما اسمك؟
-كيف الحال؟ كيف الحال؟
-هل هو قريب؟ هل هو قريب؟
-هل هو بعيد؟ هل هو بعيد؟
-اذهب إلى الأمام اذهب إلى الأمام
-اذهب من هذا الطريق اذهب من هذا الطريق
-انعطف يمين انعطف يمين
-انعطف يسار انعطف يسار
-خذني لهذا العنوان خذني لهذا العنوان
-ماهي الأجره؟ ماهي الأجره؟
-قف هنا قف هنا
-أريد خريطه لهذه المدينة أريد خريطه لهذه المدينة
-أين سيارة الأجرة؟ أين سيارة الأجرة؟
-أين المترو؟ أين المترو؟
-أين المخرج؟ أين المخرج؟
كما هو مبين أعلاه، برنامج التعرف على الكلام لم يتعرف على بضع كلمات، وحقق الموضوع 1 معدل خطأ كلمة من 2.1٪ و النتيجة بليو (بابينيني، وآخرون، 2002) من 95.6 (بحد أقصى 100). البرنامج لم تعترف العديد من كلمات الموضوع 2، ومع ذلك، قالت أنها حققت نتيجة بليو من 70.5 فقط إن أخطاء التعرف على الكلام شائعة في أبحاث الترجمة الآلية ، حيث أن دراسة واحدة (أوكومورا، وآخرون، 2002) كان لها معدلها الخطأ في الكلمة 14٪ -15٪، وآخر (وايبل، 1996) كان معدل خطأ الكلمة 29٪. يمكن أن تؤثر هذه الأخطاء بشكل كبير على مرحلة الترجمة التالية.
طلب من ثلاثة متحدثين كوريين أصليين تقييم الترجمات للفهم باستخدام المقياس:
1 = لا يفهمون على الإطلاق، 2 = في الغالب لا يفهمون، 3 = يساء فهمهم أكثر من الفهم، 4 = لا رأي، 5 = فهم أكثر من سوء الفهم، 6 = فهم في الغالب، 7 = فهم واضح جدا. بالنسبة للموضوع 1، كان متوسط درجة الفهم 6.02 مع انحراف معياري 1.25. وباستخدام نفس المقياس، سئلوا أيضًا عن مدى فهم جميع التعليقات معًا، وبلغ متوسط النقاط 4.67. وباستخدام هذه العتبة، كان الفهم أعلى بكثير من المطلوب (t = 6.68، p <0.001). بالنسبة للموضوع 2، كان متوسط الفهم 4.96 فقط مع انحراف معياري 2.08، وذلك في المقام الأول لأنه لم يتم التعرف على الكثير من الكلمات خلال مرحلة التعرف على الكلام. ومع ذلك، فإن الفهم لا يزال أعلى من المطلوب.
وبالنسبة لمرحلة تركيب الكلام، طلب من الثلاثة تقييم الجمل الواردة في الجدول 3، التي يتحدث بها النظام باللغة الكورية.
English equivalent | Spoken Korean |
How have you been doing? | 어떻게 지내셨습니까? |
How many cities in the U.S.A. have you visited? | 미국 내 얼마나 많은 도시를 방문했습니까? |
Is it going to snow a lot tomorrow? | 내일 눈이 많이 옵니까? |
When do you plan to go back to Korea? | 언제 한국으로 돌아갈 계획입니까? |
الجدول 3 تعليقات لتقييم مرحلة تركيب الكلام
مكافئة اللغة الانجليزية تحدث الكورية
-كيف الحال؟
-كم عدد المدن في الولايات المتحدة الأمريكية التي زرتها؟
-هل الثلج سيتساقط كثيرًا غدًا؟
-متى تخطط للعودة إلى كوريا؟
لكل جملة منطوقة، أعطى كل مستخدم درجة النظام الكمال من 7 على مقياس 1 إلى 7، لكنها لاحظت أن صوت الإناث بدا وكأنه شخص يقرأ كتابًا بدلًا من التحدث في محادثة. حتى كلمات غير معروفة مثل صوت الحيوانات قد تجعل، عندما كتبت باللغة الكورية، سمعت بشكل صحيح.
المناقشة
تعاني الدراسة من عدة قيود.
-أولًا، تم استخدام اثنين فقط من الناطقين باللغة الإنجليزية وثلاثة فقط من نتائج تقييم الكوريين . قد يولد متحدثون آخرون أخطاء التعرف على الكلام المختلفة، ويمكن أن يكون للمقيمين الآخرين آراء مختلفة حول الفهم.
-ثانيًا، تم اختبار لغة واحدة فقط (اللغة الإنجليزية) ولغة واحدة (كورية). من المحتمل أن تكون الدقة مع تركيبات اللغات الأخرى مختلفة (أيكن & بارك، 2010؛ أيكن وآخرون، 2009). لم يتم اختبار النظام في الميدان. الخلفية الضوضاء يمكن أن تقلل بشدة من جودة التعرف على الكلام.
-وأخيرا، فإن النظام ليس مكتفيًا ذاتيًا، لأنه يعتمد على الوصول إلى الإنترنت لخدمة الترجمة من غوغل. ولذلك فإن الانظمة ليست محمولة تمامًا، ومع ذلك، فإننا نعتقد أن هذه الدراسة التجريبية توضح إمكانات النموذج الأولي. أنها قادرة على توليد الكلام مع الفهم الكافي للغة الإنجليزية إلى الكورية، وعدد كبير من تركيبات اللغة ممكنة. مع برمجة إضافية، يمكن استيعاب المزيد من اللغات عن طريق تحويل النص إلى الصوتيات، وضبط الملعب والتوقف، يمكن للسواحلي التحدث باستخدام وحدة تحويل النص إلى الإنجليزية، على سبيل المثال. وبالتالي، يمكن استيعاب 30 لغة أخرى أو نحو ذلك متوفرة حاليًا مع ترجمة جوجل.
وباستخدام 11 وحدة من وحدات اللغة العربية المختلفة من فيا فوايس (الصينية والهولندية والإنجليزية والفرنسية والألمانية والإيطالية واليابانية والكورية والبرتغالية والإسبانية والسويدية)، يمكن أن تصل الى 11 × 50 = 550 تركيبة زوجية
وبالإضافة إلى ذلك، حتى لو كان النظام لا يمكن أن يتكلم حاليًا بعض اللغات، مثل العربية والهندية، وأنها قادرة على توليد النص في هذه اللغات. يمكن للناس توليد المزيد من الكلمات التي تتحدث مع التعرف على الكلام أكثر من الكتابة، ويمكن قراءة النص المترجم بدلًا من سماعه.
الخلاصة
وقد وصفت هذه الورقة نظام النموذج الأولي لتفسير الآلات التي تدعم حاليًا 20 من تركيبات زوج اللغة، ولكن لديه القدرة على ما يصل إلى 550. في اختبار الترجمة الفورية من اللغة الانجليزية الى الكورية كان هناك أخطاء شديدة بسبب ضعف التعرف على الكلام، لكن كانت نتيجة الحديث مازالت مترابطة بما فيه الكفاية ويمكن أن تؤدي تركيبات اللغات الأخرى إلى نتائج أسوأ، ولكن من المرجح أن ينتج الكثير منها نتائج أفضل، خاصة عند الترجمة بين لغات أوروبا الغربية.
المصدر:
http://www.translationdirectory.com/articles/article2245.php
أحدث التعليقات