سفارش ترجمه متون عمومی و تخصصی



سفارش ترجمه متون عمومی و تخصصی

سفارش ترجمه متون انگلیسی، ترجمه مقاله، سفارش ترجمه مقاله، ترجمه متن، ترجمه کتاب و نگارش پایان نامه از دیگر خدماتی هستند که توسط سایت ما ارائه و پشتیبانی می شوند. 
http://Translate.Tnt3.ir 
 
برای سفارش ترجمه اينجا را کليک نماييد.
 

سفارش ترجمه, ترجمه فوری, ترجمه تخصصی, ترجمه آنلاین ,ترجمه ارزان ,ترجمه مقاله, ترجمه پایان نامه, ترجمه کتاب ,سفارش تایپ, سفارش ویراستاری, سفارش پاورپوئینت , سفارش فتوشاپ

برای سفارش ترجمه اينجا را کليک نماييد.

http://Translate.Tnt3.ir 

جهت سفارش ترجمه با سرپرست تیم مترجم سایت ما تماس بگیرید.

سرپرست تیم ترجمه: مهندس محمد علایی

ایمیل:  Translate@Tnt3.ir

تلفن همراه: 09192164907

فرم اشتراک

 

هزینه ترجمه براساس کیفیت مورد نیاز و زمان تحویل، محاسبه می شود.

فایل ترجمه به صورت تایپ شده (با رعایت نیم فاصله ها در موارد مورد نیاز) تحویل می گردد؛ معیار محاسبه نیز همین متن فارسی تایپ شده است.

تعداد کلمه ها با استفاده از نرم افزار ورد آفیس (Word) شمرده شده و مبنا قرار می گیرد.

روال کار:
ارسال فایل به آدرس ایمیل:   Translate@Tnt3.ir
تماس با شماره همراه: 09192164907 (جهت هماهنگی هزینه)
برآورد هزینه «تقریبی» و تعیین زمان تحویل (زمان بیشتر: هزینه کمتر-کیفیت بهتر: هزینه بیشتر).
در صورت موافقت طرفین با هزینه و زمان، پرداخت بیعانه توسط مشتری (معمولا بیست درصد هزینه تقریبی برآورده شده).
انجام کار.
پرداخت مابقی هزینه.
ارسال فایل ورد به مشتری از طریق ایمیل.


تیم ترجمه سایت متشکل از افراد خبره و متخصص در رشته های مختلف با سطح کیفی کاری متفاوت می باشد. کیفیت ترجمه ی تقدیمی، براساس زمان و هزینه پرداختی، متفاوت بوده و از متوسط (نیاز به یکبار بازخوانی توسط خود مشتری) تا بسیار عالی (تألیفی) متغیر است. 

ترجمه مقاله، ترجمه پایان نامه، ترجمه کتاب،  سفارش صفحه آرایی، ویرایش انشایی، تایپ و رسم شکل حرفه ای نیز پذیرفته می شود. 
 
 

سفارش ترجمه, ترجمه فوری, ترجمه تخصصی, ترجمه آنلاین ,ترجمه ارزان ,ترجمه مقاله, ترجمه پایان نامه, ترجمه کتاب ,سفارش تایپ, سفارش ویراستاری, سفارش پاورپوئینت , سفارش فتوشاپ

برای سفارش ترجمه اينجا را کليک نماييد.

گروه مترجم سایت متخصص و حرفه ای با سابقه صفحه آرایی و ویرایش هزاران گزارش سمینار، پایان نامه، مقاله، کتاب و کتابچه از دانشگاه ها ، موسسات آموزش عالی و نهاد های دولتی و خصوصی
 
 http://Translate.Tnt3.ir 
 
 

Comments (1) Posted to ترجمه ماشینی 04/25/2016 Edit

مقاله در مورد ترجمه ی ماشینی

 

با توجه به درخواست بسیاری از دوستان مبنی بر اطلاعات بیشتر در مورد ترجمه ی ماشینی در زبان فارسی و درخواست برخی از دوستان مبنی بر معرفی مقالات فارسی در این زمینه، من یک مقاله فارسی در این رابطه با نام " انسان مترجم و ترجمة ماشيني: بررسي موردي مشكلات ماشين ترجمة انگليسي به فارسي «پديده»" از نشریه ی فصلنامه كتابداري و اطلاع رساني را در این قسمت آورده ام.

چكيده
هدف از نگارش اين مقاله آن بود تا دست‌كم بخشي از مشكلات ترجمه ماشيني، مشخص و ريشه‌يابي گردد. يافته‌ها حاكي از آن بود كه «پديده» در حال حاضر داراي مشكلات فراواني است كه ريشة آن‌ها را در سه چيز مي‌توان جستجو كرد: 1) نبود زبانشناسان مجرب در گروه برنامه‌نويسان؛ 2) نحوـ‌ محوربودن تئوري زباني؛ 3) نبود قدرت تعقل و تفكر در ماشين‌هاي ترجمه. ضمناً مشخص گرديد كه مشكلات نوع اول را مي‌توان با به‌كارگيري نيروي متخصص رفع نمود. مشكلات نوع دوم با تجديدنظر در تئوري زباني و توجه به معنا قابل رفع است، اما- دست‌كم در شرايط كنوني- نمي‌توان قدرت تعقل و تفكر را به ماشين داد و بنابراين مشكلات مربوط به مورد 3 قابل حل نيستند. با وجود اين، نتيجه‌گيري شد كه براي ترجمة متون اينترنتي و حجم زيادي از اطلاعات، بويژه وقتي هدف درك كليات متن باشد، استفاده از ماشين به جاي انسان هم راحت‌تر است و هم سريع‌تر و معقول‌تر.
كليدواژه‌ها: ماشين ترجمه، ترجمة ماشيني، ترجمة انساني، شيوة ميان زباني در ترجمة ماشيني، شيوة انتقال در ترجمة ماشيني، ماشين ترجمة «پديده»، ترجمة انگليسي‌ـ فارسي
مقدمه
در آغاز اجازه دهيد ديدگاه‌هاي مختلفي را كه دربارة بخش آغازين عنوان اين مقاله وجود دارد، باهم مرور كنيم. در يك نگاه كلي سه ديدگاه مختلف درخصوص عنوان اين مقاله هست: 1) طرفداران نظرية نبود تفاوت بين انسان مترجم و ماشين ترجمه، 2) طرفداران تفوق انسان مترجم بر ماشين ترجمه، و 3) طرفداران تفوق ماشين ترجمه بر انسان مترجم.

برخي از صاحب‌نظران بر اين باورند كه در ترجمه، بين انسان و ماشين تفاوت چنداني وجود ندارد. آنان ضمن اقرار به مشكلات موجود در كار ماشين ترجمه و قبول عملكرد ضعيف آن نسبت به عملكرد مترجمان متخصص، اظهار مي‌دارند كه در آينده ماشين ترجمه از عملكردي بهتر برخوردار خواهد شد و در توجيه ادعاي خود مي‌گويند كه در شرايط فعلي، رايانه‌ها در انجام امور محاسباتي و رياضيات، نسبت به انسان از سرعت عمل بيشتري برخوردارند و به بيان ديگر انسان ابداً در اين زمينه‌‍‌ها قادر نيست با ماشين رقابت كند. مثلاً تصور كنيد كه بخواهيم دو عدد 12394765 و 8945630 را در هم ضرب، حاصل را از 443954 كسر و نتيجه را بر 12459 تقسيم كنيم. مسلماً حتي با استفاده از كاغذ، انجام چنين كاري براي انسان چندين دقيقه به‌طول خواهد انجاميد، درحالي كه تمام اين محاسبات را يك ماشين حساب ساده مي‌تواند با دقت لازم و تنها در چند ثانيه به انجام برساند. اين گروه از محققان، يادگيري رياضيات را دشوارتر از يادگيري زبان مي‌دانند و بر اين نكته تأكيد مي‌كنند كه در آينده‌اي نزديك، رايانة جديدي را خلق خواهند نمود كه در امر ترجمه، پردازش اطلاعات و زبان از سرعت عمل و دقتي چون انسان برخوردار باشد.

طرفداران تفوق انسان مترجم بر ماشين ترجمه بر اين باورند كه چون عملكرد ذهن انسان با ماشين متفاوت است و ماشين از قدرت تصميم‌گيري و انتخابي كه انسان دارد، برخوردار نيست، هيچ‌گاه نخواهد توانست بهتر از انسان يا حتي مانند انسان به ترجمه و امور مربوط به آن بپردازد.

طرفداران تفوق ماشين ترجمه بر انسان مترجم نيز بر اين باورند كه مشكلات ماشين ترجمه سال‌ها پيش مرتفع‌شده و هم‌اكنون اين‌گونه ماشين‌ها در ترجمة متون مختلف ـ يا دست‌كم انواعي از آن ـ با مشكلي مواجه نيستند و در آينده‌اي نزديك خواهند توانست بهتر از انسان به ترجمة متون مختلف بپردازند.

در اين مقاله و با ارائة مثال‌ها و بحث‌هاي مختلف نشان خواهيم داد كه با توجه به پيشرفت‌هاي به‌دست آمدة كنوني در علوم، ماشين قادر نيست مانند انسان به ترجمه بپردازد. توجه داشته باشيد كه اين گفته بدان معنان نيست كه ماشين قادر به ترجمه نيست، بلكه بر كيفيت پايين‌تر ترجمة ماشيني در مقايسه با ترجمة انساني تأكيد دارد.

....

نتيجه‌گيري
تعقل و تفكر اساس كار زبان انسان را تشكيل مي‌دهد و ماشين فاقد آن است.

ريشة مشكلات امروزي ماشين‌هاي ترجمه را بايد در سه چيز جستجو كرد:

1. برنامه‌هاي نادرست كه به ماشين داده مي‌شود و بيشتر آن‌ها ناشي از كم‌اطلاعي يا بي‌اطلاعي برنامه‌نويسان مي‌باشد. ضمناً ضروري است براي داشتن برنامه‌هاي مناسب، در گروه برنامه‌نويسان، زبانشناسي مجرب نيز گنجانده شود تا با تحليل ساختارهاي مختلف زبان، الگوهاي مناسب را براي تهية برنامه در اختيار برنامه‌نويسان قرار دهد.

2. با ضعف موجود در تئوري زباني، طبيعي است كه نمي‌توان زبان را جداي از معنا بررسي كرد. حتي وقتي دربارة آواهاي زباني صحبت مي‌كنيم، به معنا نيازمنديم (مثلاً جفت‌هاي كمينه را براي تعيين واج‌هاي زبان به‌كار مي‌بريم). بنابراين چنانچه تئوري زباني به گونه‌اي اصلاح گردد كه معنا را نيز لحاظ كند مي‌توان بخش ديگري از مشكلات ماشين‌هاي ترجمه را حل كرد. البته انجام چنين كاري بسيار دشوار، اما شدني است.

3. اگر بتوانيم به شكلي فقدان چنين قدرتي را ـ يعني همان نعمتي را كه خدا به ما عطا كرده ـ در اختيار ماشين قرار دهيم، (كه البته دستيابي به اين هدف بسيار بعيد به نظر مي‌رسد) مشكلات ماشين‌هاي ترجمه را مي‌توان رفع نمود. بنابراين بايد انتظار داشته باشيم كه با توجه به دانش كنوني بشر، حتي در صورتي كه مشكلات دستة اول و دوم رفع گردند، مشكلات دستة سوم به قوت خود باقي بمانند.

سؤالي كه در اينجا مي‌توان مطرح كرد آن است كه اگر به فرض بتوانيم چنين قدرتي را به ماشين بدهيم آيا خواهيم توانست هروقت كه بخواهيم آن را از ماشين بازپس بگيريم؟ يا از ماشين بخواهيم كه برخلاف ميل و ارادة خود (كه به خاطر داشتن قدرت تعقل، پيدا نموده) هر كاري را كه ما بخواهيم، به انجام برساند؟ چنين وضعيتي را «رابينسون» (Robinson, Douglas, 1992) به خوبي به تصوير كشيده است. او مي‌نويسد: اگر ماشين ترجمه بتواند مثل انسان ترجمه كند و از قدرت تعقل و تفكر برخوردار باشد، آيا ترجيح نخواهد داد صبح كه از خواب برمي‌خيزد، به جاي ترجمة متن تجاري يا ... پاي تلويزيون بنشيند و فيلم چارلي را تماشا كند؟!». 

برای دریافت کامل مقاله بر روی لینک زیر کلیک نمایید.

دریافت کامل مقاله

 

 

Comments (0) Posted to ترجمه ماشینی 07/09/2011 Edit

متن کامل مقاله در مورد ترجمه ی ماشینی

 نام مقاله:     انسان مترجم و ترجمة ماشيني: بررسي موردي مشكلات ماشين ترجمة انگليسي به فارسي «پديده»    
نام نشريه:     فصلنامه كتابداري و اطلاع رساني

شماره نشريه:     26 _ شماره دوم، جلد 7
پديدآور:     محمدرضا فلاحتي، آزاده نعمتي
    

  چكيده
هدف از نگارش اين مقاله آن بود تا دست‌كم بخشي از مشكلات ترجمه ماشيني، مشخص و ريشه‌يابي گردد. يافته‌ها حاكي از آن بود كه «پديده» در حال حاضر داراي مشكلات فراواني است كه ريشة آن‌ها را در سه چيز مي‌توان جستجو كرد: 1) نبود زبانشناسان مجرب در گروه برنامه‌نويسان؛ 2) نحوـ‌ محوربودن تئوري زباني؛ 3) نبود قدرت تعقل و تفكر در ماشين‌هاي ترجمه. ضمناً مشخص گرديد كه مشكلات نوع اول را مي‌توان با به‌كارگيري نيروي متخصص رفع نمود. مشكلات نوع دوم با تجديدنظر در تئوري زباني و توجه به معنا قابل رفع است، اما- دست‌كم در شرايط كنوني- نمي‌توان قدرت تعقل و تفكر را به ماشين داد و بنابراين مشكلات مربوط به مورد 3 قابل حل نيستند. با وجود اين، نتيجه‌گيري شد كه براي ترجمة متون اينترنتي و حجم زيادي از اطلاعات، بويژه وقتي هدف درك كليات متن باشد، استفاده از ماشين به جاي انسان هم راحت‌تر است و هم سريع‌تر و معقول‌تر.
كليدواژه‌ها: ماشين ترجمه، ترجمة ماشيني، ترجمة انساني، شيوة ميان زباني در ترجمة ماشيني، شيوة انتقال در ترجمة ماشيني، ماشين ترجمة «پديده»، ترجمة انگليسي‌ـ فارسي
مقدمه
در آغاز اجازه دهيد ديدگاه‌هاي مختلفي را كه دربارة بخش آغازين عنوان اين مقاله وجود دارد، باهم مرور كنيم. در يك نگاه كلي سه ديدگاه مختلف درخصوص عنوان اين مقاله هست: 1) طرفداران نظرية نبود تفاوت بين انسان مترجم و ماشين ترجمه، 2) طرفداران تفوق انسان مترجم بر ماشين ترجمه، و 3) طرفداران تفوق ماشين ترجمه بر انسان مترجم.

برخي از صاحب‌نظران بر اين باورند كه در ترجمه، بين انسان و ماشين تفاوت چنداني وجود ندارد. آنان ضمن اقرار به مشكلات موجود در كار ماشين ترجمه و قبول عملكرد ضعيف آن نسبت به عملكرد مترجمان متخصص، اظهار مي‌دارند كه در آينده ماشين ترجمه از عملكردي بهتر برخوردار خواهد شد و در توجيه ادعاي خود مي‌گويند كه در شرايط فعلي، رايانه‌ها در انجام امور محاسباتي و رياضيات، نسبت به انسان از سرعت عمل بيشتري برخوردارند و به بيان ديگر انسان ابداً در اين زمينه‌‍‌ها قادر نيست با ماشين رقابت كند. مثلاً تصور كنيد كه بخواهيم دو عدد 12394765 و 8945630 را در هم ضرب، حاصل را از 443954 كسر و نتيجه را بر 12459 تقسيم كنيم. مسلماً حتي با استفاده از كاغذ، انجام چنين كاري براي انسان چندين دقيقه به‌طول خواهد انجاميد، درحالي كه تمام اين محاسبات را يك ماشين حساب ساده مي‌تواند با دقت لازم و تنها در چند ثانيه به انجام برساند. اين گروه از محققان، يادگيري رياضيات را دشوارتر از يادگيري زبان مي‌دانند و بر اين نكته تأكيد مي‌كنند كه در آينده‌اي نزديك، رايانة جديدي را خلق خواهند نمود كه در امر ترجمه، پردازش اطلاعات و زبان از سرعت عمل و دقتي چون انسان برخوردار باشد.

طرفداران تفوق انسان مترجم بر ماشين ترجمه بر اين باورند كه چون عملكرد ذهن انسان با ماشين متفاوت است و ماشين از قدرت تصميم‌گيري و انتخابي كه انسان دارد، برخوردار نيست، هيچ‌گاه نخواهد توانست بهتر از انسان يا حتي مانند انسان به ترجمه و امور مربوط به آن بپردازد.

طرفداران تفوق ماشين ترجمه بر انسان مترجم نيز بر اين باورند كه مشكلات ماشين ترجمه سال‌ها پيش مرتفع‌شده و هم‌اكنون اين‌گونه ماشين‌ها در ترجمة متون مختلف ـ يا دست‌كم انواعي از آن ـ با مشكلي مواجه نيستند و در آينده‌اي نزديك خواهند توانست بهتر از انسان به ترجمة متون مختلف بپردازند.

در اين مقاله و با ارائة مثال‌ها و بحث‌هاي مختلف نشان خواهيم داد كه با توجه به پيشرفت‌هاي به‌دست آمدة كنوني در علوم، ماشين قادر نيست مانند انسان به ترجمه بپردازد. توجه داشته باشيد كه اين گفته بدان معنان نيست كه ماشين قادر به ترجمه نيست، بلكه بر كيفيت پايين‌تر ترجمة ماشيني در مقايسه با ترجمة انساني تأكيد دارد.

حال نگاهي گذرا به تاريخچة كارهاي انجام‌گرفته در خصوص ماشين ترجمه داشته باشيم.

نگاهي كوتاه به تاريخچة ماشين ترجمه
امروزه در كتاب‌ها و مجلات معتبر دنيا مطالب فراواني به چاپ مي‌رسد كه به موضوع ترجمه و ترجمة ماشيني مربوط است. «هاچينز» (Huchins, W.J. 1986) و «مل باي» و «تري» (Melby. Alan & Terry, Varner C., 1995) از جمله افرادي‌اند كه به بررسي تاريخچة ماشين ترجمه پرداخته‌اند. «نيرنبرگ»(Nirenburg, S. 1986) موضوعات روش‌شناختي و نظري مرتبط با ماشين ترجمه را به تفصيل شرح مي‌دهد. «كي»(kay, Martin) و «گربر» (Gerber, Laurie)مي‌كوشند راه‌هايي را ارائه كنند كه باعث بهبود كيفيت ترجمة ماشيني شود. «دور» (Dorr, B.J. 1993) نقش و مشكلات مربوط به واژگان را در ترجمة ماشيني موردبحث و بررسي قرار مي‌دهد، «دري فاس» (Dreyfus, Hubert, 1992) به ناتواني‌هاي رايانه در انجام برخي امور اشاره مي‌كند، و...

كار بر روي ماشين ترجمه همزمان با اختراع رايانه در دهة 1940 آغاز شد. ماشين‌هاي ترجمة اوليه به‌اين‌صورت طراحي شده بودند كه براي ترجمة متون مختلف، مستقماً از يك واژه‌نامة دوزبانه استفاده مي‌كردند. ترجمه نيز تنها به ترجمة واژگاني محدود مي‌شد و از ترجمة ساختار نحوي زبان مبدأ يا مقصد نيز خبري نبود. اين نوع روش ترجمه را مستقيم مي‌ناميدند. با اين همه در دهه 1980 چندين سامانة ترجمه به بازار عرضه شد كه در ترجمه از روش غيرمستقيم استفاده مي‌كردند. علت استفاده از لفظ غيرمستقيم صرفاً بدان علت است كه اين‌گونه ماشين‌ها متن را مستقيماً از زبان مبدأ به زبان مقصد ترجمه نمي‌كنند، بلكه ابتدا متن از زبان مبدأ به يك «ميان‌زبان»[3] و سپس به زبان مقصد ترجمه مي‌شود؛ بنابراين، ترجمه در دو مرحله به انجام مي‌رسد. در اين‌گونه سيستم‌ها برنامه‌هايي تعبيه شده تا به شناسايي ساختار واژه و جمله، و واژه‌ها و عبارات مبهم بپردازند.

روش غيرمستقيم داراي انواعي است كه از آن جمله مي‌توان به دو شيوة «ميان‌زباني» و «انتقال»[4] اشاره كرد. در ادامه به صورت اجمالي به معرفي اين دو روش مي‌پردازيم.

1. روش‌هاي ترجمة ميان‌زباني و انتقال
1ـ1. روش انتقال: متن مبدأ ـ ـ تجزيه ـ ـ ساختار بينابيني متن مبدأ ـ ـ انتقال ـ ـ ساختار بينابيني متن مقصد ـ ـ تركيب ـ ـ متن مقصد

1ـ2. روش ميان‌زباني: متن مبدأ ـ ـ تجزيه ـ ـ ميان‌زبان ـ ـ تركيب ـ ـ متن مقصد

در روش انتقال، ساختار بينابيني معمولاً كار تجزيه و تحليل دستوري متن را برعهده دارد و هربار مي‌تواند تنها يك جمله را بررسي كند. از سويي ديگر، روش ميان‌زباني، متن را بدون توجه به زباني خاص مورد تجزيه و تحليل قرار دهد. مزيت روش ميان‌زباني اين است كه مي‌توان با صرف هزينه‌هاي نسبتاً پايين، زبان‌هاي جديدي را نيز به ماشين ترجمه اضافه كرد. اين كار صرفاً با استفاده از قوانيني تحقق مي‌يابد كه بين زبان جديد و «ميان‌زبان» برقرار است.

اما در ديدگاه انتقال، حيطة كار اين قوانين و قواعد، زبان جديد و ديگر زبان‌هاي موجود در ماشين ترجمه مي‌باشد. در روش انتقال، تنها بين دو زبان مبدأ و مقصد مقايسه به عمل مي‌آيد. در اين مقايسه، واحدهاي واژگاني و ساختارهاي نحوي دو زبان با هم مقايسه مي‌شوند؛ سپس با استفاده از قواعد انطباقي سعي مي‌شود ساختار بينابيني زبان مبدأ به ساختاري مشابه در زبان مقصد تبديل شود (Tusjii, 1990). اين قواعد همراه با ديگر اطلاعات معنايي و ...، در لغتنامه‌ها يا پايگاه‌هاي دانش ذخيره مي‌شوند. در شيوة انتقال، عمق و ميزان تجزيه و تحليل از پيش مشخص نيست، بلكه به ميزان قرابت و نزديك‌بودن دو زبان بستگي دارد: هرچه دو زبان به هم نزديك‌تر باشند، از عمق تجزيه و تحليل نيز به همان ميزان كاسته خواهد شد.

اما براي اين كه بتوانيم به ترجمه‌اي كيفي دست يابيم، بايد پا را از تجزيه و تحليل نحوي يا تجزيه و تحليل معنايي سطحي فراتر بگذاريم. براي انجام ترجمة كيفي، سيستم بايد بتواند معناي واقعي جمله را نيز درك كند. مثلاً جملات ساده‌اي چون «دانش‌آموز امتحان داد» و «معلم امتحان گرفت» را در دو زبان فارسي و انگليسي در نظر بگيريد. معادل اين دو جمله در انگليسي بدين قرارند:

The student took the test. The teacher gave the test

ماشين ترجمه بايد بتواند اين‌گونه جملات را نيز به خوبي درك كند و براي درك آن‌ها لازم است كه درباة امتحان‌دادن و امتحان‌گرفتن در انگليسي و فارسي اطلاعاتي داشته باشد. غالباً چنين اطلاعاتي در بخشي از سيستم به نام قالب‌هاي حالت[5] ذخيره مي‌شود. در اين مرحله سيستم ترجمه براي شناسايي عناصر جمله به تجزيه و تحليل معنايي، قواعد انتقال معنايي، و قواعد ديگري نيازمند است. تجزيه‌گر معنايي با استفاده از نمودار نحوي، قالب حالت را توليد مي‌كند و مرحلة انتقال نيز «قالب حالت» استخراج شده از جمله در زبان مبدأ را به «قالب حالت» معادل در زبان مقصد تبديل مي‌كند.

اما در روش «ميان‌زباني» به تجزيه و تحليل مفصل‌تري نيازمنديم. نتيجة اين تجزيه و تحليل يك بازنمود انتزاعي است كه مستقل از زبان مبدأ است. مزيت اين استقلال آن است كه تركيب اجزا و شكل‌گيري جملة معادل در زبان مقصد مي‌تواند بدون شناخت زبان مبدأ صورت پذيرد. بنابراين در اين روش، اطلاعاتي ممكن است به جمله اضافه شود كه به صورت واضح و آشكار در جملة مبدأ وجود ندارد. البته افزودن اطلاعات بويژه اطلاعات معنايي و فرازباني، كاري بس دشوار و وقتگير است. اطلاعات معنايي غالباً در يك «پايگاه دانش» يا «واژه‌نامة مفهومي» ذخيره مي‌شود. «نيرنبرگ» و ديگران (Nirenberg, J., Garbonell, J.c., Tomita, M; &Goodman, K., 1992) بر اين باورند كه از اين نوع اطلاعات معنايي، در سيستم ترجمة «كي‌بي‌ام‌تي ـ 89»[6] و براي رسيدن به بازنمودي ميان‌زباني كه عاري از ابهام نيز باشد استفاده شده است. براي رسيدن به اين بازنمود ميان‌زباني، بايد از چند مرحله گذشت: «كي‌بي‌ام‌تي ـ 89» ابتدا و با استفاده از يك دستور نقش‌گراي واژگاني، تجزيه و تحليل نحوي را آغاز مي‌كند، سپس با استفاده از يك لغتنامة مفهومي، مدخل‌هاي واژگاني را به معادل‌هاي ميان‌زباني‌شان ترجمه مي‌كند. در مرحلة بعد، پس از اعمال تغييرات ساختاري، ساختارهاي ميان‌زباني حاصل مي‌شوند و در پايان با تركيب اجزا، بازسازي جمله در زبان مقصد محقق مي‌شود.

همان‌گونه كه پيشتر ذكر شد در روش ميان‌زباني، افزودن زبان جديد به ماشين ترجمه بسيار راحت‌تر از روش انتقال است. با اين همه، تاكنون هيچ سيستم ميان‌زباني مطلوبي به بازار عرضه نشده و تمامي سيستم‌هاي ترجمة ماشيني ميان‌زباني كه تاكنون طراحي شده‌اند، مراحل آزمايشي خود را سپري مي‌كنند و از اين رو حيطة كار آن‌ها از چند صد واژه يا چندهزار پيش‌نمونه، فراتر نمي‌رود. هرچند تحقيقات انجام گرفته در خصوص ميان‌زبان اندك نبوده، اما هنوز روش مشخصي ارائه نشده تا با استفاده از آن بتوان به يك بازنمود معنايي مستقل از زبان دست يافت. البته، درخصوص امكان دست‌يابي به چنين بازنمودي نيز شك و ترديد بسيار وجود دارد (Whorf, B.L., 1956; Nirenbuerg, S.et al., 1992; Hovy, E.H. & Nirenburg, J., 1992).

در سيستم‌هاي علمي، از روش انتقال بيشتر استفاده مي‌شود، چون هم ساده‌تر است و هم نيازي به ميان‌زبان ندارد. همين امر سبب گرديده تا اين روش در مقايسه با روش ميان‌زباني از كارآيي بيشتري برخوردار باشد. به تازگي سعي شده با تلفيق روش‌ها و ديدگاه‌هاي مختلف موجود، سيستمي واحد و چندموتوره ارائه گردد. به نظر مي‌رسد انجام اين كار بسيار ساده باشد: جملات موردنظر براي ترجمه به چندين موتور ترجمة موازي فرستاده مي‌شوند و در پايان، بروندادهاي موتورهاي مختلف با هم تركيب مي‌گردند و درنهايت، بهترين و مناسب‌ترين بخش‌ها انتخاب، و سپس در قالب جملات زبان مقصد، بازسازي و بازنويسي مي‌شوند.

امروزه تقريباً تمام ماشين‌هاي ترجمه از يكي از سه روش گفته شده ـ مستقيم، غيرمستقيم (ميان‌زباني) يا انتقال ـ استفاده مي‌كنند. مثلاً در ماشين‌هاي ترجمه «آريان»[7] و «يوروترا»[8] كه توسط كميسيون مجامع اروپايي» طراحي شده‌اند از روش انتقال استفاده شده است. در اواخر دهه 1980 در ژاپن براي زبان‌هاي آسيايي ماشين ترجمه‌اي ساخته شد كه از روش ميان‌زباني استفاده مي‌كرد، اما اين پروژه با شكست مواجه شد و شايد دليل عمدة اين شكست را بتوان ساختار خاص و پيچيدگي‌هاي نوشتاري زبان‌هايي چون ژاپني، چيني، و... دانست.

تا دهه 1990 چنين تصور مي‌شد كه ماشين‌هاي ترجمه بايد در نهايت جايگزين انسان مترجم شوند و ترجمه‌هايي را توليد كنند كه از قابليت چاپ برخوردار باشند، اما چنين تصوري هم‌اكنون دچار تغيير و تحول شده است. امروزه ديگر هدف اصلي از ساخت ماشين‌هاي ترجمه، جايگزيني آن‌ها به‌جاي انسان مترجم نيست، بلكه رسيدن به ترجمه‌هاي ارزان‌تر و سريعتر (آن‌هم در حجم بسيار زياد)، هدف نهايي اين‌گونه ماشين‌ها است.

در بخش بعدي به بررسي يكي از ماشين‌هاي ترجمة انگليسي به فارسي خواهيم پرداخت كه مدعي است در ترجمه، واحد «جمله» را مدنظر قرار مي‌دهد و بنابراين از بسياري از مشكلات ترجمة واژه‌به‌واژه به‌دور است.

ماشين ترجمه «پديده»
ماشين‌هاي ترجمه‌اي كه در بخش پيشين اين مقاله دربارة آن‌ها صحبت كرديم، قادر نبودند متون انگليسي را به فارسي ترجمه كنند، اما ماشين ترجمه «پديده» از چنين قابليتي برخوردار است. اين ماشين ترجمه مدعي است كه قادر است جملات را به‌گونه‌اي مطلوب ترجمه نمايد. علاوه بر تايپ جملات يا متون موردنظر، مي‌توان فايلي را كه به فرمت «پي‌دي‌اف» يا متن[9] باشد به ماشين داد و منتظر پاسخ ماند. اين ماشين ترجمه ضمن بهره‌گيري از آخرين دستاوردهاي هوش مصنوعي، قادر است 400 صفحه را تنها در يك دقيقه ترجمه كند.

«پديده» در بانك اطلاعاتي خود براي واژه‌ها و عبارات، 000,500,1 مدخل دارد. هر مدخل معناي فارسي واژه، مفاهيم دستوري و چند عنصر ديگر را شامل مي‌گردد. براي ترجمة يك جمله، اين ماشين نخست آن را به واژه‌هاي تشكيل‌دهنده، عبارات و نمادها تقسيم و سپس نتايج به‌دست آمده را به واحدهاي دستوري، واژگاني و واژه‌سازي ارسال مي‌كند؛ سپس نتايج حاصله به يك موتور برونداد فرستاده مي‌شوند. اين موتور نهايي، مسئول توليد و ارائة ترجمة فارسي است.

سازندگان اين ماشين مي‌گويند در آينده‌اي نزديك «پديده» خواهد توانست متون مختلف را از فارسي به انگليسي يا از زبان‌هاي ديگر به فارسي برگرداند.

عملكرد ماشين ترجمه «پديده»
براي پي‌بردن به چگونگي عملكرد اين ماشين ترجمه، محققان 18 نوع مختلف از جملات انگليسي را به عنوان نمونه وارد ماشين كردند و سپس به بررسي ترجمه‌هاي فارسي توليدشده پرداختند.

در ادامه به بررسي گروه‌هاي هجده‌گانة جملات انگليسي و ترجمه‌هاي حاصله مي‌پردازيم.

گروه 1. جملات ساده: جملات 1 تا 5 همگي جملات ساده‌اند. اين جملات را ساده مي‌ناميم چون در ساختارشان، اصطلاح ضرب‌المثل، استعاره، و ... وجود ندارد و در ضمن داراي ساختار دستوري پيچيده‌اي نيستند، تنها داراي يك فعل‌اند، و...

من به سينما اين آخر هفته خواهم‌رفت.
1. I will go to the cinema this weekend.

او چه مژه‌هاي بلندي را دارد!
2. What long eyelashes she has!

من به خدا ايمان دارم.
3. I believe in God.

او روي ميز رفت.
4. He went on the table.

پدرش چه سني است؟
5. How old is his father


با نگاهي به جملات انگليسي 1 تا 5 و ترجمه‌هاي فارسي توليدشده به نتايج زير مي‌رسيم: ترجمة جمله 1 كاملاً قابل‌فهم است، با اين همه ترتيب اجزاي جمله درست نيست. معمولاً در زبان فارسي قيد زمان را در آغاز جمله مي‌آورند و بنابراين بيشتر سخنوران فارسي به‌جاي «من به سينما اين آخر هفته خواهم رفت» مي‌گويند «من اين آخر هفته به سينما خواهم رفت» يا در گونه‌هاي محاوره‌اي «اين آخر هفته مي‌رم سينما». ترجمة ارائه‌شده براي جمله 2 نيز كاملاً قابل درك است. اشكال اين ترجمه وجود حرف «را» پس از واژه «بلندي» است كه بايد آن را حذف نمود (او چه مژه‌هاي بلندي دارد!). جملات 3و4 از نظر معنايي و دستوري كاملاً درست‌اند و نياز به هيچ تغيير يا اصلاحي نيست. جمله 5 نيز كاملاً قابل درك و دستوري است؛ با اين همه، ساختار به‌كار گرفته‌شده در ترجمه، ساختاري كاملاً رايج به شمار نمي‌رود. معمولاً به‌جاي «پدرش چه سني است؟» مي‌گوييم «پدرش چند ساله است» يا درگونه‌هاي محاوره‌اي «پدرش چند سالشه؟».

نگاهي دوباره به ترجمه‌هاي ارائه‌شده براي جملات 1 تا 5 نشان مي‌دهد كه اين ماشين قادر است جملات ساده را با موفقيت ترجمه كند و اشكالات موجود، بيشتر اشكالاتي ساختاري‌اند و نه معنايي و بنابراين در امر ارتباط خللي ايجاد نمي‌كنند.

گروه 2. اصطلاحات، ضرب‌المثل‌ها، و...: هريك از جملات 6 تا 13 در ساختار خود داراي نوعي اصطلاح، ضرب‌المثل، يا ساختاري مشابه‌اند. براي رسيدن به معناي درست اين‌گونه جملات، انسان مترجم بايد از پيش با چگونگي كاربرد آن‌ها آشنايي داشته باشد، چون معناي چنين جملاتي را نمي‌توان از جمع عددي معاني واژه‌هاي تشكيل‌دهندة آن‌ها مشخص كرد. مثلاً در جمله 12 منظور نويسنده اين نبوده كه فردي دماغ بزرگ دارد، چرا كه در آن صورت بايست از فعل has استفاده مي‌كرد، بلكه منظور او اين بوده كه بگويد «او فرد بسيار مهمي است» يا «از آن كله‌گنده‌ها است».

من به ستون فقرات را خسته بودم.
6. I was tired to the backbone.

پهناي اجازه دادن به پاهايمان.
7. Let’s stretch our legs.

او يك پتوي خيس است.
8. He is wet blanket.

او اين روزهاي بدهكار است.
9. He is in the red These days.

او به سطل لگد زد.
10. He kicked the bucket.

در حال بازي tennis فنجان چايي‌ام است.
11. Playing tennis is my cup of tea.

او يك دماغ بزرگ است.
12. He is a big nose.

او جيم شد.
13. He took French leave.


در اين گروه، ترجمه‌هاي ارائه‌شده براي جملات 6، 7 و 11 كاملاً بي‌معنا و غيردستوري‌اند. ترجمه درست و البته پيشنهادي اين سه جمله به ترتيب عبارت‌اند از:

6. كاملا ًخسته بودم.

7. بياييد كمي خستگي در كنيم يا كمي راه برويم.

11. تنيس ورزش مورد علاقه‌ام است.

«پديده» در ترجمه‌اي كه براي جمله 11 ارائه داده واژه tennis را ترجمه نكرده (كه دليل آن مي‌تواند نبود معادل فارسي براي اين واژه در واژگان ماشين ترجمه باشد). ضمناً نتوانسته اسم مصدر بودن playing را تشخيص دهد. از اين‌رو، آن را به اشتباه فعل استمراري درنظر گرفته. علت بروز چنين اشكالي را بايد در نقص برنامه‌هاي دستوري تعريف شده براي ماشين جستجو كرد.

جملات8 ، 10 و 12 همگي دستوري‌اند، اما منظور اصلي گوينده يا نويسنده را نمي‌رسانند. جملات كاملاً تحت‌اللفظي ترجمه شده‌اند. به بيان ديگر، «پديده» به معناي اصطلاحي اين‌گونه جملات توجهي نكرده است. ترجمة پيشنهادي سه جملة بالا به قرار زير هستند:

8 . هميشه آية يأس مي‌خواند/ هميشه ضدحال مي‌زند.

10. او به درك واصل شد/ سقط شده.

12. او فرد مهمي است/ از آن كله‌گنده‌ها است.

جملات 9 و 13 به درستي ترجمه شده‌اند، هرچند در جملة 9 «ي» بايد از آخر «روزها» حذف گردد (او اين روزها بدهكار است).

بررسي ترجمه‌هاي ارائه‌شده در گروه 2 نشان مي‌دهد كه «پديده» در ترجمة تركيبات اصطلاحي داري اشكال است، چرا كه به‌جاي معناي اصطلاحي، جز در جملة 13 به معناي تحت‌اللفظي واژه‌ها توجه مي‌كند.

گروه 3. one: مي‌دانيم كه ضمير جانشين اسم مي‌شود. معمولاً در نوشتار يا گفتار براي جلوگيري از تكرار يك اسم، مي‌توان از ضمير مناسب استفاده كرد. در انگليسي، يكي از موارد كاربرد one آن است كه جلوي تكرار اسم را مي‌گيرد، مانند جملة 14. ضمناً one مي‌تواند نقش ضمير نامشخص را نيز بازي كند. مثلاً در جملة 15، one را مي‌توان «آدم» ترجمه كرد (كه ممكن است به هر فردي اشاره داشته باشد). ترجمه‌هاي ارائه‌شده توسط ماشين براي اين دو جمله عبارت‌اند از:

قدم اول مشكل‌ترين يك است.
14. The first step is the most difficult one.

يك با دقت هميشه بايد باشد.
15. One should always be careful


در اين مورد نيز مي‌بينيم كه «پديده»،one را به‌صورت تحت‌اللفظي ترجمه كرده و نتوانسته كاربرد اين واژه را در دو جمله تميز دهد. براي اين دو جمله ترجمه‌هاي زير پيشنهاد مي‌شوند:

14. قدم اول مشكل‌ترين قدم است.

15. آدم هميشه بايد مواظب باشد.

One در جملة 14 به «قدم» و در جملة 15 به «تمام انسان‌ها» اشاره دارد.

گروه 4. علائم اختصاري و اختصارات: جملات 16 و17 هر دو داراي علائم اختصاري‌اند (U.S. در جملة 16 و US در جملة 17). «پديده» توانسته جملة 16 را به درستي ترجمه كند، ولي در ترجمة جملة 17 ناموفق بوده.

حكومت آمريكا
16. The U.S. government

محرك غيرشرطي حكومت
17. The US government


در اينجا املاي كلمات نقش مهمي را ايفا مي‌كند. از نظر «پديده» «.U.S»، وقتي پس از هر حرف بزرگ نقطه‌اي وجود داشته باشد، به معناي آمريكا است، ولي «US» بدون نقطه به معناي «محرك غيرشرطي» (Unstimulated) است كه به حوزة روانشناسي مربوط مي‌شود. بنابراين در واردكردن اطلاعات به ماشين و رعايت املاي درست كلمات بايد دقت كنيم، چرا كه برخلاف انسان، ماشين قادر نيست خطاهاي املايي كلمات را تشخيص دهد. ضمناً ماشين به بافت و متن حساس نيست و از اين‌رو متوجه نمي‌شود كه «محرك غيرشرطي»، آن هم در جمله‌اي كه به اخبار يا سياست مربوط مي‌شود، ترجمة درستي براي «US» نيست. ضمناً ماشين بين «US» كه با حروف بزرگ نوشته شده و «us» (ضمير مفعولي «We»;) تمايز قائل‌شده، و به همين دليل به‌جاي «محرك غيرشرطي» از ضمير «ما» استفاده نكرده است.

گروه 5. اسم مصدر و مصدر با to از فعل: دو جملة 18 و 19 هر دو دستوري‌اند، اما از نظر معنايي تنها جملة 18 درست است.

او به ياد آورد در را قفل كند.
18. He remembered to lock the door.

او در قفل‌شدني را به ياد آورد.
19. He remembered locking the door


جمله 18 بدين معنا است كه فرد، قبلاً در را قفل نكرده بوده، پس رفت ودر را قفل كرد. اما معناي جملة 19 آن است كه او قبلاً در را قفل كرده بوده و قفل‌كردن در را به‌خاطر آورده است. در جملة 19 ماشين نتوانسته تحليل نحوي درستي از جمله ارائه دهد. ماشين عبارت «locking the door» را با «the locking door» كه يك گروه اسمي است يكي فرض كرده و چون اين گروه اسمي پس از فعل آمده، آن را مفعول مستقيم دانسته. پس، از نظر ماشين «locking» صفت است و نه صورت «ing»دار فعل «lock». ترجمة درست جملة 19 از اين قرار است:

او به ياد آورد كه در را قفل كرده بود.

گروه 6. ضماير: جملات 20 و 21، هر دو دستوري و بامعنايند. اين بدان معنا است كه «پديده» مي‌تواند بدرستي بين انواع مختلف ضماير، از جمله ضماير مفعولي و انعكاسي تمايز قائل شود.

او او را شست.
20. He washed him.

او خودش را شست.
.21. He washed himself


هرچند ترجمة ارائه‌شده توسط «پديده» براي جملة 20 درست است، با ترجمة ارائه‌شده توسط انسان مترجم يكي نيست؛ به‌اين معنا كه مترجمان غالباً به جاي آن‌كه ضمير «او» را دوبار پشت سرهم بياورند، به جاي يكي از ضميرها از طريق جستجوي در متن، اسم مناسب را جايگزين مي‌كنند ـ مثلاً «علي او را شست» يا «او علي را شست». بنابراين مي‌توان گفت كه ماشين ترجمه قادر نيست از امكانات متن استفاده كند، يا به بيان ديگر، از حد جمله فراتر رود.

گروه 7. واژه‌هاي هم‌آوا ـ هم‌نوشت: واژه‌هاي هم‌آوا ـ هم‌نوشت واژه‌هايي‌اند كه داراي تلفظ و صورت نوشتاري يكساني مي‌باشند، مثل «شانه» كه به وسيله‌اي براي مرتب‌كردن مو، عضوي از بدن، شانة تخم‌مرغ، قسمت خاكي جاده، و... اشاره مي‌كند. بديهي است بين معاني مختلف واژة هم‌آوا ـ هم‌نوشت ارتباطي وجود ندارد.

بانك يك رودخانه.
22. The Bank of a river.


براي پي‌بردن به معناي موردنظر از واژة هم‌آوا ـ هم‌نوشت، توجه به متن و بافت ضروري است. ترجمة ارائه‌شده براي جملة 22 نادرست است، چون «پديده» قادر نيست از حد جمله فراتر رود. همين امر سبب شده تا به جاي «حاشية يك رودخانه»، «بانك يك رودخانه» را به عنوان معادل فارسي جملة 22 ارائه دهد.

گروه 8 . املا و فاصلة بين كلمات: ترجمة جملة 23 و 24 غيردستوري است. ترجمة 24 بي‌معنا، و ترجمة جملة 23 معنادار است، هرچند نياز به اصلاحات ساختاري و واژگاني نيز دارد.

آيا رقص فرانسوي نشاط‌آور مي‌توانيد؟
23. Can you cancan?

آيا مي‌توانيد كنسرو بكنيد كنسرو بكنيد؟
24. Can you can can?


ماشين ترجمه براي اين‌كه بتواند براي جملات فوق ترجمة درستي ارائه دهد بايد بتواند بين معاني مختلف «can» تمايز قائل شود. در جملة 23 «can» در آغاز جمله فعل كمكي است، در حالي كه «cancan» در آخر جمله به نوعي رقص اشاره دارد و فعل است. (توجه داشته باشيد كه در اين مورد «cancan» بدون فاصله نوشته مي‌شود. البته مي‌توان به جاي آن از «can the can» نيز استفاده كرد). نكتة جالب آن است كه وقتي «cancan» را با فاصله و به صورت «can can» بنويسيم، ديگر ماشين ترجمه قادر نيست اين عبارت را به صورت «رقص فرانسوي نشاط‌آور» ترجمه كند، بلكه هر يك از دو can موجود پس از you را جدا فرض مي‌نمايد و به كنسرو ترجمه مي‌كند. بنابراين نگارش درست جملات در هنگام ورود اطلاعات به ماشين از اهميت بسياري برخوردار است. انسان‌هاي مترجم مي‌توانند از طريق بررسي متن و بافت، اشكالات تايپي و املايي احتمالي را تشخيص دهند، منظور اصلي نويسنده را درك و ترجمه كنند، ولي ماشين از چنين قابليتي برخوردار نيست.

گروه 9. مقولة دستوري: در زبان، واژه‌هاي بسياري وجود دارند كه بسته به بافت و جايگاه، به مقوله‌هاي دستوري مختلفي تعلق دارند.

25. Like you I don’t like him.

به شما علاقه‌ داشته باشيد من تي ـ را مي‌پوشانم به او علاقه داشته باشد.

در اين جمله «like» قبل از you به معناي «مثل و مانند» است، درحالي‌كه «like» پيش از him فعل است و به‌معناي «دوست‌داشتن». مشخص است كه «پديده» در تشخيص مقولة دستوري واژه‌هايي كه به بيش از يك مقوله تعلق دارند، موفق نيست.

گروه 10. اسامي ساده و مركب: در انگليسي به شيوه‌هاي مختلف مي‌توان اسم مركب ساخت. يكي از اين شيوه‌ها آن است كه اسم را با فعل تركيب كنيم، يا دو اسم را به‌هم بپيونديم.

ميوه علاقه داشتن را هلو پرواز مي‌كند.
26. Fruit flies like peach.


در جملة 26، «fruit flies» اسم مركب است و به «مگس ميوه» يا «حشرات ميوه» اشاره دارد، بنابراين بايد آن را اسم به حساب آوريم. از سويي ديگر، بدون نگاه‌كردن به بخش دوم يعني «like peach» و محدوديت‌هاي معنايي در كاربرد يك واژه‌، ممكن است تصور كنيم كه «fruit» فاعل است و مفرد، و «flies» فعل سوم‌شخص مفرد. اما وقتي بخش دوم جمله را نيز مدنظر قرار دهيم به اين نتيجه مي‌رسيم كه فعل اصلي جمله «like» است و نه «flies» و درواقع آنچه پيش از «like» آمده اسم مركب است و نه فاعل و فعل. «پديده» به جاي آن‌كه «fruit flies» را اسم مركب درنظر بگيرد، «fruit» را فاعل و «flies» را فعل اصلي درنظر گرفته است، از اين‌رو «like» را كه پس از «flies» آمده مفعول مستقيم و «peach» را متمم فرض كرده. بنابراين «پديده» در زمينة اسامي مركب نيز عاري از خطا نيست. ترجمة پيشنهادي جمله 26 از اين قرار است: مگس‌هاي ميوه هلو را دوست دارند.

گروه 11. جملات سببي: جمله‌هاي 27 و 28 هردو دستوري‌اند، با وجود اين مي‌توان معناي جمله و منظور اصلي گوينده را فهميد.

من ماشينم را داشتم شسته شده.
27. I had my car washed.

ديروز من كوتاه‌كردن مويم را داشتم.
28. I had my hair cut yesterday.


به نظر مي‌رسد ساختار جملات سببي به خوبي براي «پديده» تعريف نشده و فعل have و نقش آن در جملة سببي به درستي درك نشده است. از اين‌رو به جاي ترجمه‌هايي چون «ماشينم را دادم بشويند» و «ديروز رفتم سلماني» يا «ديروز مويم را كوتاه كردم»، ترجمه‌هاي فوق توليدشده است.

گروه 12. توالي صفات: در گروه‌هاي اسمي مي‌توان چندين صفت را پيش از اسم قرار داد كه البته در مورد ترتيب قرار گرفتن آن‌ها قواعد خاصي وجود دارد. ضمناً در انگليسي، فعل و فاعل از نظر عدد و شخص با هم مطابقت دارند.

دو بطري‌هاي چوبي قرمز بزرگ
29. Two large red wooden bottles.


ترجمة جملة 29 غيردستوري، اما قابل درك است. به راستي ترتيب واقعي صفات در زبان فارسي چگونه است؟ «پديده» ترتيب صفات را از انگليسي به فارسي كاملاً برعكس كرده، يعني «large red wooden» را به «چوبي قرمز بزرگ» تبديل نموده. نكتة ديگر اين‌كه «پديده» مطابقت عدد با اسم را بدون تغيير، از انگليسي وارد فارسي كرده است: برخلاف انگليسي كه در آن عدد با اسم مطابقت دارد، در فارسي اسم همواره مفرد است (يك سيب، دو سيب، سه سيب، و ...)، و به نظر مي‌رسد در اين زمينه برنامة دستوري مناسب به ماشين داده نشده.

گروه13. جملات امري: ترجمة جملة 30، دستوري است، اما معناي موردنظر گوينده يا نويسنده را منتقل نمي‌كند.

همانجا به من كتاب را بدهيد.
30. Give me the book over there!


«پديده» در ترجمة عبارت پايان (يعني «over there»;) دچار اشتباه شده و آن را به جاي «كه آنجاست» به «همان‌جا» ترجمه كرده. ترجمة پيشنهادي اين جمله از اين قرار است: «كتابي را كه آنجا است به من بدهيد». ضمناً در فارسي معمولاً مفعول مستقيم پيش از متمم يا مفعول غيرمستقيم مي‌آيد. «پديده» مفعول غيرمستقيم را پيش از مفعول مستقيم آورده است. با اين همه، ماشين در ترجمة جملة امري ساده‌اي مثل: «Give me the book» با مشكل چنداني مواجه نبوده و آن‌را به صورت «به من كتاب را بدهيد» ترجمه مي‌كند، هرچند در اين مورد هم بايد جاي «كتاب را» و «به من» عوض شود.

گروه 14. Nor در آغاز جملات، علامت تخفيف: احتمالاً به اين برنامه، اطلاعات دستوري مناسب دربارة «nor» داده نشده است. ضمناً بايد كلمات را به صورت كامل تايپ كرد و از تخفيف[10] پرهيز نمود.

31. I don’t like him, nor do I know him.

من تي ـ را مي‌پوشانم به او علاقه داشته باشد، همچنين من او را حتماً بشناسم.

«پديده» «don’t» را دو واژه به شمار مي‌آورد؛ «don» را فعل و «t» را مفعول مي‌داند و از اين‌رو در ترجمه‌اش عبارت «تي ـ را» مشاهده مي‌شود. ضمناً نتوانسته درك كند كه علت وارونه‌شدن توالي فاعل و فعل كمكي در «do I» تأكيد نيست، بلكه به خاطر وجود «nor» است. براي جملة 31 ترجمة زير پيشنهاد مي‌شود:

نه از او خوشم مي‌آيد و نه او را مي‌شناسم.

گروه 15. حروف تعريف معين و نامعين: يكي از كاربردهاي حرف تعريف نامعين (a يا an) عام[11]‌بودن آن‌ است، يعني به تمامي اعضاي يك طبقه يا گروه دلالت مي‌كنند.

يك بچه بايد با ادب باشد.
32. A child should be polite.

مجبوربودن كهنه بزرگ است.
33. The old should be honored.


جملة 32 دستوري است، اما كاربرد «يك» در آغاز جمله، غيرعادي است؛ يعني ماشين ترجمه اين نكته را ناديده گرفته كه «a child» يعني «تمام بچه‌ها» و نه «يك بچه». در جملة 33 نيز مي‌بينيم كه ترجمه ارائه‌شده كاملاً اشتباه، غيردستوري و بي‌معنا است. شايد عامل اين خطا، نبود اسم پس از صفت «old» باشد. درحقيقت «the old» يعني «the old people»، ولي ماشين نتوانسته اين قسمت حذف شده را ترميم كند.

گروه 16. نقل‌قول غيرمستقيم: جملة 35 در انگليسي نقل‌قول غيرمستقيم اخباري ناميده مي‌شود. ترجمة ارائه‌شده توسط «پديده» براي اين جمله، غيردستوري و بي‌معنا است.

32. He said that he had gone to the cinema the day before.

او گفت او به سينما روز رفته بود قبلاً.

به نظر مي‌رسد عامل اصلي بروز چنين مشكلي وجود عبارت «the day before» باشد. مي‌دانيم كه در تبديل جملة خبري از مستقيم به غيرمستقيم واژة «yesterday» به «the day before» تبديل مي‌شود، ولي «پديده» نتوانسته بين اين دو ساختار متفاوت، رابطه‌اي برقرار كند و درنتيجه ترجمة نادرستي را توليد كرده است.

گروه 17. جملات شرطي بدون if : مي‌دانيم كه در جملات شرطي انگليسي مي‌توان if را حذف كرد. در اين حالت جاي فعل كمكي و فاعل عوض مي‌شود. مثلاً
«if I were you» به «were I you» تبديل مي‌شود و...

من ثروتمند بودم، من يك ماشين مي‌خرم.
36. Were I rich, I would buy a car.


ترجمة «پديده» براي جملة فوق، غيردستوري و بي‌معنا است. به نظر مي‌رسد عامل بخشي از اين اشكال، حذف if و جابه‌جايي فاعل (I) و فعل كمكي (were) باشد. ضمناً پديده «would buy» را «مي‌خرم» ترجمه كرده كه نادرست است. درواقع جملة فوق جملة شرطي نوع دوم است و دربارة چيزي خلاف واقعيت صحبت مي‌كند. مثلاً در جملة فوق، فرد ثروتمند نيست و بنابراين نمي‌تواند ماشين بخرد. براي جملة 36 ترجمة زير پيشنهاد مي‌گردد: اگر ثروتمند بودم ماشين مي‌خريدم.

گروه 18. مالكيت: همان‌گونه كه در گروه 14 و مثال 31 مشاهده گرديد، «پديده» don’t را دو واژه فرض كرد و بنابراين آن را به صورت فعل «don» و مفعول مستقيم «t» درنظر گرفت. در جملة 37 نيز پديده چنين اشتباهي را تكرار كرده است.

من به علي رفتم؟
37. I went to Ali’s.


مشاهده مي‌شود كه «پديده» نتوانسته بين «Ali’s» و «Ali’s house» رابطه‌اي برقرار كند و بنابراين «to Ali» را عبارت «حرف اضافه‌اي» فرض كرده و نتوانسته هويت «s» را مشخص سازد. براي جملة 37 معادل زير پيشنهاد مي‌گردد: من به خانة علي رفتم.

مشكلات ماشين ترجمة «پديده»
از جمله مهم‌ترين دلايل بروز مشكلات ذكرشده براي «پديده»، مي‌توان به موارد زير اشاره كرد:

1. اين ماشين ترجمه نسبت به مخاطبان حساس نيست. گاهي مخاطبان يك متن را افراد عادي تشكيل مي‌دهند و گاه افرادي متخصص و حرفه‌اي. پديده براي هر دو گروه به يك شكل ترجمه مي‌كند؛

2. «پديده» در ترجمة متون تخصصي و محدود كه موضوع و سبك خاصي را داشته باشند، موفق است، ولي در ترجمة متون عام‌تر دچار مشكل مي‌باشد؛

3. با گذشت زمان معناي واژه‌ها تغيير مي‌كند. به همين خاطر اصلاح مداوم برنامه و واژگان ماشين ترجمه ضروري است كه البته نيازمند صرف هزينه‌هاي بسيار مي‌باشد؛

4. ماشين ترجمة «پديده»، سخنگوي بومي يك زبان خاص نيست، از اين‌رو در برخورد با موقعيت‌هاي جديد موفق نيست؛

5 . تقسيم‌بندي و تحول واژه‌ها در زبان‌هاي مختلف يكسان نيست. مثلاً ممكن است دو مفهوم در يك زبان با يك واژه بيان شوند و در زبان ديگر با دو واژه. مثلاً واژة bank در زبان فارسي به معناي «حاشية رودخانه» و «يك مركز مالي» است، ولي در انگليسي هر دو مفهوم توسط bank نشان داده مي‌شود. يا در فارسي «ماهي» هم به معناي «موجودي زنده در آب» است و هم «نام يك غذا، مثل ماهي با پلو» و... ولي اين دو مفهوم در اسپانيايي با دو واژة pez (ماهي زنده) و pescado (خوراك ماهي) نشان داده مي‌شود.

ماشين ترجمة «پديده» در تفكيك و تشخيص معاني مختلف يك واژه، بويژه واژه‌هاي هم‌آوا ـ هم‌نگاشت[12] مشكل دارد.

سه اشكال عمده كه اكثر ماشين‌هاي ترجمه از جمله «پديده» با آن مواجه‌اند عبارت‌اند از:

الف) ناتواني اين‌گونه ماشين‌ها در تميز بين كاربردهاي عام و تخصصي يك واژه. مثلاً bus در متون عام به معناي «اتوبوس» است، ولي در متون تخصصي مربوط به رايانه، به «بخشي از رايانه» اشاره دارد.

ب) ناتواني در تميز بين كاربردها و مفاهيم مختلف واژه‌هاي عام. مثلاً جملة «The pen is in the box» و «The box is in the pen» را درنظر بگيريد. Pen در جملة اول هم به معناي «وسيله‌اي براي نوشتن» (قلم داخل جعبه است) و هم به معناي «تخت بازي بچه كه دور آن حصار چوبي يا ... نيز كشيده مي‌شود» (تخت بچه در جعبه است/ داخل بسته‌بندي مي‌باشد). اما در جملة دوم يكي از اين دو معنا نامربوط است. يعني نمي‌توانيم بگوييم «جعبه در خودكار است»، بلكه فقط مي‌توانيم بگوييم «جعبه روي تخت بچه است». ماشين ترجمه تنها در صورتي مي‌تواند چنين جملاتي را درست ترجمه كندكه از اندازة نسبي اشيا نيز باخبر باشد.

ج) حساس‌نبودن به بافت و مخاطب.

اما ريشة اين‌گونه مشكلات در چيست؟ آيا به تئوري زباني اشكالي وارد است؟

تئوري زباني
تئوري زباني غالب، بر روابط دستوري در جمله و نحو تأكيد مي‌كند. حتي در دستور جهاني، «چامسكي» نحو را خودكفا و مستقل از معنا مي‌داند و بحث دربارة معنا را در حاشيه قرار مي‌دهد. به نظر مي‌رسد اين نوع تئوري مبتني بر نحو، عامل بخشي از مشكلات ماشين‌هاي ترجمه باشد.

تئوري زباني به بافت توجهي نمي‌كند و جملة منفرد را كه توسط گوينده در محيط زبان آرماني توليد مي‌گردد و توسط شنونده درك مي‌شود مبناي مطالعه قرار مي‌دهد. بايد اذعان كرد كه دستور و نحو به تنهايي نمي‌توانند رايانه را به توليد ترجمه‌اي چون انسان مترجم وادارند. درواقع، به برنامه‌اي نياز است كه همزمان به نحو و معنا بپردازد. ماشين ترجمه بايد نسبت به معنا حساس باشد.

اما چگونه مي‌توان در ماشين ترجمه، نسبت به معنا حساسيت ايجاد كرد؟ براي انجام اين كار لازم است در تئوري‌هاي زباني موجود و برنامة تعريف‌شده براي ماشين‌‌هاي ترجمه، قدرت تعقل و تفكر را وارد كنيم. قدرت انتخاب و تعقل همان موهبتي است كه انسان از آن برخوردار است. رايانه در انتخاب كاري كه انجام مي‌دهد آزاد نيست. اين برنامه است كه به ماشين مي‌گويد چه كاري را انجام دهد و چه كاري را انجام ندهد. مهم‌تر از همه آ‌ن‌كه ماشين از درك كاري كه انجام مي‌دهد عاجز است. ويژگي مهم ديگر تعقل و تفكر آن است كه همزمان مي‌تواند در بيش از يك حوزه كار كند و فرد داراي قدرت تعقل بر اين نكته واقف است كه در مورد يك پديده يا واقعيت، بيش از يك تفسير ممكن است وجود داشته باشد.

نتيجه‌گيري
تعقل و تفكر اساس كار زبان انسان را تشكيل مي‌دهد و ماشين فاقد آن است.

ريشة مشكلات امروزي ماشين‌هاي ترجمه را بايد در سه چيز جستجو كرد:

1. برنامه‌هاي نادرست كه به ماشين داده مي‌شود و بيشتر آن‌ها ناشي از كم‌اطلاعي يا بي‌اطلاعي برنامه‌نويسان مي‌باشد. ضمناً ضروري است براي داشتن برنامه‌هاي مناسب، در گروه برنامه‌نويسان، زبانشناسي مجرب نيز گنجانده شود تا با تحليل ساختارهاي مختلف زبان، الگوهاي مناسب را براي تهية برنامه در اختيار برنامه‌نويسان قرار دهد.

2. با ضعف موجود در تئوري زباني، طبيعي است كه نمي‌توان زبان را جداي از معنا بررسي كرد. حتي وقتي دربارة آواهاي زباني صحبت مي‌كنيم، به معنا نيازمنديم (مثلاً جفت‌هاي كمينه را براي تعيين واج‌هاي زبان به‌كار مي‌بريم). بنابراين چنانچه تئوري زباني به گونه‌اي اصلاح گردد كه معنا را نيز لحاظ كند مي‌توان بخش ديگري از مشكلات ماشين‌هاي ترجمه را حل كرد. البته انجام چنين كاري بسيار دشوار، اما شدني است.

3. اگر بتوانيم به شكلي فقدان چنين قدرتي را ـ يعني همان نعمتي را كه خدا به ما عطا كرده ـ در اختيار ماشين قرار دهيم، (كه البته دستيابي به اين هدف بسيار بعيد به نظر مي‌رسد) مشكلات ماشين‌هاي ترجمه را مي‌توان رفع نمود. بنابراين بايد انتظار داشته باشيم كه با توجه به دانش كنوني بشر، حتي در صورتي كه مشكلات دستة اول و دوم رفع گردند، مشكلات دستة سوم به قوت خود باقي بمانند.

سؤالي كه در اينجا مي‌توان مطرح كرد آن است كه اگر به فرض بتوانيم چنين قدرتي را به ماشين بدهيم آيا خواهيم توانست هروقت كه بخواهيم آن را از ماشين بازپس بگيريم؟ يا از ماشين بخواهيم كه برخلاف ميل و ارادة خود (كه به خاطر داشتن قدرت تعقل، پيدا نموده) هر كاري را كه ما بخواهيم، به انجام برساند؟ چنين وضعيتي را «رابينسون» (Robinson, Douglas, 1992) به خوبي به تصوير كشيده است. او مي‌نويسد: اگر ماشين ترجمه بتواند مثل انسان ترجمه كند و از قدرت تعقل و تفكر برخوردار باشد، آيا ترجيح نخواهد داد صبح كه از خواب برمي‌خيزد، به جاي ترجمة متن تجاري يا ... پاي تلويزيون بنشيند و فيلم چارلي را تماشا كند؟!».

منابع 


Borr, B. J. (1993). Machine Translation: a View from the Lexicon. Cambridge, Mass: MIT Press.

Dorr, B. J. (1994). "Machine Translation Divergences: A Formal Descriptipn and Proposed Solution". Computational Linguistics 20 (4). PP 597-634.

Dreyfus, Hubert L. (1992). What Computers Still Can’t Do. Cambridge, MA: MIT Press.

Gerber, Laurie. Working toward Success in Machine Translation. http://www.elsnet.org/mt2010/gerber.pdf.

Hovy, E. H. and Nirenburg (1992). "Approximating an Interlingua in a principle Way". Proceedings of the DARPA Speech and Natural Language Workshop. Arden House , NY.

Huchins, W.J. (1986). Machine Translation: past, Present, Future. Chichester: Ellis Horwood Publishing.

Kay, Martin. Machine Translation

http://www.isadc.org/kay.html.

Melby, Alan and C. Terry warner (1995). The possibility of Language: a discussion of the Nature of Language, with Implications for Human and Machine Translation. (in Press) Ams

Comments (4) Posted to ترجمه ماشینی 05/01/2011 Edit

ترجمه ماشینی


 

 ربات ها به زودی جایگزین مترجمین انسانی می شوند...

در این وبلاگ مطالب بسیار مفیدی درباره ترجمه ماشینی ارائه می گردد که امیدوارم مورد رضایت شما

 علاقه مندان و بینندگان وبلاگ قرار بگیرد.

 

ترجمه ماشینی

ترجمه ماشینی _ مقدمه

ترجمه ماشینی _ پردازش زبانهای طبیعی

ترجمه ماشینی _ مفهوم ترجمه و ترجمه ماشینی

ترجمه ماشینی _ روشهای موجود و شیوه های ارزیابی آنها

ترجمه ماشینی _ کارهای فعلی در زبان فارسی

 

لینک های ذیل نیز برای دانلود فایل ها و مقاله های مرتبط با موضوع ترجمه ماشینی قرار داده شده است.

سخنرانی توسط دکتر عبدالحسین صراف زاده در مورد ترجمه ماشینی مبتنی بر آمار

 

 مقاله ای در مورد سیستم ترجمه ماشینی آماری مبتنی بر عبارت فارسی انگلیسی

مطالعه و بررسی ابزارهاي آماده براي تحلیل پیکره متنی زبان فارسی

بررسی ابعاد و تفاوت هاي پیکره هاي برچسب داده اي و پیکره هاي خام در زبان فارسی  

امکان سنجی پروژه هاي زیرساختی کاربري خطو زبان فارسی در محیط رایانه اي 

بررسی ابعاد و لایه هاي ابهام در واژگان مشابه زبان فارسی 

  گروه اعداد در ترجمه ماشيني 

 دریافت اطلاعات HTML وبلاگ در موضوع ترجمه ماشینی در قالب فایل pdf

دریافت فایل پاورپویینت ترجمه ماشینی

 دریافت فایل پاور پویینت ترجمه ماشینی مبتنی بر آنتولوژی 

 

مهندس احمد استیری

Comments (4) Posted to ترجمه ماشینی 01/02/2011 Edit

ترجمه ماشینی _ کارهای فعلی در زبان فارسی

 

 

 

در سال 1372، در آزمايشگاه پردازش زبان طبيعي داشنگاه صنعتي شريف، مهرنوش شمس فرد ( 1373 ) سامانه اي به نام دنا طراحي و پياده نمود. در اين سامانه با به كارگيري نظريه وابستگي مفهومي شنك ( 1975 )، جمله هاي فارسي به شبكه اي از مفهوم ها و روابط ميان آنها تبديل مي شوند.
پس از آن پروژه های متعدد دیگری در حیطه¬ی زبان فارسی در موضوعات ذیل به انجام رسیدند:
پردازش نحوی جمله ها از جمله گروه های اسمی و جمله های مرکب، طراحی و پیاده سازي بخش واژگان و نيز اركان ساختواژي، تقویت بخش استنتاج گر پروژه دنا، بررسي شيوه هاي بازنمايي معنا و انتخاب يك شيوه مناسب براي سامانه دنا 2 و پروژه های دیگری که بر روی واكافت واژه اي، واكافت ساختواژي، واكافت نحوي و واكافت معنايي متمرکز شده بودند.  
 در يك تحقيق ديگر نیز  ماشيني كردن عمل ترجمه از يك زبان محاوره اي به زبان محاوره اي ديگر با قابلیت يادگيري ماشين به صورت خودکار مورد بررسی قرار گرفت. از آنجا كه در اين روش ترجمه، براي طراحي الگوريتم هاي ارائه شده جهت ايجاد پايگاه دانش و استنتاج دانش از آن از هيچ گونه اطلاعات پيش فرضي در زمينه چگونگي ساختار جملات زبان هاي مبدا و مقصد و نقش كلمات در جمله استفاده نشده است، مترجم حاضر مستقل از زبان هاي مبدا و مقصد، توانايي انجام عمل ترجمه از هر زبان به زبان ديگر را دارد.  [7] 
در حال حاضر دكتر عبدالحسن صراف زاده (رئيس دانشكده كامپيوتر و فناوري اطلاعات دانشگاه يونيتك نيوزيلند) با بهره گیری از روشهای آماری، چندین سال است که بحث ترجمه ماشینی را در دانشگاه خود همراه با یک تیم تحقیقاتی دنبال می نمایند و به نتایج تقریبا قابل قبول و رضایت بخشی نیز نائل گردیده اند. موفقیت اصلی گروهی پژوهشی- تحقیقاتی ایشان بیشتر در بخش ترجمه ماشینی انگلیسی به فارسی بوده است چرا که پیکره بسیار عظیمی را مشتمل بر 13 میلیون جمله در بخش پیکره تک زبانه خود به زبان فارسی یعنی در بخش نهایی (Persian monolingual corpuse) دارا می باشند و این امر باعث کسب نتایج بهتر آنان نسبت به ترجمه های گوگل میگردد. این در حالیست که گوگل دقیقا وضعیتی عکس این حالت دارد و متقابلا در ترجمه فارسی به انگلیسی بسیار قوی عمل می نماید. در حال حاضر در بخش (English-Persian parallel corpuse) تنها یک میلیون جمله وجود دارد که توسط نرم افزار Microsoft Aligner جمله به جمله و نظیر به نظیر align میشوند و افزایش هر چه بیشتر این پیکره نیز هر چند کاری دشوار و زمانبر است، باعث افزایش دقت ترجمه ماشینی ما خواهد شد. [8] لذا مجددا  روش ترجمه ماشینی با بهره گیری از روشهای آماری به طور کامل تشریح می گردد:
ترجمه ی ماشینی آماری یکی از راه‌های ترجمه ی ماشینی است که در آن فرآیند ترجمه با مدل‌های آماری انجام می‌شود. این مدل‌های آماری با کمک آنالیز عبارات متنی دوزبانه است. روش آماری با روش ترجمه بر پایه دستور و ترجمه بر پایه نمونه در تضاد است. نخستین ایده ی ترجمه ی ماشینی آماری را وارن ویور در سال 1949 ارائه کرد که در آن نظریه اطلاعات کلود شانون را به کار بست. در سال 1991 این ایده توسط پژوهشگران ای بی ام در مرکز پژوهشی جی واتسون بازتعریف شد و سبب محبوبیت ترجمه ماشینی در سال‌های اخیر شده است. امروزه این روش بهترین و گسترده‌ترین روش ترجمه ی ماشینی است.
ترجمه ماشینی به روش آماری، سعی در تولید ترجمه هایی دارد که از روشهای آماری مبتنی بر پیکره‌های متنی دوزبانی استفاده می کنند. همانند پیکره کانادایی هانسارد (Canadian Hansard corpus)، بایگانی انگلیسی-فرانسوی مجلس کانادا و یوروپارل(EUROPARL) و بایگانی پارلمان اروپا.
درحال حاضر این چنین پیکره هایی موجودند و نتایج ثمربخشی از ترجمه متون از نوع مشابهی، بدست می آید اما این چنین پیکره ای هنوز بسیار کمیاب است. اولین نرم‌افزار آماری ترجمه ماشینی، کاندید(CANDIDE) تولیدی شرکت آی‌بی‌ام بود. گوگل نیز سیسترن(SYSTRAN) را برای سالهای متمادی استفاده کرد اما نهایتا در اکتبر 2007 به مترجمی آماری تغییر روش داد. به تازگی، گوگل قابلیت‌های ترجمه خود را بوسیله دادن 200 میلیون کلمه از اسناد سازمان ملل بعنوان ورودی سیستم-برای تعلیم سیستم خود- بهبود بخشیده اند. وبدین سان دقت ترجمه‌ها بهبود یافته است.[9]
اصول
ایده ترجمه ماشینی از نظریه اطلاعات سر برآورده است. سند (متن خواهان ترجمه) بر پایه احتمال(p(e|f ترجمه می‌شود که رشته ی e در زبان بومی (برای نمونه انگلیسی) ترجمه ی رشته ی f در زبان بیگانه (برای نمونه فرانسوی) است. معمولا، این احتمالات با استفاده از تکنیک‌های برآورد پارامتر برآورد می‌شوند.
مزیت‌ها
مهمترین مزیت‌های ترجمه ی ماشینی آماری در برابر روش‌های سنتی عبارتند از:
 بهره‌گیری بهتر از منابع
 حجم بسیاری از قالب ماشین خوان که در زبان طبیعی گفته می‌شود وجود دارد.
 معمولاً سامانه‌های ترجمه آماری مختص جفت زبان خاصی نیستند و بر هر جفت زبانی سازگارند.
 سامانه‌های ترجمه بر پایه دستور نیازمند توسعه دستی دستورهای زبان‌شناسی است که می‌تواند پرهزینه باشد و اغلب بر دیگر زبان‌ها سازگار نیست.
 ترجمه طبیعی‌تر (روان‌تر و نزدیک‌تر به گفتار)
موانع و مشکلات ترجمه ماشيني در زبان فارسي  
مشکلات زبان فارسی که باعث ابهام در این زمینه ترجمه ماشینی می شود به ۳ دسته تقسیم می شود.   ۱-مشکلات رسم الخط فارسی: چون زبان فارسی از رسم الخط عربی استفاده می کند دارای مشکلاتی فراوان از جمله نداشتن حرکت یا آوای کوتاه(a,e,o) می باشد. همچنین رسم الخط فارسی به دلیل چسبیده بودن حروف به سختی قابل پارس کردن است. ۲- مشکلات نحوی زبان فارسی: نظیر مشکلات افعال و... ۳- استثناها: نظیر اصطلاحات و light verb و ....
در حقیقت در همة ترجمه‌ها ـ چه وقتی که از فارسی به انگلیسی و چه وقتي كه از انگلیسی به فارسی صورت می‎گیرند ـ مشکلات وجود دارند. مثلاً اغلب می‎گویند تسلط به زبان مبداء و مقصد و موضوع ترجمه برای ترجمه کفایت می‎کند. به عبارتی ديگر تسلط زبانی کافی است. در حالي كه اينگونه نيست و شرايط ديگري مورد نياز هستند، شما باید تسلط فرهنگی و اجتماعی هم در كنار آن تسلط زباني داشته‌ باشيد. بنابراين مشکلات زبانی در همه جا خودشان را نشان می‎دهند. در انتخاب واژگان و معادل‎سازی نیز ما با مشکلات متعددی روبرو هستیم. اما اینکه این مشکلات و بعضاً ضعفها محسوس یا نامحسوس هستند، یک سخن دیگر است و در این باره هم نگرشهای مختلفی وجود دارند. وقتی که شما از انگلیسی به فارسی ترجمه می کنید یک گرته‎برداری به صورت بسیار رایج و انتقال ساختهای نحوی نارایج به زبان فارسی صورت می گیرد. بنابراین لازم است در ابتدا با اجزای اصلی مورد نیاز در تجزیه و تحلیل جملات برای ترجمه ماشینی آشنا شویم.
همان طور كه در بالا توضيح داده شد،‌ مهمترين بخش يك سامانه مترجم ماشيني، تشخيص نقش كلمات در جمله و تشخيص معناي صحيح آنها با توجه به متني است كه آن كلمه در آن قرار گرفته است. براي تشخيص معنا ي صحيح كلمات از سه روش مي توان استفاده نمود: در روش اول براي آموزش سامانه به يك مجموعه كلمات فارسي ابهام زدايي شده نياز مي باشد تا از روي آن بتوان عمل رفع ابهام براي كلمات جديد را در متن هاي مختلف انجام داد كه متأسفانه هنوز اين مجموعه به صورت يك فرهنگ فارسي قابل خواندن براي ماشين تهيه و تدوين نگرديده است. يعني اين اطلاعات به صورت دستي وجود دارند، اما نسخه رايانه اي از آنها با يك استاندارد معين براي تعريف هر كلمه و معني و نقش هاي مختلف آن وجود ندارد. بديهي است براي اين كار ابتدا با يد با يك مركز زبان شناسي معتبر، استاندارد ذخيره سازي اطلاعات و انواع آن را تدوين نمايد و سپس نسخه اي رايانه اي از اين اطلاعات جهت استفاده هاي بعدي تهيه شود. 

در روش دوم نيز سامانه مستقيما از يك فرهنگ لغت استفاده مي كند، باز هم در مورد زبان فارسي اين مشكل وجود دارد كه هنوز فرهنگ هاي لغت فارسي رايانه اي با يك استاندارد مشخص تهيه نشده اند. اين در حالي است كه در زبان انگليسي فرهنگ هاي متعددي مانند net LDOCE, Word يا Roget’s International Thesaurus به صورت MRD يا نسخ قابل خواندن توسط رايانه وجود دارند كه سامانه هاي مختلف مترجم ماشيني از آنها با يكي از روش هاي رفع ابهام مذكور بهره مي جويند. 

از روش سوم رفع ابهام نيز همان طور كه ديده شد صرفا براي لغات خاص و محدود فني يا پزشكي استفاده مي شود، نه براي كليه لغات فارسي و چون متأسفانه هنوز استفاده از اصطلاحات فني فارسي متداول و رايج نشده است، اين روش رفع ابهام در زبان فارسي زياد موفق نخواهد بود. از اين رو براي اينكه بتوان از يك مترجم قوي وبدون مشكل فارسي بهره مند شد، ابتدا بايد مقدمات بر شمرده را فراهم نمود و اين خود تلاش گروهي متشكل از زبان شناسان، مترجمان، اديبان و متخصان رايانه را مي طلبد كه سرآغازي خواهد شد براي رسيدن به اين هدف ملي. 

آینده ترجمه ماشینی
اکنون بسیاری از صاحب نظران برآ نند که ارائه ترجمه خوب ، تنها با داشتن اشراف کامل به واژگان و قواعد نگارشی زبان های مبدأ و مقصد میسر نمی شود، بلکه نیازمند ادراک انسانی از مفاهیم گوناگونی می باشد که ماشین هرگز قادر به فهم آن نیست و نخواهد بود. از نظر برخی افراد، ماشین های ترجمه شفاهی، نرم افزارهای تبدیل کلام به آدمک های گرافیکی که به زبان اشاره صحبت می کنند و یا موبایل هایی که صحبت های شخص آن طرف خط را به زبان دیگر برمی گردانند شاید فقط در حد سرگرمی جلوه کند؛ لیکن از یاد نبریم که بسیاری از امکانات پیش پا افتاده و کاملا بدیهی زندگی امروزی ما یکصد سال پیش حتی به مخیله دانشمندان نیز راه پیدا نمی کرد.
همان طور که گفته شد منظور از ترجمه متن توسط ماشین ترجمه - به پشتوانه پیشرفت هایی که به ویژه در دهه اخیر در تحقق بخشیدن به این رؤیای پنجاه ساله به دست آمده است- فقط برگردان متن نوشتاری نیست، بلکه ترجمة نوشته به صوت، برگردان نوشته به نمایش گرافیکی زبان اشاره ، ترجمه صوت به صوت و یا ترجمه صوت به متن نیز- چه در داخل یک سیستم زبانی و چه به زبان دیگر- و وظایف دیگری از این دست نیز قرار است به عهده ماشین های مترجم گذاشته شود. به عنوان نمونه می توان به نوعی سیستم تلفن همراه طراحی شده توسط شرکت   NEC  اشاره کرد که برای ترجمه مکالمات تلفنی ژاپنی به انگلیسی طراحی شده است؛ یا از نرم افزارهایی یاد کرد(digital avatars)  که برای کمک به ناشنوایان و یا کم شنوایان طراحی شده و مراحل تکمیلی خود را می گذراند و قرار است بتواند آنچه را که میشنود با استفاده از تصویر آدمکی که با زبان اشاره صحبت می کند، به ناشنواها منتقل نماید.
جمع بندی و نتیجه گیری
فراگيري ترجمه ماشيني عبارت اند از: واكافت واژه اي، واكافت ساختواژي، واكافت نحوي، واكافت معنايي، تشخيص نقش كلمات در جمله، تشخيص معناي صحيح كلمات ( با توجه به جمله حاوي و رفع ابهام از كلمات داراي معني مشابه و يافتن معني معادل كلمه در زبان مقصد و تبديل جمله زبان مبدا به جمله زبان مقصد با توجه به دستور زبان مقصد و در صورت نياز اعمال گشتارهاي مناسب براي تبديل جملات مقصد به شكل روساختي آن ). در اين راستا مهمترين بخش يك مترجم كه دقت در آن باعث بالا رفتن دقت كل عمل ترجمه مي گردد،‌ رفع ابهام معنايي از كلمات جملات زبان مبدا ونيز رفع ابهام از ترجمه آنها به زبان مقصد مي باشد. براي رفع ابهام معنايي كلمات سه روش كلي وجود دارد كه عبارت اند از: ( الف ) رفع ابهام با مربي، (‌ب ) رفع ابهام بر مبناي فرهنگ لغت، و ( ج ) رفع ابهام بدون مربي. 
اما مشكل اصلي بر سر راه رفع ابهام از كلمات فارسي اين است كه اگر از دو روش اول استفاده شود، به يك نسخه رايانه اي از مجموعه لغات همراه بانقش هاي مختلفي كه مي توانند به خود بگيرند و معاني مختلفي كه باتوجه به نقش هاي مختلف و يا همنشيني با كلمات مختلف به خود مي گيرند، نياز مي باشد كه متأسفانه اين نسخه رايانه اي و همچنين استاندارد ذخيره سازي اين دسته اطلاعات وجود ندارد كه بايد با كار گروهي متشكل از زبان شناسان، اديبان و متخصصان رايانه ايجاد و جهت سيستم هاي مترجم زبان فارسي صورت بگيرد. استفاده از روش سوم رفع ابهام نيز خاص لغات فني است كه در زبان فارسي هنوز كاملا جا نيفتاده است . بنابراين با توجه به اين كه دقت در رفع ابهام از معناي كلمات، دقت مترجم را بالا مي برد،‌ هنوز نمي توان سامانه هاي مترجم فارسي مناسب را تهيه و از آنها بهره برداري نمود.
پیشنهادات
اولا که بایستی واژگان معنایی (WordNet) بسیار عظیمی در اختیار داشته باشیم و همچنین با توجه به اضافه شدن لغات جدید در گذر زمان به هر زبان بایستی واژگان معنایی ما بروزرسانی شود و دائما گسترش داده شود.
بایستی توجه داشت که اگر حوزه ی موضوعی متن محدود و کنترل شده باشد، کیفیت ترجمه ماشینی اساساً بهتر خواهد شد.
علاوه بر اين‌ وجود خطاهای‌ تايپی و يا املايی‌ و همچنین خطاهای نحوی و نگارشی در متن‌ می‌تواند در کار ترجمه ماشينی‌ ايجاد اختلال‌ كند. مترجمين‌ ورزيده‌ در رويارويی‌ با كلمات‌ ناشناخته‌ يا ساختارهای‌ پيچيده جملات‌، با مراجعه‌ به‌ منابع‌ معتبر و با بکارگيری تجربيات‌ و دانش‌ فردی و يا از طرق ديگر به‌ حل‌ مشكل‌ و مسأله‌ می ‌پردازند. در ترجمه‌ ماشينی  نيز بايد در مقابل‌اين‌ گونه‌ پديده‌ها ساز و كار مناسبی طراحی نمود تا سيستم‌ به‌ ابزار‌ خاصی‌ مجهز باشد تا اختلالی در امر ترجمه‌ بوجود نيايد. بنابراین بایستی ابزارهای پیش پردازش و پس پردازش بسیار قدرتمندی طراحی گردد که متن را قبل از ورود به فاز ترجمه و همچنین خروجی نهایی را بهینه سازی و استاندارد نماید.

 

[7] امامی م . بررسی مسایل درك متن فارسی و پیاده سازی نمونه هایی از آن. پایان نامه كارشناسی ارشد، دانشكده مهندسی كامپیوتر، دانشگاه صنعتی شریف.،1376.  
[8]  صراف زاده ع. سمینار علمی ، آمفي تئاتر دانشكده مهندسي، 1389 .


[9] Milestones in machine translation - No.6: Bar-Hillel and the nonfeasibility of FAHQT by John Hutchins


 

Comments (1) Posted to ترجمه ماشینی 01/01/2011 Edit

ترجمه ماشینی _ روشهای موجود و شیوه های ارزیابی آنها

 

 

 برای دست یافتن به ترجمه ماشینی می توان روشی مبتنی بر قوانین زبان‌شناسی استفاده کرد، به این معنی که کلمات از نظر زبان‌شناسی ترجمه خواهند شد. (در واقع متناسب‌ترین کلمات مقصد جایگزین کلمات مبدا خواهند شد.)
این موضوع که موفقیت ترجمه ماشینی پیش از هر چیز نیازمند حل مسئله فهم زبان طبیعی است، اغلب مورد بحث است.به طور عام روش‌های قانون مند (Rule Based)، متن را با استفاده از ساختن واسطی سمبلیک -که نهایتاً متن زبان مقصد از آن ایجاد می شود- تجزیه می کنند. هرمی که عمق های متفاوت نمایش واسط را نشان می دهد. ماشین ترجمه بین زبانی، در نوک هرم است که بدنبال آن، ترجمه ی مبتنی بر انتقال و ترجمه مستقیم آمده اند .
سه شيوه عمده سنتی برای ترجمه ماشينی که بر مبنای معماری آنها ماشينهای ترجمه توسعه يافته اند عبارتند از:
1- شيوه مبتنی بر معماری مستقيم يا ترانسفورمر
2- شيوه مبتنی بر انتقال
3- شيوه ميان زبانی
ساير شيوه های ترجمه ماشينی عبارتند از:
4- ترجمه‌ با استعانت‌ از كامپيوتر  يا شيوه مبتنی بر ديالوگ
5- روش مبتنی بر پيکره زبانی
در اين روش ترجمه ماشينی با استفاده از يک پيکره زبانی  که معمولاً متون از قبل ترجمه ای هستند استفاده می شود. 
5-1- روشهای آماری ترجمه ماشينی
سابقه ايده استفاده از روشهای آماری ترجمه ماشينی به دهه 1940 ميلادی بر می گردد اما بلحاظ فقدان امکانات محاسباتی و پيکره زبانی قابل خوانش توسط ماشين که موانعی بر سر راه توسعه اين روش بودند اين روش به تازگی قوت گرفته است. در روشهای آماری ترجمه ماشينی از اطلاعات زبان شناسی استفاده نمی شود بلکه اين گونه ماشينهای ترجمه داده رانده بوده و کليه احتمالات پيکره-رانده از قبل محاسبه شده و بکار گرفته می شوند. از توابع توزيع احتمال کلمات و واژه ها در جملات با استفاده از پيکره های دو زبانی برای يافتن محتمل ترين ترجمه مناسب استفاده می شود. محصولاتی از قبيل  Language Weaver بر  اساس اين روش ارايه شده اند.

لینک دانلود سخنرانی توسط دکتر عبدالحسین صراف زاده در مورد ترجمه ماشینی مبتنی بر آمار 

 

 

5-2- روشهای مبتنی بر مثال ترجمه ماشينی  

روشهای مبتنی بر مثال ترجمه ماشينی  که روشهای مبتنی بر حافظه نيز ناميده شده اند. اين روش بر اساس استفاده از جملاتی که به عنوان مثال قبلاً ترجمه شده است استوار است. در اين گونه سيستمها از پيکره های دوزبانه  برای منبع اطلاعات زبانی خود استفاده می کنند. در اين پيکره ها حجم عظيمی از مثالهای ترجمه جملات دو و يا چند زبانه در يک پايگاه داده متنی ذخيره شده است. ماشين ترجمه  حين کار از اين پايگاه اطلاعات استفاده نموده و ترجمه جمله ای در زبان مبدأ که بيشتر به ورودی شبيه باشد به عنوان خروجی به زبان مقصد  ارايه می شود.
واژگان معنایی (WordNet) بسیار عظیم و گسترده از ضروریات و ملزمات مورد نیاز این روش می باشد. واژگان معنایی، گلوگاه ساخت بسیاری سیستم های پردازش زبان فارسی است. وجود یک واژگان معنایی و در شکل وسیعتر یک واژهستان شناسی برای این زبان در ترجمه ماشینی، بازیابی اطلاعات تک و دوزبانه، خلاصه سازی اسناد، مدیریت محتوا در سیستم های آموزشگر، خطایاب نحوی و معنایی متون، درک و تولید متون فارسی، تشخیص صحبت، تبدیل متن به گفتار، تحلیل نحوی، استخراج اطلاعات از متون و بسیاری کاربردهای دیگر نقش اساسی ایفا می کند. وجود چنین منبعی همچنین می تواند در تهیه منابع زبانی دیگر از جمله پیکره هایی با برچسب معنایی و هستان شناسی های خاص قلمرو کاربرد داشته باشد.
6- سيستم های زبان کنترل شده
در حقيقت اين گونه سيستمها نوعی سيستم ترجمه بر اساس دانش هستند. در برخی موارد متون نوشته شده در زبان مبدأ کنترل شده هستند يعنی اينکه دارای ويژگی استفاده از لغات و واژه های مشخص و حتی ساختار کنترل شده جملات می باشند. مزيت اين برخورد و کنترل زبان مبدأ در اين است که متون نوشته شده کمتر دارای ابهام بوده و لذا ماشين ترجمه کمتر مشکل ابهام زدايی خواهد داشت. در نتيجه علاوه بر توليد متن اوليه بهتر، ماشين ترجمه می تواند متن خروجی به چندين زبان مقصد را  با کيفيت بهتر توليد نمايد.
7- سيستم‌ تمام‌-خودکار ترجمه‌ ماشينیFAHQT
توسعه سيستم‌ ترجمه ماشينی تمام‌ اتوماتيك‌ ‌با كيفيت‌ بالا يا ‌FAHQT از ابتدا به عنوان يک ايده آل دنبال می‌ شد. ‌سيستم‌ های توسعه يافته هرگز به اين ايده آل دست نيافتند. پيشرفتهای‌ حاصله ‌ در سالهای‌ اخير در زمينه‌ هوش‌ مصنوعی  ، سيستمهای فازی   و   شبكه‌ های عصبی ‌ تأثير انكارناپذيری در تكامل‌ و توسعه‌ ترجمه‌ ماشينی‌ داشته‌ است‌. اين‌سيستم‌ شکل تكامل‌ يافته‌ سيستمی است‌ كه‌ نياز به‌ پيش‌- ويرايش  و پس‌-ويرايش  داشته‌ است‌. بديهی است‌ كه‌ ويراستاری ‌های ياد شده‌ توسط فرد متخصص‌ انجام‌ می شد ولی در حال‌ حاضر اين‌گونه‌ سيستم‌ها مجهز به‌ غلط ياب‌ املايی و نحوی نسبتاً قدرتمندی  هستند‌ كه‌ قبل‌ از انجام‌ ترجمه‌، متن‌ زبان‌ مبدأ را آماده‌سازی می كند. پس‌ ازانجام‌ ترجمه‌ نيز، از طريق‌ خطاياب‌ نحوی زبان‌ مقصد، متن‌ خروجی ويرايش‌ می ‌شود و در نهايت‌ ويرايش‌ نهايی ‌ توسط ويراستار انجام‌ می شود.
مقایسه کلی چندی از روشهای ترجمه ماشینی
مبنای کار سیستم های قدیمی تر ترجمه ماشینی مبتنی بر واژه نامه ( Dictionary-based) و بر اساس قواعد زبا نشناسی (Rule-based ) بود. ( مانند Systran دراین روش که به Interlingual Machine  Translation نیز شهرت دارد،) جملات متن مبدأ بر اساس اصول دستور زبان و مجموعه گسترده ای از لغات که به کامپیوتر داده شده است حلاجی شده و پیش از ترجمه به زبان مقصد، به یک زبان واسطه برگردانده می شود. سپس متن زبان واسطه بر اساس همان قواعد داده شده به سیستم و با استفاده از مناسب ترین و رایج ترین معادل های واژگان در زبان مقصد ترجمه می شود. امروزه در ماشین های ترجمه غالبا از روش های آماری (Statistical) و مقایسه و تطابق  (Analogy)و استفاده از نمونه های موجود (Example-based) استفاده می شود. اصل کار روش های جدید مبتنی بر استفاده از پیکره های زبانی (Corpora) بسیار عظیمی می باشد که متون معادلی را به زبان های مبدأ و مقصد در گنجینه خود دارند و هنگام معادل گزینی، کار خود را بر اساس مقایسه متونی که باید ترجمه شود، با متون و ترجمه های مشابه آن ها در پیکره زبانی ذخیره شده انجام می دهند. از آنجا که تهیه و ذخیره چنین پیکره زبانی کار آسانی نیست، طراحی و استفاده این سیستم در ترجمه ماشینی نیز عموما فقط از عهده شرکت های بزرگ و قدرتمند بر می آید.
دشواری کار ترجمه خودکار، بدست آوردن اطلاعات کافی از نوع صحیح آن برای پشتیبانی روشی خاص می باشد. به عنوان مثال یک پیکره وسیع چند زبانی از داده ها، برای روشهای آماری مورد نیاز می باشد. حال آنکه برای روشهای مبتنی بر دستور زبان لازم نیست. اما از سویی دیگر روشهای مبتنی بر دستور زبان نیاز به یک زبان شناس حرفه ای برای طراحی دقیق دستور زبانی که استفاده خواهد شد، دارند. برای ترجمه بین زبان‌های نزدیک بهم، تکنیکی به نام ترجمه ماشینی مبتنی بر انتقال سطحی ممکن است استفاده شود.
بنابراین میتوان روشی را تحت عنوان روش پیوندی ترجمه ماشینی به کار برد.
8- ترجمه ماشینی پیوندی (Hybrid)
روش پیوندی، نقاط قوت دو روش آماری و قانونمند را باهم ادغام می کند.[5] بسیاری از شرکتهای ترجمه ماشینی (همانند آسیا آنلاین و سیسترن(SYSTRAN)) مدعی داشتن روشی چندگانه مبتنی بر دو روش قانونمند و آماری در ترجمه ماشینی، هستند. این روشها به دو گونه مختلف زیر می باشند :
قوانین در مرحله دوم توسط روشهای آماری پردازش می شوند. در این روش ترجمه بوسیله موتورهای قانونمند انجام میشود. سپس معیارهای آماری برای تنظیم/تصحیح خروجی موتور قانونمند اعمال میشوند. معیارهای آماری از ابتدا توسط قوانین هدایت میشوند. قوانین برای پیش-پردازش داده‌ها برای هدایت بهتر موتور آماری استفاده می شوند. قوانین همچنین برای پس-پردازش خروجی موتور آماری برای پیاده سازی عملیاتی همچون نرمال سازی استفاده می شوند.این روش قدرت،کنترل و انعطاف پذیری بسیار بیشتری دارد.
ابهام زدایی از ترجمه ماشینی
ابهام زدایی از کلمات با یافتن ترجمه مناسب برای کلمه ای با بیش از یک معنی در ارتباط است. يكي از اولين مشكلاتي كه هر سيستم پردازش زبان طبيعي با آن درگير است، مسئله ابهام معنايي و ساختاري كلمات است.  بخش عمده اي از اين ابهام به كمك روالي به نام نشانه گذار بخش كننده جملات كه براي تعيين نقش كلمات در جمله به كار مي رود، مرتفع مي گردد.
امروزه روشهای بسیاری برای حل این مشکل بوجود آمده اند که این روشها بطور تقریبی به دو دسته ی روشهای "سطحی" و "عمقی" تقسیم میشوند. روشهای سطحی تصور میکنند که هیچ دانشی از متن ندارند.آنها به سادگی روشهای آماری را برای کلمات اطراف کلمه مبهم، اعمال میکنند. اما روشهای عمقی دانشی وسیع از کلمه را متصور میشوند. تا بحال، روشهای سطحی موفقیت بیشتری داشته اند. آقای کلود پایرون(Claude Piron)، یکی از مترجم‌های بسیار قدیمی سازمان ملل و سازمان بهداشت جهانی، نوشته است که ترجمه ی ماشینی، در بهترین نوع آن، آسان‌ترین بخش کار مترجمان را میتواند انجام دهد.بخش سختتر و زمان گیر معمولاً در ارتباط با تشخیص ابهامات متن منبع می‌باشد که این عمل نیاز به برطرف کردن آشفتگی‌های دستور زبانی و لغوی زبان مقصد دارد.[6]
ارزیابی ترجمه ی ماشینی
یکی از مسائلی که همواره در زمینه ترجمه ی ماشینی مورد توجه بوده‌است، روشها و پارامترهای ارزیابی نتایج ترجمه‌است. قدیمی‌ترین روش استفاده از داورهای انسانی برای ارزیابی کیفیت یک ترجمه می باشد. ابزارهای ارزیابی خودکار شامل بلو محصول شرکت آی‌بی‌ام(BLEU)، نیست(NIST) و متئور(METEOR) می باشند. به تجربه می توان دریافت که ماشین های ترجمه¬ی بسیار پیشرفته نیز - لااقل فعلا- قادر نیستند دقّت، روانی و وضوحی را که از یک ترجمه مطلوب انتظار می رود در کار خود نشان دهند. آزمودن این نرم افزارها با استفاده از متون مغلق، طولانی و یا حاوی لغات چند معنا به راحتی نشانگر ناتوانی آن ها در حل پیچیدگی های زبانی است. همچنین می توان با ترجمه برعکس میزان انحراف این نرم افزارها را محک زد. هنگامی که متنی را برای ترجمه به زبان دیگر به مترجم الکترونیک وارد می کنیم و سپس ترجمه به دست آمده را مجددا به عنوان متن زبان مبدأ به ماشین می دهیم تا به زبان اولیه برگرداند؛ انتظار می رود که متن اول و سوم اگرچه نه کاملا- بلکه تا حد زیادی مشابه یکدیگر باشند.
جایگزین ارزشیابی دوزبانه
جایگزین ارزشیابی دوزبانه یا BLEU (Bilingual Evaluation Understudy) روشی است برای ارزیابی کیفی متن ترجمه شده توسط ماشین ترجمه یا دستگاه ترجمه ماشینی. کیفیت ترجمه با عددی بین ۰ و ۱ اندازه‌گیری می‌شود. این عدد نمایانگر میزان نزدیکی ترجمه به مجموعه‌ای از ترجمه‌های انسانی با کیفیت خوب است. بنابراین با این روش نمی‌توان قابل فهم بودن ترجمه یا درستی آن از نظر دستوری را ارزیابی نمود. این روش برای ارزیابی ترجمه ماشینی در سطح کلی کاربرد دارد و در حالتی‌که برای ارزیابی تک تک جملات بکار برده شود، بسیار بد کارمی‌کند.

 

[5] Boretz, Adam, "AppTek Launches Hybrid Machine Translation Software" SpeechTechMag.com (posted 2 MAR 2009)
[6] Claude Piron, Le défi des langues (The Language Challenge), Paris, L'Harmattan, 1994.

Comments (8) Posted to ترجمه ماشینی 12/30/2010 Edit

ترجمه ماشینی _ مفهوم ترجمه و ترجمه ماشینی

 

 

فعالیت و کار ترجمه سابقة بسیار طولانی دارد. بعضیها معتقدند که اولین کاری که بشر کرده ترجمه است؛ اگر ترجمه را به معنی برگرداندن فرض کنیم کلام در واقع برگردان اندیشه است. این اولین قدمی است که بشر برای ترجمه برداشته است. در واقع یکی از استراتژیهای ترجمه، از هر زبانی که بخواهید ترجمه کنید، به هدف و نوع متنی که ترجمه می‎کنید بستگي دارد. مثلاً متن تبلیغاتي با متنی که قرار است در یک صفحة اینترنت درج شود و یا با متن ادبی و اخبار سیاسی متفاوت است. چرا که مخاطبها و دوره های مختلف تاریخی توقعات مختلفی از متنها به وجود می‎آورند. [3]
ترجمه ماشینی
ترجمه ماشینی ترجمه‌ای است که توسط کامپیوتر و بدون دخالت فرد انجام می‌شود. ترجمه ی ماشینی(Machine Translation - MT) زیر شاخه ای از زبان‌شناسی محاسباتی می‌باشد که عبارت است از ترجمه ی متنی از یک زبان طبیعی به زبانی دیگر، توسط کامپیوتر. در سطح مقدماتی، ترجمه ماشینی یک جایگزینی ساده برای کلمات از زبان طبیعی به زبان دیگری است. با استفاده از تکنیک‌های زبان‌شناسی پیکره ای، ترجمه‌های پیچیده بیشتری قابل دستیابی هستند. همچنین این تکنیک‌ها کنترل بهتر تفاوت های گونه‌شناسی در زبان، تشخیص عبارات و ترجمه ی اصطلاحات را به خوبی و درستی جدا کردن عبارات نامتعارف در متن، مقدور میسازند.
نخستین تلاش‌ها برای ترجمه توسط رایانه ناموفق بودند، چرا که در آن دوران نظریه¬ی زبان‌شناسی وجود نداشت که بتواند کمک شایانی به پردازش زبان‌ها بکند. در سال ۱۹۵۷ کتاب ساختارهای نحوی اثر نوام چامسکی زبان‌شناس جوان آمریکایی که از آن پس به شناخته‌شده‌ترین چهره¬ی زبان‌شناسی نظری تبدیل شد به چاپ رسید. از آن پس پردازش زبان با حرکت‌های تازه‌ای دنبال شد. [4]
نرم‌افزارهای ترجمه ماشینی کنونی اغلب به کاربر اجازه ی تغییر دلخواه بر اساس حوزه کاری یا حرفه ای دلخواه را می دهند. در واقع ارتقای کیفیت خروجی با استفاده از محدود کردن کلمات جایگزین شونده، انجام میشود. این تکنیک بطور خاص در حوزه ی رسمی یا زبان های فرموله شده استفاده می شود. همچنین کیفیت خروجی بهبود یافته می تواند با استفاده از دخالت انسان بدست آید. برای مثال سیستم هایی موجودند که اگر کاربر بطور کاملا واضحی کلماتی که اسامی خاص هستند را معین کرده باشد، قادر به ترجمه دقیقتری هستند. با ¬¬کمک گرفتن از این تکنیک‌ها ترجمه ماشینی بعنوان یک ابزار برای کمک کردن به مترجمان(انسان ها) و بسیاری از موضوع های محدود، قادر به تولید خروجی قابل استفاده و نهایی است.
براي اينكه بتوان جمله اي را از يك زبان ترجمه و به زبان ديگري تبديل نمود، ابتدا به يك روال تشخيص واژه ها يا واكافت واژه اي و واكافت ساختواژي نياز مي باشد، به طوري كه كلمات ساده و مركب آن زبان از ورودي تشخيص داده شود. سپس بايد تركيب كلمات از نظر نحوي صحيح باشد و جمله متعلق به آن زبان را ايجاد نمايد. حال براي اينكه اين جمله به زبان ديگري برگردان شود، بايد نقش و معناي هر كلمه مشخص و با توجه به دستور زبان مقصد و ترجمه كلمه با توجه به نقش آن، جمله زبان مقصد توليد شود. بنابراين ديده مي شود كه مهمترين بخش، مشخص كردن نقش و معناي كلمات مي باشد نقش كلمات با توجه به محل قرار گرفتن آن در جمله مشخص مي گردد، اما مسئله مهم معني كلمات مي باشد؛ چرا كه تعدادي از كلمات داراي چند معني مي باشد كه اين ابهام بايد به روش مناسبي رفع گردد ( مانينگ و شوتس، 2000 ). در ترجمه ماشيني ابهام هم در معناي كلمات زبان مبدا وجود دارد ( از نظر درك معني آن ) و هم در زبان مقصد و همين باعث مي گردد روند ترجمه دچار مشكل شود.
با این وجود به طور کلی در ترجمه¬ی ماشینی ویژگیهایی وجود دارد که نه تنها از نظر جاذبه و کشش علمی، بلکه، از دیدگاه اقتصادی و دیگر ضرورت‌ها و اقتضاهای عصر، انجام آن را کاملاً توجیه می‌کند.
فرآیند ترجمه
فرآیند ترجمه به شرح زیر است:
1. رمزگشایی معنایی متن مبدا
2. کدگذاری دوباره این معنا در زبان مقصد
در پس این فرآیند بظاهر آسان، عملیات شناختی پیچیده ای واقع است. به منظور رمز گشایی معنای متن مبدا، مترجم باید قابلیت تفسیر و تجزیه تحلیل تمام ویژگی‌های متن را داشته باشد. یک فرآیند که احتیاج به دانش عمیقی از دستور زبان ، جمله‌شناسی(نحو)، معناشناسی و اصطلاحات از زبان مرجع دارد به همان اندازه باید دانش مربوط به فرهنگ صحبت کنندگان آن زبان را نیز داشته باشد. از آن جهت، چالشی در ترجمه ماشینی وجود دارد که چگونه یک کامپیوتر را برنامه نویسی کنیم که بتواند همانند یک انسان متنی را بفهمد و بتواند یک متن جدید در زبان مقصد بسازد که بنظر می رسد توسط انسان نوشته شده است. این مساله ممکن است به روشهای مختلفی حل شود.
انگيزه ترجمه ماشينی
در طول چند دهه‌ اخير و همزمان‌ با گسترش‌ و پيشرفت‌ زبان‌شناسی محاسباتی ‌‌، در بسياری از كشورهای‌ پيشرفته‌، تلاشهای‌ همه‌جانبه‌ و پيگير در جهت‌ ترجمه‌ متون‌ به کمک كامپيوتر انجام‌ گرفته است.‌ با توجه‌ به‌ تنگناها و مسائل‌ خاص‌ مطرح در زمينه ترجمه ماشينی و علی رغم کاستی ها، حاصل اين فعاليتها‌ درخور توجه‌ بوده‌ است‌. توسعه ارتباطات از طريق اينترنت نيز که بصورت يک بستر  جهانی برای مبادله افکار و اطلاعات درآمده است خود مستلزم توسعه ماشين های ترجمه می باشد تا با سرعت بتوان اطلاعات را از يک زبان به زبان ديگر برگرداند.
رشد جالب توجه شبکه‌های اجتماعی،همانند فیس بوک یا پیام‌رسان‌های فوری همانند اسکایپ(Skype)،گوگل تاک(Google Talk) و ام اس ان مسنجر(MSN Messenger)، در سالهای اخیر، مورد استفاده ی دیگری برای نرم‌افزارهای ترجمه ماشینی شده است. چراکه بدین وسیله کابران به زبان‌های مختلف میتوانند با یکدیگر ارتباط برقرار کنند.
نرم‌افزارهای ترجمه ماشینی همچنین برای بسیاری از موبایلها، کامپیوترهای جیبی و .. عرضه شده است. بخاطر قابلیت حمل آنها، اینگونه وسایل بعنوان ابزارهای ترجمه برای موبایل مشخص شده اند که شبکه تجارتی با استفاده از موبایل را بین شرکایی با زبانهای مختلف ممکن ساخته است.همچنین این نرم‌افزارها نیاز به مترجم انسان بعنوان واسطی در مکالمات دوطرف را از بین می برند.
تاريخچه ترجمه ماشينی
ترجمه ی ماشینی از جمله ی اولین اهداف مورد نظر در علوم رایانه و بخصوص در حوزه ی هوش ماشینی به حساب می‌آید و سابقه¬ی آن به حدود نیم قرن پیش از این باز می‌گردد.
نخستین ترجمه‌ای که بطور کامل توسط کامپیوتر انجام شد، ترجمه ی متنی بود از زبان انگلیسی به زبان روسی. گر چه از آن زمان تا کنون فن آوری ترجمه¬ی ماشینی رشد زیادی داشته‌است، هنوز هم نقص‌های فراوانی را داراست. اصولا چون کامپیوترها نمی‌توانند مانند انسان هوشمند باشند، ترجمه‌ای هم که توسط آنها انجام شود، ترجمه¬ی کاملی نخواهد بود. نمی‌توان انتظار داشت که با استفاده از یک نرم‌افزار مترجم، هر متنی به آسانی ترجمه شود. نرم‌افزارهای مترجم، در بهترین حالت، عمل ترجمه را با دقتی در حدود ۷۰ درصد انجام می‌دهند. برای به دست آوردن نتیجه بهتر، لازم است قبل و بعد از ترجمه، مقداری ویرایش روی متن انجام شود. در این متن تاریخچه روند پیشرفت ترجمه ماشینی در طی گذر زمان ذکر نخواهد گردید و فقط ایده ها و نتایج تحقیقاتی آنها در بخش های مختلف ذکر خواهد گردید.
مشکلات در ترجمه ماشينی
قبل‌ از تعريف‌ ترجمه‌ ماشينی‌، لازم است‌ از ديدگاه‌ زبان‌شناسی‌، ماهيت‌ ترجمه‌ را  در مفهوم‌ عام‌ آن‌ يعنی‌ ترجمه‌ توسط شخص‌ متخصص‌ و زبان¬دان‌ و به اصطلاح ترجمه‌ انسانی‌ معرفی كنيم‌. با آنكه‌ ترجمه‌ سابقه بسيار طولانی دارد‌ هنوز تعريفی از آن که‌ مورد قبول‌ همگان‌ باشد وجود ندارد. در حالت کلی ترجمه‌ عبارتست‌ از تبديل‌ يا برگرداندن‌ نزديك‌ترين‌ پيام‌ مستتر در صورت‌ واژه‌های‌ زبان‌ مبدأ  به ‌صورت‌  زبان‌ مقصد. ترجمه‌ ماشينی‌ به‌ سيستم‌ های نرم‌افزار کامپيوتری اطلاق‌ می‌شود كه‌ با آنها‌ می‌توان‌ متون‌ ورودی به‌ زبان‌ مبدأ را طی‌ فرايندهای‌ خاصی و در سطوح‌ مختلف‌ زبان‌شناختی‌ تجزيه‌ و تحليل نموده ودر نهايت‌ به‌ زبان مقصد ترجمه نمود. در طراحی سيستمهای ترجمه‌ ماشينی بايستی تمهيداتی انديشيده‌ شده و در معماری آن‌ مؤلفه‌هايی لحاظ گردد که سيستم‌ را قادر سازد تا تقريبا همانند يک انسان مترجم‌ کار تجزيه‌ و تحليل‌های‌ زبان‌شناختی‌ متن‌ ورودی‌ را انجام‌ داده‌ و با بهره‌گيری‌ از داده‌ها و براساس ‌يافته‌ها، معادل‌ جملات‌ زبان‌ مبدأ را در زبان‌ مقصد توليد كند. انجام‌ اين‌ عمل‌ مستلزم‌ آن‌ است‌ كه‌ سيستم‌ علاوه‌ بر برنامه‌‌ رايانه‌ای‌ متشكل‌ از مجموعه‌ الگوريتم‌های‌ خاص‌ و پيچيده‌، مجموعه ‌فرهنگهای لغات و پايگاه های داده حاوی‌ واژگان‌ و قواعد ساختاری‌ و معنا شناختی‌ زبانهای‌ مبدأ و مقصد باشد. اگر بتوان‌ ادعا كرد كه‌ امكان‌ تدوين‌ فرهنگ‌ قواعد ساختاری‌ يا واژگان‌ دستوری‌ نسبتاً كامل‌ فراهم‌ باشد، مختصه‌ و ويژگی‌ زبان‌ به‌ گونه‌ای‌ است‌ كه‌ درهيچ‌ مقطعی نمی‌توان‌ فرهنگ مناسبی را يافت‌ كه‌ دربر دارنده‌ همه‌ واژه‌های آن‌ زبان‌ باشد زيرا ‌ زبان‌ پديده‌ زايايی است‌ و مرتب واژه‌های جديدی خلق شده  و به‌ مجموعه‌ واژگان‌ آن‌ زبان‌ افزوده‌ می شوند.
در حالت کلی نوع‌ متن مورد نظر‌ و ميزان‌ پيچيدگی‌ آن‌ در بازدهی‌ کار ترجمه كاملا موثر است. ترجمه ی متون رسمی و قاعده مند و همچنین متون علمی به‌ این‌ علت‌ که‌ از وضوح‌ بیشتر و ابهام کمتری برخوردارند به‌ سهولت‌ از طریق ‌کامپیوتر انجام‌ می‌گیرد، ولی‌ ترجمه‌ متون‌ ادبی‌ که‌ از دیدگاه‌ علمی‌ در حیطه‌ ترجمه‌ فرهنگی قرار دارد، اگر غیر ممکن‌ نباشد، چندان‌ ساده‌ نخواهد بود.

نقش ترجمه ماشینی در آینده شغلی مترجمان

رشد و گسترش انکار ناپذیر ترجمه های ماشینی در سال های اخیر، به میزان قابل توجهی بر محبوبیت این گونه ترجمه ها افزوده است، بطوریکه به نظر می رسد آینده ترجمه و فرصت های شغلی مترجمان در سایه ای از ابهام و تردید قرار دارد. به باور بسیاری از متخصصان فن ترجمه ، مولفه هایی که نقش اساسی را در نتیجه نهایی یک ترجمه ایفا می کنند، شامل هزینه، زمان تحویل و کیفیت می شوند.  با این حال، ترجمه های ماشینی در شرایط کنونی نه تنها از سرعت بالایی برخوردارند، بلکه بسیار کم هزینه اند و به راحتی در دسترس همگان قرار می گیرند. اما کیفیت ترجمه این گونه نرم افزارها همچنان مسئله ای مشکل ساز و در عین حال پیچیده است.
یکی از مسائلی که ترجمه ماشینی را ازدیگر ترجمه ها متمایز می کند، نداشتن یک نظریه معقول است. این گونه ترجمه ها بر مبنای تئوری و نظریه اصولی بنیان نشده اند و به همین علت جهت گیری و انسجام لازم را در این زمینه ندارند. این در حالی است که هر مترجمی بر اساس باورها و فرضیه های خود متنی را ترجمه و از آن دفاع می کند.
گاهی تفاوت هایی زبانی به قدری نامحسوس است که ماشین ها و نرم افزار های ترجمه نسبت به آن ها بی توجه اند و ظرافت لازم را برای جداسازی شیوه های نوشتاری و ویژگی های ساختاری این زبان ها ندارند، اما مترجمی که از یک زبان به زبان مادری خود ترجمه می کند، قطعا این گونه تفاوت ها و تناقض ها را در می یابد و آن را در نحوه ترجمه خود اعمال می کند.
برخی از متون ارزش ترجمه را ندارند و در نهایت اگر هم ترجمه شوند، چندان موثر و مفید واقع نمی شوند. یک مترجم با یک بررسی هر چند اجمالی قادر است تا متن را ارزیابی کند و بر مبنای ابعاد و جوانب دوراندیشی شروع به ترجمه متن کند. ترجمه ماشینی از این ویژگی بی بهره است و همین هم سبب می شود تا ارزش نهایی  برخی از کارها به چشم نیاید.
و اما آینده شغلی مترجمان در بازار کار ترجمه ...
این مسئله تا حدود زیادی بستگی به مخاطبان و مشتریان دارد. آن دسته از افرادی که بیش تر به این گرایش دارند تا متنی از یک زبان به زبان دیگر بر گردانده شود و به کیفیت آن بهای چندانی نمی دهند، ترجمه ماشینی را بر می گزینند، اما کسانی هم هستند که کیفیت برایشان حرف اول را می زند و نه کمیت و به همین خاطر ترجمه ماشینی را قابل اعتماد نمی دانند و کار را به مترجمان خبره و با تجربه می سپارند.
این احتمال می رود که در آینده ای نزدیک، مترجمان امروز به عنوان ویرایشگران فردای ترجمه های ماشینی به کار خود ادامه دهند و همین ویرایش متون ترجمه شده نرم افزارها، خود کاری طاقت فرسا و دشوار است که مهارت و دقت عمل بیش تری را می طلبد تا جایی که مترجم های آینده باید وقت بیش تری را صرف اصلاح ترجمه های ماشینی نا منسجم کنند. شاید روزی برسد که مترجمان آرزوی بازگشت آن روزهای خوبی را داشته باشند که تک تک کلمات و جملات متن را از ذهن خود بر روی کاغذ می آوردند و یا با دست خود می نوشتند.
باید منتظر ماند و به آینده امیدوار بود، چرا که زندگی با تغییرات بسیاری آمیخته شده و هر کس که نتواند خود را با تغییرات وفق دهد، یک بازنده واقعی خواهد بود.


اجزای اصلی معماری ماشین های ترجمه
در معماری ماشين های ترجمه‌ سه‌ جزء‌ اصلی  وجود دارد. هر جزء‌ نيز به ‌نوبه‌ خود از مجموعه‌ اجزايی تشكيل‌ می ‌شود كه‌ در راستای تحقق‌ نقش‌‌ آن‌ سه‌ جزء ‌اصلی عمل‌ می كنند. اجزاء فوق در سه‌ سطح‌ قرار دارند که عبارتند از:
الف‌ - واژگانی
ب‌- صرفی و نحوی
ج‌- معنايی‌
بخش واژگانی
نخستين‌ مرحله‌ پردازش‌ در ترجمه‌ ماشينی‌ در سطح‌ واژگان‌ انجام‌ می‌شود که عبارتست‌ از تجزيه‌ و تحليل‌ مرفولوژيكی‌ واژه‌های‌ واحد تحت ترجمه‌. در اين‌ مرحله‌ عناصرموجود در سطح‌ واحد ترجمه‌ يك‌ به‌ يك‌ تفكيك‌، پردازش‌ و مقوله‌گذاری‌ می‌شوند. بايد با توجه به موارد مشکل آفرين‌ کاری کرد كه‌ ميزان‌ خطا در اين‌سطح‌‌ به‌ حداقل‌ برسد و راه‌ برای‌ انجام‌ پردازش‌ و تجزيه‌ وتحليل‌های‌ زبان‌شناختی مراحل بعد‌ هموار شود.
بخش صرفی
در اين بخش قواعد صرفی طی چند مرحله اعمال می گردد. ابتدا، پس از اينکه سيستم متن را بر اساس نمادهای قابل خوانش به طور خودکار شناسايی کرد، مرز جمله، گروه، واژه و ساير اجزای نحوی متمايز می شود. در مرحله دوم، متن به واحدهای پردازش تقطيع می شود و سپس اين واحدها به واحدهای واژگانی تقسيم می گردند. در مرحله سوم به طور خودکار مرز واژه ها مشخص می شود. در اين مرحله متن ورودی به صورت يک سلسله علايم پياپی در می آيد. از ترکيب اين علايم واژه ها و جمله ها به دست می آيند. وقتی متن به واحدهای پردازش واژه تقطيع شد تحليل دستوری آغاز می شود. اولين قدم در تحليل دستوری، آزمون هر واژه در جمله و انجام تقطيع های صرفی لازم می باشد. تقطيع صرفی (مثلاً پسوند + پايه) باعث می شود تعداد مدخلهای واژگانی در فرهنگ لغت سيستم کاهش يابد.
بخش نحوی
بخش نحوی در تحليل جملات و سازه های آن در زبان مبدأ و توليد جملات درست در زبان مقصد نقش ايفا می نمايد. سيستمهای ترجمه ماشينی معمولاً مجهز به سه نوع دستور هستند: دستور زبان مبدأ، دستور انتقال ساخت زبان مقصد و دستور زبان مقصد. دستور انتقال از اهميت خاصی برخوردار است زيرا برای يافتن قرينه های دستوری بايد به دستورهای انتقال مراجعه نمود و به اطلاعات راجع به تناظر ساختهای نحوی در دو زبان مبدأ و مقصد دست يافت.
Parser  در اصطلاح زبان شناسی محاسباتی ‌به برنامه‌ تجزيه‌ و تحليل ‌نحوی‌ متن‌ گفته می شود. با کمک آن رايانه می‌تواند عناصر تشكيل‌ دهنده ‌واحد تحت ترجمه‌ را بازشناسی‌ كرده و نقش‌ آنها و روابط درونی‌ و فيمابين‌ آنها و قواعد حاكم‌ بر آنها را تشخيص‌ دهد. در ترجمه‌ ماشينی‌ دستيابی‌ به‌ اطلاعات‌ ياد شده‌ ضروری‌ است‌ زيرا ‌ علاوه‌ بر برگردان‌ عناصر معنائی‌ و واژگان‌، ترجمه‌ ساختار نحوی‌ واحد ترجمه‌، از زبان‌ مبدأ به‌ مقصد نيز بايد انجام‌ شود. در واقع‌ برگردان‌ قالب‌ و ساختار جمله‌ از زبان‌ مبدأ به‌ زبان‌ مقصد، شرط اساسی‌ ترجمه‌ است‌. اين‌ امر جز با تجزيه‌ و تحليل‌ گرامری ‌واحد ترجمه‌ ميسر نمی‌شود. شايد‌ مهمترين‌ ركن يک‌ ماشين‌ ترجمه‌ تجزيه‌ و تحليلگر نحوی‌ يا parser  باشد
بخش معنايی
زبان اغلب به عنوان نظامی از نشانه ها تعريف می شود و عناصر زبانی مانند واژگان به شيوه ای بر اساس قواعد نحوی در کنار هم ظاهر می شوند که در ترکيب آنها معنای خاصی به ذهن متبادر می شود. مشكل‌ چندمعنا‌ بودن‌ واژه‌ها يکی از شناخته‌ شده‌ترين‌ ويژگيهای زبان‌ است‌. مترجم‌ به‌ هنگام‌ برخورد به‌ واژه‌ چند معنا، با تكيه‌ بر توانش‌ زبانی خود و بافت و موضوع‌ متن‌ می‌تواند معادل‌ واقعی‌ آن واژه‌ را تشخيص‌ داده و برگزيند اما يک رايانه‌ فاقد چنين ‌توانی‌ است‌. بنابراين‌ طراح‌ ماشين‌ ترجمه‌ بايد‌ خلأ موجود را ترميم‌ كند. اين‌ تمهيدات‌ بايد از نخستين ‌مراحل‌ پردازش‌ يعنی‌ از مرحله‌ واژگان‌ و نحو و ساختار آغاز گردد و تا آخرين‌ مرحله‌ يعنی ‌مرحله‌ تجزيه‌ و تحليل‌ معناشناختی‌ متن‌ تداوم‌ يابد.

 


[3] فرحزاد ف. استاد زبانشناسی و مطالعات ترجمة دانشگاه علامه طباطبایی، روزنامه کیهان

[4] Manning، C. D.، and Schutze، H.، Foundations of Statistical Natural Language Processing، 5th edition، The MIT Press، 2002. ISBN 0-262-13360-1

Comments (0) Posted to ترجمه ماشینی 12/28/2010 Edit

ترجمه ماشینی _ پردازش زبانهای طبیعی

 

 

پردازش زبان‌های طبیعی یکی از زیر شاخه‌های با اهمیت در حوزه گسترده هوش مصنوعی، دانش زبان‌شناسی و یکی از نیازهای اساسی عصر فناوری جهت استفاده بهینه از منابع اطلاعاتی است. امروزه با رشد حجم مستندات تولید شده و نیاز به نگهداری، دسته بندی، بازیابی و پردازش ماشینی و سریع آنها توجه به پردازش زبان طبیعی بیش از پیش خودنمایی می کند.  تلاش عمده در این زمینه، ماشینی کردن فرایند درک و برداشت مفاهیم بیان گردیده با یک زبان طبیعی انسانی می باشد. به تعریف دقیق‌تر پردازش زبان‌های طبیعی عبارت است از استفاده از رایانه برای پردازش زبان گفتاری و نوشتاری. با استفاده از آن می‌توان به ترجمه زبان‌ها پرداخت، از صفحات وب و بانک‌های اطلاعاتی نوشتاری جهت پاسخ دادن به پرسش‌ها استفاده کرد، یا با دستگاه‌ها مثلاً برای مشورت گرفتن به گفتگو پرداخت.[2]
این‌ها تنها مثال‌هایی از کاربردهای متنوع پردازش زبان‌های طبیعی هستند. گفتنی ست هنوز سیستم چندان کارآمدی که پاسخگوی تمامی نیازهای ما باشد، برای پردازش زبان‌های طبیعی به وجود نیامده‌است.
موانع اساسی
- نیاز به درک معانی: رایانه برای آن که بتواند برداشت درستی از جمله‌ای داشته باشد و اطلاعات نهفته در آن جمله را درک کند، گاهی لازم است که برداشتی از معنای کلمات موجود در جمله داشته باشد و تنها آشنایی با دستور زبان کافی نباشد. مثلاً جمله حسن سیب را نخورد برای این که کال بود. و جمله حسن سیب را نخورد برای این که سیر بود. ساختار دستوری کاملاً یکسانی دارند و تشخیص این که کلمات کال و سیر به حسن برمی‌گردند یا به سیب بدون داشتن اطلاعات قبلی درباره ماهیت حسن و سیب ممکن نیست.
- دقیق نبودن دستور زبان‌ها: دستور هیچ زبانی آن‌قدر دقیق نیست که با استفاده از قواعد دستوری همیشه بتوان به نقش هر یک از اجزای جمله‌های آن زبان پی برد. برای مثال در جمله کوتاه باز روی زمین نشست. نمی‌توان تشخیص داد که باز قید جمله به معنای دوباره است یا این که فاعل جمله به معنای نوعی پرنده شکاری است.
زبان‌شناسی محاسباتی
زبان‌شناسی رایانه‌ای یا زبان‌شناسی محاسباتی (Computational linguistics) حوزه‌ای میان‌رشته‌ای است که سعی دارد با بهره‌گیری از روش‌های آماری و مبتنی بر قاعده(rule-based)، از منظر محاسباتی به مدل‌سازی زبان طبیعی بپردازد. به خصوص از این روش‌ها برای حل مسائلی استفاده می‌کنند که ناشی از طولانی بودن جملات و زیاد بودن تعداد حالات ممکن برای نقش کلمات هستند. این روش‌ها معمولاً مبتنی بر نمونه‌های متنی و مدل‌های مارکف هستند.
مقوله های زیر از جمله مباحثی هستند که در حیطه ی زبان‌شناسی محاسباتی قرار می گیرند:

- فرایافت concept و تجزیه زبان های برنامه نویسی : نوآم چامسکی توانست تشابه زبانهای طبیعی و زبانهای برنامه نویسی را به اثبات برساند. یعنی یک زبان رایانه‌ای مانند زبانهای طبیعی دارای یک دستور زبان و یک فرهنگ می‌باشد. تفسیر یک متن از تجزیهٔ واژه‌ها lexicon آغاز سپس با تجزیه نحو syntax و در آخر با تجزیه مفهوم semantic آن پایان می یابد.

- ترجمه ماشینی : این شاخه از زبان‌شناسی رایانه‌ای، زمان درازی کم اهمیت جلوه می‌کرد. اما امروزه یکی از موارد مورد علاقه پژوهشگران این رشته می‌باشد. پس از مرحلهٔ تجزیه واژه‌ها و نحو می باید تجزیهٔ مفهوم و سپس پرگماتیک را نیز افزود. در واقع این دو سعی در شناخت مفهوم خاص یک واژه در مکانی که ظاهر می‌شود را دارد.

- پرسش و پاسخ با زبانهای طبیعی : این ایده مدتی به‌عنوان پاسخی قانع کننده به مسئله ارتباط انسان و ماشین تلقی می‌شد. این دید در واقع جنبه ی وسیعتری از دستور زایشی چامسکی است.

- صرف محاسباتی : به مطالعات مربوط به ساختارهای درونی کلمات صرف گفته می‌شود. [2] اغلب دست‌آوردها و نتائج تحقیقات در صرف محاسباتی در سایه تلاشهای علمی انسان به منظور ایجاد و ساخت سیستم‌های پردازش زبان‌های طبیعی انسانی فراهم آمده است.

از جمله مهم ترین کارکردهای مهم پردازش زبان‌های طبیعی می توان موارد ذیل را نام برد:
خلاصه‌سازی خودکار، استخراج اطلاعات، بازیابی اطلاعات، ترجمه ماشینی، تشخیص نوری نویسه‌ها، تشخیص گفتار، ویرایش و ...

 

[2] Crystal D.، The Cambridge Encyclopedia of Language، 2nd edition، Cambridge University Press، 1996. ISBN 0-521-55967-7

Comments (5) Posted to ترجمه ماشینی 12/26/2010 Edit

ترجمه ماشینی _ مقدمه

 

 

 ربات ها به زودی جایگزین مترجمین انسانی می شوند...

دراين وبلاگ در این مبحث ، در ابتدا به طور خلاصه به تعریف پردازش زبانهای طبیعی، محدودیت ها، موانع موجود و همچنین کارکردهای مهم پردازش زبان های طبیعی پرداخته می شود. پس از آن مفهوم ترجمه و ترجمه ماشینی که یکی از مهم تریت کارکردهای پردازش زبان های طبیعی می باشد، بیان می گردد. اجزای مورد نیاز در معماری ماشین های ترجمه بیان گردیده و روشهای موجود در ترجمه ماشینی از ابتدا تا به اکنون تشریح و مزایا و معایب هر کدام ذکر می گردد. در پایان نیز با تاکید بر روش ترجمه ماشینی مبتنی بر روش های آمارگرا، ترجمه ماشینی در زبان فارسی مورد بررسی قرار می گیرد. اين مجموعه برای معرفی انواع پردازشهای موجود بر روی زبان های طبیعی و به خصوص ترجمه ماشینی متون، انواع روشهای موجود و روند پیشرفت و بهبود ماشین های ترجمه به پژوهشگراني كه هدفشان تحقيق در حوزه پردازش زبان و به خصوص ترجمه ماشینی است، كمك موثري باشد. در ضمن، به موانع موجود به خصوص در زمينه ترجمه ماشینی زبان فارسی اشاره گرديده و در خاتمه راه حل های پیشنهادی  موجود براي بهبود ترجمه ماشيني و به ویژه برای زبان فارسي مورد بررسي قرار گرفته است.
واژه های کلیدی:
ترجمه ماشینی، روشهای آماری، پیکره، فارسی.
مقدمه
پردازش زبانهای طبیعی نقشی بسیار عمده و کلیدی به خصوص در ترجمه ماشینی، بازیابی اطلاعات تک و دوزبانه، خلاصه سازی اسناد، مدیریت محتوا در سیستم های آموزشگر، خطایاب نحوی و معنایی متون، درک و تولید متون فارسی، تشخیص صحبت، تبدیل متن به گفتار، تحلیل نحوی، استخراج اطلاعات از متون و بسیاری کاربردهای دیگر ایفا می کند.
ترجمه خود كار متون، جزو اولين كاربردهاي غير محاسبه اي كامپيوتر است. ايده ترجمه ماشيني اولين بار در بحثي بين وارن ويور و آندره بوث شكل گرفت. مدل آنان بر اساس جداولي طراحي شده بود كه در آنها براي رمز گشايي، از تواتر كلمات و حروف استفاده مي شد.[1]
با پيدايش تكنيك هايي چون جست و جوي دودوئي و روش تقليل مسأله در الگوريتم هاي برنامه سازي و ايده ويرايش ثانويه در ترجمه، اعتقاد به عملي بودن ترجمه ماشيني قوت گرفت. در پايان دهه 50 و اوايل 60، COMIT به عنوان اولين زبان همه منظوره پردازش نماد مطرح شد و برنامه هاي كمكي واژه پرداز به مرحله پياده سازي رسيد. از سوي ديگر در زمينه زبان شناسي، نسبت به ساخت جملات زبان، ديد الگوريتميكي تحت عنوان دستور زبان گشتاري مطرح گرديد.
نتيجه پروژه هاي دهه 60 كه بيشتر از آنها براي مقاصد سياسي استفاده مي شد، پيدايش دو شاخه اصلي در روش هاي ترجمه ماشيني بود. يكي از اين روش ها استفاده از فرم هاي اصلاح شده دستور زبان گشتاري و ديگري استفاده از اطلاعات آماري در مورد نقش كلمات در جمله و ترجمه آنها بود. در پايان دهه 70، اعتقاد عمومي بر آن بود كه ترجمه ماشيني بايد پيچيده تر از جابه جايي و جايگذاري كلمات زبان مبدا براي رسيدن به زبان مقصد باشد و ماشين بايد به نوعي يك فهم از معناي هر دو نوشتار پيدا كند. اين اعتقاد راه را براي استفاده از تكنيك هاي جديد هوش مصنوعي و به خصوص پردازش زبان طبيعي در ترجمه ماشيني هموار كرد و در اين‌ مدت‌‌ شاهد پيشرفت‌های چشمگيری در قلمرو ترجمه‌ ماشينی و دستاوردهای متنوع‌ جانبی آن‌ بوده‌ ايم. اهميت‌ اين‌ پديده‌ جديد و مقتضيات عصر ارتباطات و اطلاعات ‌ايجاب‌ كرده‌ است‌ كه‌ ميزان‌ سرمايه گذاری در اين‌ عرصه در سالهای گذشته بسيار ‌چشمگير باشد.


[1] Booth, K. H. V. (1967). Machine aided translation with a post-editor. In A. D. Booth (Ed.), Machine Translation (pp. 53-76). Amsterdam: North-Holland Publishing Company.

Comments (1) Posted to ترجمه ماشینی 12/24/2010 Edit

ترجمه ماشینی

 ربات ها به زودی جایگزین مترجمین انسانی می شوند...

در این وبلاگ مطالب بسیار مفیدی درباره ترجمه ماشینی ارائه می گردد که امیدوارم مورد رضایت شما

 علاقه مندان و بینندگان وبلاگ قرار بگیرد.

 

ترجمه ماشینی

ترجمه ماشینی _ مقدمه

ترجمه ماشینی _ پردازش زبانهای طبیعی

ترجمه ماشینی _ مفهوم ترجمه و ترجمه ماشینی

ترجمه ماشینی _ روشهای موجود و شیوه های ارزیابی آنها

ترجمه ماشینی _ کارهای فعلی در زبان فارسی

 

لینک های ذیل نیز برای دانلود فایل ها و مقاله های مرتبط با موضوع ترجمه ماشینی قرار داده شده است.

سخنرانی توسط دکتر عبدالحسین صراف زاده در مورد ترجمه ماشینی مبتنی بر آمار

 

 مقاله ای در مورد سیستم ترجمه ماشینی آماری مبتنی بر عبارت فارسی انگلیسی

مطالعه و بررسی ابزارهاي آماده براي تحلیل پیکره متنی زبان فارسی

بررسی ابعاد و تفاوت هاي پیکره هاي برچسب داده اي و پیکره هاي خام در زبان فارسی  

امکان سنجی پروژه هاي زیرساختی کاربري خطو زبان فارسی در محیط رایانه اي 

بررسی ابعاد و لایه هاي ابهام در واژگان مشابه زبان فارسی 

  گروه اعداد در ترجمه ماشيني 

 دریافت اطلاعات HTML وبلاگ در موضوع ترجمه ماشینی در قالب فایل pdf

دریافت فایل پاورپویینت ترجمه ماشینی

 دریافت فایل پاور پویینت ترجمه ماشینی مبتنی بر آنتولوژی 

 

مهندس احمد استیری

Comments (0) Posted to ترجمه ماشینی 12/21/2010 Edit


درباره من

احمد استیری

احمد استیری هستم. بنده فارغ التحصیل مقطع کارشناسی ارشد رشته مهندسی کامپیوتر - گرایش نرم افزار از دانشگاه فردوسی مشهد می باشم. دوره کارشناسی ارشد را زیر نظر جناب دکتر کاهانی در آزمایشگاه فناوری وب دانشگاه فردوسی گذرانده ام. در این مدت در حوزه های مرتبط با پردازش متن از جمله وب معنایی و به طور ویژه متن کاوی بر روی متون زبان فارسی فعالیت داشتم. طراحی و پیاده سازی ابزارهای پایه ای پردازش زبان فارسی و به خصوص طراحی نخستین ابزار پارسر زبان فارسی و ابزار ارزیابی خودکار خلاصه سازهای فارسی و همچنین تولید پیکره قرآنی فرقان از جمله کارهای من در دوره کارشناسی ارشد می باشد.
در صورت نیاز به توضیحات تکمیلی و یا هر گرونه سوال و ابهام در مورد موضوعات مطرح شده در وبلاگ با ایمیل زیر مکاتبه نمایید.

پست الکترونیکی من:
UniversityDataInfo{@}yahoo.com

آخرين مطالب بروز شده

موضوعات

پيوندها

کلی

Feeds