ترجمه ماشینی: تفاوت میان نسخه‌ها

از ویکی‌پدیا، دانشنامهٔ آزاد
محتوای حذف‌شده محتوای افزوده‌شده
Mahdi28 (بحث | مشارکت‌ها)
جز ویرایش با ابزار زدودن تبلیغ
Fatranslator (بحث | مشارکت‌ها)
خط ۱۲۸: خط ۱۲۸:
* [http://www.google.com/language_tools مترجم گوگل]
* [http://www.google.com/language_tools مترجم گوگل]
* [http://babelfish.altavista.com/ مترجم آلتاویستا]
* [http://babelfish.altavista.com/ مترجم آلتاویستا]
{{فناوری‌های نوپدید}}
[[رده:ترجمه ماشینی]]
[[رده:ترجمه ماشینی]]
[[رده:ترجمه به کمک کامپیوتر]]
[[رده:ترجمه به کمک کامپیوتر]]

نسخهٔ ‏۲۵ ژانویهٔ ۲۰۱۸، ساعت ۰۵:۵۶

ترجمهٔ ماشینی زیر شاخه‌ای از زبان‌شناسی محاسباتی است که عبارت است از ترجمهٔ متنی از یک زبان طبیعی به زبانی دیگر، توسط کامپیوتر. در سطح مقدماتی، ترجمه ماشینی یک جایگزینی ساده برای کلمات از زبان طبیعی به زبان دیگری است. با استفاده از تکنیک‌های زبان‌شناسی پیکره‌ای، ترجمه‌های پیچیده بیشتری قابل دستیابی هستند. همچنین این تکنیک‌ها کنترل بهتر تفاوت‌های گونه‌شناسی در زبان، تشخیص عبارات و ترجمهٔ اصطلاحات را به خوبی و درستی جدا کردن عبارات نامتعارف در متن، مقدور می‌سازند.

نرم‌افزارهای ترجمه ماشینی کنونی اغلب به کاربر اجازهٔ تغییر دلخواه بر اساس حوزه کاری یا حرفه‌ای دلخواه را می‌دهند (همانند گزارش آب و هوا). در واقع ارتقاء کیفیت خروجی با استفاده از محدود کردن کلمات جایگزین شونده، انجام می‌شود. این تکنیک بطور خاص در حوزهٔ رسمی یا زبانهای فرموله شده استفاده می‌شود. این بدین معنی است که ترجمه ماشینی از اسناد قانونی و دولتی آسان‌تر از تولید خروجی قابل استفاده از مکالمات یا متون غیر چهارچوب بندی شده دیگر است. همچنین کیفیت خروجی بهبود یافته می‌تواند با استفاده از دخالت انسان بدست آید. برای مثال سیستم‌هایی موجودند که اگر کاربر بطور کاملاً واضحی کلماتی که اسامی خاص هستند را معین کرده باشد، قادر به ترجمه دقیق‌تری هستند. با کمک گرفتن از این تکنیک‌ها ترجمه ماشینی بعنوان یک ابزار برای کمک کردن به مترجمان (انسان‌ها) و بسیاری از موضوع‌های محدود، قادر به تولید خروجی قابل استفاده و نهایی است.

در ترجمهٔ ماشینی ویژگی‌هایی وجود دارد که نه تنها از نظر جاذبه و کشش علمی، بلکه، از دیدگاه اقتصادی و دیگر ضرورت‌ها و اقتضاهای عصر، انجام آن را کاملاً توجیه می‌کند. به عنوان مثال، در مقر سازمان ناتو در بروکسل و جامعه اروپا علی‌رغم آنکه حدود ۱۲۰۰ مترجم ورزیده به کار اشتغال دارند، در حال حاضر از ترجمه ماشینی نیز استفاده می‌شود. دلیل این امر سرعت و هزینه‌است. میزان کاری که مترجمی ورزیده در خلال چندین روز انجام می‌دهد، توسط کامپیوتر در عرض چند دقیقه انجام می‌شود. حتی اگر کیفیت و دقت ترجمه ماشینی کمتر از حاصل کار مترجم باشد، باز هم از جهات گوناگون اهمیت و ارزش خاص آن چشمگیر است.

ترجمه گوگل و مترجم گوگل هرگز نمی‌تواند جای مترجمین حرفه ای انسانی را بگیرد و متنی سلیس و روان و با عباراتی که کاملاً صحیح باشند، ایجاد نماید. هنگامی که مترجم گوگل به عبارت یا لغتی برخورد می‌کند که دارای تعداد زیادی از معانی است، نمی‌تواند مناسب‌ترین لغت را انتخاب نماید و خروجی آن به احتمال زیاد دارای بیانی غیرطبیعی یا اشتباه خواهد بود و این موضوع استفاده از گوگل ترجمه برای ترجمه متن را غیرممکن می‌نماید.

تاریخچه

ترجمهٔ ماشینی از جملهٔ اولین اهداف مورد نظر در علوم رایانه و بخصوص در حوزهٔ هوش ماشینی به حساب می‌آید و سابقهٔ آن به حدود نیم قرن پیش از این بازمی‌گردد. نخستین ترجمه‌ای که بطور کامل توسط کامپیوتر انجام شد، ترجمهٔ متنی بود از زبان انگلیسی به زبان روسی. گر چه از آن زمان تا کنون فناوری ترجمهٔ ماشینی رشد زیادی داشته‌است، هنوز هم نقص‌های فراوانی را داراست. اصولاً چون کامپیوترها نمی‌توانند مانند انسان هوشمند باشند، ترجمه‌ای هم که توسط آنها انجام شود، ترجمهٔ کاملی نخواهد بود. نمی‌توان انتظار داشت که با استفاده از یک نرم‌افزار مترجم، هر متنی به آسانی ترجمه شود. نرم‌افزارهای مترجم، در بهترین حالت، عمل ترجمه را با دقتی در حدود ۷۰ درصد انجام می‌دهند. برای به دست آوردن نتیجه بهتر، لازم است قبل و بعد از ترجمه، مقداری ویرایش روی متن انجام شود.

در طی چند دههٔ اخیر و هم‌زمان با گسترش و پیشرفت زبان‌شناسی رایانه‌ای، در بسیاری از کشورهای جهان، تلاشهای همه‌جانبه و پیگیر در جهت ترجمهٔ متون از طریق کامپیوتر انجام گرفته، و حاصل کار با توجه به تنگناها، محدودیت‌ها، و مسائل خاص ترجمه درخور توجه‌است. در بعضی از زمینه‌ها حاصل کار واقعاً رضایت‌بخش است، ولی، در برخی موارد نتایج به دست آمده را علی‌رغم قابل فهم بودن، باید ویراستاری کرد. طبیعتاً نوع متن و میزان پیچیدگی آن اهمیت زیادی در نتیجه کار دارد.

فرایند ترجمه

فرایند ترجمه به شرح زیر است:

  1. رمزگشایی معنایی متن مبدأ
  2. کدگذاری دوباره این معنا در زبان مقصد

در پس این فرایند بظاهر آسان، عملیات شناختی پیچیده‌ای واقع است. به منظور رمز گشایی معنای متن مبدأ، مترجم باید قابلیت تفسیر و تجزیه تحلیل تمام ویژگی‌های متن را داشته باشد. یک فرایند که احتیاج به دانش عمیقی از دستور زبان، جمله‌شناسی (نحو)، معناشناسی و اصطلاحات از هر دو زبان مبدأ و مقصد دارد به همان اندازه باید دانش مربوط به فرهنگ صحبت کنندگان آن زبان را نیز داشته باشد. از آن جهت، چالشی در ترجمه ماشینی وجود دارد که چگونه یک کامپیوتر را آموزش دهیم که بتواند همانند یک انسان متنی را بفهمد و بتواند یک متن جدید در زبان مقصد بسازد که بنظر می‌رسد توسط انسان نوشته شده‌است. این مسئله ممکن است به روشهای مختلفی انجام شود.

روش‌ها

هرمی که عمق‌های متفاوت نمایش واسط را نشان می‌دهد. ماشین ترجمه بین زبانی، در نوک هرم است که بدنبال آن ترجمهٔ مبتنی بر انتقال و ترجمه مستقیم آمده‌اند..

برای دست یافتن به ترجمه ماشینی می‌توان روشی مبتنی بر قوانین زبان‌شناسی استفاده کرد، به این معنی که کلمات از نظر زبان‌شناسی ترجمه خواهند شد. (در واقع متناسب‌ترین کلمات مقصد جایگزین کلمات مبدأ خواهند شد)

این موضوع که موفقیت ترجمه ماشینی پیش از هر چیز نیازمند حل مسئله فهم زبان طبیعی است، اغلب مورد بحث است. به طور عام روش‌های قانون مند،[۱] متن را با استفاده از ساختن واسطی سمبلیک -که نهایتاً متن زبان مقصد از آن ایجاد می‌شود- تجزیه می‌کنند.

با توجه به طبیعت نمایش واسطه، یک روش به عنوان ترجمه ماشینی بین زبانی[۲] یا ترجمه ماشینی مبتنی بر انتقال[۳] معرفی می‌شود. این روش‌ها نیاز به واژگان وسیعی با اطلاعات تک‌واژشناسی، دستور زبان و معناشناسی دارند.

با دادن داده‌های کافی نرم‌افزارهای ترجمه ماشینی حتی برای صحبت کننده بومی یک زبان به حدی خوب کار می‌کنند که معنی تقریبی آنچه توسط یک صحبت کننده بومی دیگر نوشته شده‌است بفهمد. دشواری کار ترجمه خودکار، بدست آوردن اطلاعات کافی از نوع صحیح آن برای پشتیبانی روشی خاص است. به عنوان مثال یک پیکره وسیع چند زبانی از داده‌ها، برای روشهای آماری مورد نیاز است، حال آنکه برای روشهای مبتنی بر دستورزبان لازم نیست. اما از سویی دیگر روشهای مبتنی بر دستورزبان نیاز به یک زبان‌شناس حرفه‌ای برای طراحی دقیق دستورزبانی که استفاده خواهد شد، دارند. برای ترجمه بین زبان‌های نزدیک بهم، تکنیکی به نام ترجمه ماشینی مبتنی بر انتقال سطحی[۴] ممکن است استفاده شود.

روش قاعده‌مند

الگوی ترجمه ماشینی قانون مند شامل الگوی ترجمه ماشینی مبتنی بر انتقال، ترجمه ماشینی بین زبانی و ترجمه ماشینی مبتنی بر فرهنگ لغت است.

روش بین زبانی

ترجمه ماشینی بین زبانی نمونه‌ای از ترجمه ماشینی قاعده‌مند است. در این روش، متن به زبان مبدأ به یک متن بین زبانی (بعنوان مثال، زبانهای بین‌المللی کمکی همانند اسپرانتو) که مستقل از زبان مقصد است، تبدیل می‌شود. سپس متن به زبان مقصد از متن بین زبانی، تولید خواهد شد.

روش مبتنی بر فرهنگ لغت

ترجمه ماشینی می‌تواند از روشی مبتنی بر داده‌های فرهنگ لغت استفاده کند و این بدان معنی است که کلمات به همان گونه‌ای که در فرهنگ لغات موجودند، ترجمه می‌شوند.

روش آماری

ترجمه ماشینی به روش آماری، سعی در تولید ترجمه‌هایی دارد که از روشهای آماری مبتنی بر پیکره‌های متنی دوزبانی استفاده می‌کنند. همانند پیکره کانادایی هانسارد(Canadian Hansard corpus)، بایگانی انگلیسی-فرانسوی مجلس کانادا و یوروپارل(EUROPARL) و بایگانی پارلمان اروپا.

درحال حاضر این چنین پیکره‌هایی موجودند و نتایج ثمربخشی از ترجمه متون از نوع مشابهی، بدست می‌آید اما این چنین پیکره‌ای هنوز بسیار کمیاب است. اولین نرم‌افزار آماری ترجمه ماشینی، کاندید(CANDIDE) تولیدی شرکت آی‌بی‌ام بود. گوگل نیز سیسترن(SYSTRAN) را برای سالهای متمادی استفاده کرد اما نهایتاً در اکتبر ۲۰۰۷ به مترجمی آماری تغییر روش داد. به تازگی، گوگل قابلیت‌های ترجمه خود را بوسیله دادن ۲۰۰ میلیون کلمه از اسناد سازمان ملل بعنوان ورودی سیستم-برای تعلیم سیستم خود- بهبود بخشیده‌اند. وبدین سان دقت ترجمه‌ها بهبود یافته‌است.[۵]

روش مبتنی بر مثال

ترجمه ماشینی مبتنی بر مثال[۶] توسط ماکوتو ناگاوُ(Makoto Nagao)[۷] در سال ۱۹۸۴ مطرح شد. این روش اغلب با عنوان روش استفاده کننده از پیکره دوزبانی معرفی می‌شود. درواقع این روش، ترجمه‌ای بر اساس تمثیل است و می‌توان آنرا به عنوان پیاده‌سازی روش استدلال موردی در یادگیری ماشینی تلقی کرد.

ترجمه ماشینی پیوندی

روش پیوندی، قدرتمندی دو روش آماری و قاعده‌مند را باهم ادغام می‌کند.[۸] بسیاری از شرکتهای ترجمه ماشینی (همانند آسیا آنلاین و سیسترن(SYSTRAN)) مدعی داشتن روشی چندگانه مبتنی بر دو روش قاعده‌مند و آماری در ترجمه ماشینی، هستند. این روشها به دو گونه مختلف زیر می‌باشند:

  • قوانین در مرحله دوم توسط روشهای آماری پردازش می‌شوند

در این روش ترجمه بوسیله موتورهای قاعده‌مند انجام می‌شود. سپس معیارهای آماری برای تنظیم/تصحیح خروجی موتور قاعده‌مند اعمال می‌شوند.

  • معیارهای آماری از ابتدا توسط قوانین هدایت می‌شوند

قوانین برای پیش-پردازش داده‌ها برای هدایت بهتر موتور آماری استفاده می‌شوند. قوانین همچنین برای پس-پردازش خروجی موتور آماری برای پیاده‌سازی عملیاتی همچون نرمال سازی استفاده می‌شوند. این روش قدرت، کنترل و انعطاف‌پذیری بسیار بیشتری دارد.

رمزگشایی

در سال‌های اخیر دانشگاه کالیفرنیای جنوبی (USC) بر روی روشهایی تمرکز کرده‌اند که ایده‌های اولیه آن از رمزنگاری استخراج شده‌اند. این روش هنوز در سطح تحقیقات اولیه است و تا رسیدن به یک روش قابل قبول فاصله زیادی باقی است. اما در صورت تحقق این روش ادعای وارن ویور که ترجمه ماشینی را تنها روشی برای رمزگشایی از متن رمزشده زبان مبدأ در زبان مقصد می‌دانست، تحقق خواهد یافت. مدل ترجمه در این روش بدون داده موازی از روی پیکره‌های نظیر آموزش داده می‌شوند و لذا در صورت تحقق تحولی شگرفت در فرایند ترجمه بخصوص برای زبانهایی که دارای منابع زبانشناسی محدود هستند، خواهد بود.

مسئله‌های اصلی

ابهام‌زدایی

ابهام‌زدایی از کلمات با یافتن ترجمه مناسب برای کلمه‌ای با بیش از یک معنی در ارتباط است. این مسئله اولین بار در سال ۱۹۵۰ توسط یهوشوا بار-هیلل (Yehoshua Bar-Hillel) مطرح شد.[۹] او به این موضوع که بدون یک فرهنگ نامهٔ جهانی، یک ماشین هرگز نمی‌تواند بین دو معنی کلمه، معنی صحیح را تشخیص دهد، تکیه کرد. امروزه روشهای بسیاری برای حل این مشکل بوجود آمده‌اند که این روشها بطور تقریبی به دو دستهٔ روشهای «سطحی» و «عمقی» تقسیم می‌شوند. روشهای سطحی تصور می‌کنند که هیچ دانشی از متن ندارند. آنها به سادگی روشهای آماری را برای کلمات اطراف کلمه مبهم، اعمال می‌کنند. اما روشهای عمقی دانشی وسیع از کلمه را متصور می‌شوند. تا بحال، روشهای سطحی موفقیت بیشتری داشته‌اند. آقای کلود پایرون(Claude Piron)، یکی از مترجم‌های بسیار قدیمی سازمان ملل و سازمان بهداشت جهانی، نوشته‌است که ترجمهٔ ماشینی، در بهترین نوع آن، آسان‌ترین بخش کار مترجمان را می‌تواند انجام دهد. بخش سخت‌تر و زمان‌گیر معمولاً در ارتباط با تشخیص ابهامات متن منبع است که این عمل نیاز به برطرف کردن آشفتگی‌های دستور زبانی و لغوی زبان مقصد دارد.[۱۰]

روش ایده‌آل عمقی ممکن است نرم‌افزار مترجم را ملزوم به انجام تمامی تحقیقات موردنیاز برای برطرف کردن اینگونه ابهامات بکند. اما این امر نیاز به هوش مصنوعی بسیار وسیعتری نسبت به آنچه تا بحال در این زمینه به دست آمده، دارد. روش سطحی که به سادگی ابهام یک عبارت انگلیسی را حدس می‌زند، شانس بالایی دراشتباه حدس زدن نیز دارد. روش سطحی ای وجود دارد که می‌گوید: «دربارهٔ هر ابهام از خود کاربر بپرس». اما این روش بنا به تخمین آقای پایرون، تنها ۲۵٪ از کار مترجم حرفه‌ای را انجام خواهد داد(۷۵٪ سختتر کار برای انسان می‌ماند و ماشین در انجام آن ناتوان است)

گفتارهای غیر استاندارد

یکی از مسائل ترجمه‌های ماشین پایین بودن دقتشان در ترجمهٔ گفتارهای غیررسمی و محاوره‌ای است. ترجمه ماشین بر پایه داده‌های آماری ورودی داده‌هایشان غیر محاوره‌ای است و در نتیجه در گفتارهای استاندارد بهتر عمل می‌کنند؛ و روش‌های قاعده‌مند به خاطر طبیعتشان جمله‌های غیر استاندارد رایج را پوشش نمی‌دهند.

واحدهای اسمی

واحدهای اسمی (Name entities)، به انتساب اسم به جوهره‌های وجودی در جهان خارج گفته می‌شود. مانند اسامی اشخاص و مکان‌ها و … یا ابزار زمان و کیفیت چیزی. چالش اول در ترجمه ماشین، شناسایی واحدهای اسمی است. مثلاً در ترجمهٔ «European Union» اگر به عنوان واحد اسمی شناسایی نشود ترجمه ماشینی تک به تک کلمات ممکن است به ترجمهٔ «اتحادیه اروپایی» منجر می‌شود با اینکه «اتحادیه اروپا» ترجمه صحیح فارسی آن می‌باشد. باید اشاره کرد که در موارد زیادی یک به خصوص اسم اشخاص ترجمه پذیر نیست و راه جایگزین آن بجای ترجمه نویسه‌گردانی است.

نرم‌افزارهای کاربردی

درحال حاضر نرم‌افزارهای بسیاری برای ترجمهٔ زبان طبیعی، موجودند که بسیاری از آنها آنلاین می‌باشند. همانند:

  • آسیا آنلاین:[۱۱] موتور ترجمه ماشینی قابل سفارشی سازی است که ادعا می‌شود خروجی اش کیفیتی نزدیک به انسان دارد. آسیا آنلاین همچنین ابزاری برای ویرایش و ساخت ماشین مترجم دلخواه دارد که آنرا بوسیلهٔ مجموعهٔ استودیوی زبانی خود، توسعه بخشیده‌است.
  • مترجم خودکار زبان هندی به پنجابی:[۱۲] مترجمی است که از روش مستقیم استفاده می‌کند. این مترجم امکان ترجمهٔ صفحات وب هندی به زبان پنجابی را فراهم می‌سازد. همچنین امکان نوشتن پست الکترونیک به زبان هندی و ارسال آن به دریافت کننده به زبان پنجابی را دارد.
  • ورد لینگو (Worldlingo): مترجمی که بر مبنای دو روش آماری و قاعده‌مند کار می‌کند (همانند مترجم مایکروسافت آفیس).
  • سیسترن:[۱۳] همان سیستم یاهو! بیبل فیش (Yahoo! Babel Fish).
  • پرامت (Promt): سرویسهای ترجمهٔ آنلاین در Voila.fr و Orange.fr
  • اپتک:[۱۴] یک سیستم مترجم خودکار چندگانه (در سال ۲۰۰۹ ارایه شد)
  • ایدوماکس:[۱۵] سرویسهای مترجم آنلاین در idiomax.com

با اینکه هیچ‌یک از سیستمها، خلاصه‌ای بدون خطا، تمام خودکار و با کیفیت بالا نمی‌توانند تولید کنند، بسیاری از سیستم‌های تمام خودکار، خروجی منطقی ای را تولید می‌کنند.[۱۶][۱۷][۱۸] کیفیت ترجمه ماشینی اگر حوزهٔ موضوعی متن محدود و کنترل شده باشد، اساساً بهتر خواهد شد. با وجود محدودیت‌های موروثی، نرم‌افزارهای ترجمه ماشینی در سرتاسر جهان مورد استفاده می‌باشند. احتمالاً بزرگترین مؤسسه استفاده کننده از این نرم‌افزارها کمیسیون اروپاست. پروژه مولتو(MOLTO)، که بوسیله دانشگاه گوتنبورگ ایجاد شده‌است، بیش از ۲٫۳۷ میلیون یورو بعنوان بودجهٔ حمایتی از اتحادیه اروپا برای ساخت ابزار مترجم قابل اطمینان دریافت کرده که بتواند بیشتر زبانهای اتحادیه اروپا را دربر بگیرد. تاگل تکست(Toggletext)، یک سیستم مبتنی بر انتقال است که زبان انگلیسی را به اندونزیایی ترجمه می‌کند.

گوگل ادعا کرده‌است که نتایجی که قولش را داده بود، بوسیله استفاده از موتور ترجمه ماشینی آماری اش حاصل شده‌است.[۱۹] ترجمه آماری که در ابزار زبان گوگل (Google language tools) برای تبدیل بین زبانهای عربی، انگلیسی و بین چینی و انگلیسی استفاده شده‌است، امتیاز کلی ۰٫۴۲۸۱ را از مؤسسه ملی استاندارد و تکنولوژی گرفت که درقیاس با بلو-۴ شرکت آی بی ام که در تابستان ۲۰۰۶ امتیاز ۰٫۳۹۵۴ گرفته بود، برتری یافت.

با تمرکز امروزی تروریسم، منابع نظامی ایالات متحده آمریکا مبلغ بالایی را در مهندسی زبان طبیعی، سرمایه‌گذاری کرده‌اند. در حال حاضر نیروی نظامی به ترجمه و پردازش زبانهایی همانند عربی، پشتو ودری علاقه‌مند است. دفترپردازش فناوری اطلاعات دارپا، برنامه‌هایی همانند تایدز(TIDES)و مترجم بابیلون را میزبانی می‌کند. نیروی هوایی آمریکا نیز ۱میلیون دلار برای توسعه و ایجاد تکنولوژی ترجمه زبان، تعهد کرده‌است.[۲۰]

رشد جالب توجه شبکه‌های اجتماعی، همانند فیس بوک یا پیام‌رسان‌های فوری همانند اسکایپ(Skype)، گوگل تاک(Google Talk) و ام اس ان مسنجر(MSN Messenger)، در سالهای اخیر، مورد استفادهٔ دیگری برای نرم‌افزارهای ترجمه ماشینی شده‌است. چراکه بدین وسیله کابران به زبان‌های محتلف می‌توانند با یکدیگر ارتباط برقرار کنند.

نرم‌افزارهای ترجمه ماشینی همچنین برای بسیاری از موبایلها، کامپیوترهای جیبی و.. عرضه شده‌است. بخاطر قابلیت حمل آنها، اینگونه وسایل بعنوان ابزارهای ترجمه برای موبایل مشخص شده‌اند که شبکه تجارتی با استفاده از موبایل را بین شرکایی با زبانهای مختلف ممکن ساخته‌است. همچنین این نرم‌افزارها نیاز به مترجم انسان بعنوان واسطی در مکالمات دوطرف را از بین می‌برند.

ارزیابی ترجمه خودکار در حوزه‌های مختلف

ترجمهٔ متون رسمی و قاعده‌مند و همچنین متون علمی به این علت که از وضوح بیشتر و ابهام کمتری برخوردارند به سهولت از طریق کامپیوتر انجام می‌گیرد.

ترجمه متون ادبی که از دیدگاه علمی در حیطه ترجمه فرهنگی قرار دارد، اگر غیرممکن نباشد، چندان ساده نخواهدبود. براساس پیش‌بینی‌های اهل فن بدون شک طی چند سال آتی نتایج حاصل از ترجمه متون ادبی از طریق کامپیوتر با نتایج فعلی آن کاملاً متفاوت خواهدبود.

ارزیابی ترجمهٔ ماشینی

یکی از مسائلی که همواره در زمینه ترجمهٔ ماشینی مورد توجه بوده‌است، روشها و پارامترهای ارزیابی نتایج ترجمه‌است. قدیمی‌ترین روش استفاده از داورهای انسانی برای ارزیابی کیفیت یک ترجمه است. اگرچه ارزیابی توسط انسان زمان‌بر است اما هنوز قابل اطمینان‌ترین راه برای مقایسهٔ سیستم‌های مختلف همانند سیستم‌های مبتنی بر روش‌های آماری و قاعده‌مند است. ابزارهای ارزیابی خودکار شامل بلو محصول شرکت آی‌بی‌ام(BLEU)،[۲۱] نیست(NIST) و متئور(METEOR) می‌باشند. همچنین، دانشگاه بارسلون سیستمی را با نام IQ برای ارزیابی سیستم‌های ترجمه ماشینی ارائه داده‌است که بر اساس چندین روش می‌تواند ارزیابی را انجام دهد. این سیستم ارزیابی بصورت متن‌باز بوده و هر کسی می‌تواند بر اساس نیاز خودش آنرا تنظیم نموده و استفاده نماید.

بسنده کردن به ترجمهٔ ماشین بدون ویرایش مجدد آن، این حقیقت را که ارتباطات بوسیلهٔ زبان انسان با مفاهیم نهفته شده در آن است، نادیده می‌گیرد؛ و حقیقت دیگر این است که حتی متون کاملاً ترجمه شده توسط انسان نیز ممکن است خطا و اشتباه داشته‌است. درنتیجه برای اطمینان حاصل کردن از اینکه ترجمهٔ تولید شده توسط ماشین برای انسان مورد استفاده خواهد بود و کیفیت قابل قبولی خواهد داشت، متون ترجمه شده توسط ماشین باید نهایتاً توسط انسان بازبینی و ویرایش شوند. گرچه، سیستم‌هایی که مبتنی بر روشهای خاصی از ترجمه ماشینی عمل می‌کنند، بعضاً مستقلاً خروجی قابل قبولی را تولید می‌کنند که نیازی به نظارت نهایی انسان ندارد.

پانویس

  1. Rule Based
  2. interlingual machine translation
  3. transfer-based machine translation
  4. shallow-transfer machine translation
  5. Google Translator: The Universal Language
  6. (Example-based machine translation (EBMT
  7. Nagao, M. 1981. A Framework of a Mechanical Translation between Japanese and English by Analogy Principle, in Artificial and Human Intelligence, A. Elithorn and R. Banerji (eds.) North- Holland, pp. 173-180, 1984.
  8. Boretz, Adam, "AppTek Launches Hybrid Machine Translation Software" SpeechTechMag.com (posted 2 MAR 2009)
  9. Milestones in machine translation - No.6: Bar-Hillel and the nonfeasibility of FAHQT by John Hutchins
  10. کلود پیرون، Le défi des langues (The Language Challenge), Paris, L'Harmattan, 1994.
  11. Asia Online: http://en.wikipedia.org/wiki/Asia_Online
  12. Hindi to Punjabi Machine Translation System: http://en.wikipedia.org/wiki/Hindi_to_Punjabi_Machine_Translation_System
  13. SYSTRAN: http://en.wikipedia.org/wiki/SYSTRAN
  14. Apptek: http://en.wikipedia.org/wiki/Apptek
  15. IdiomaX: http://en.wikipedia.org/wiki/IdiomaX
  16. Melby, Alan. The Possibility of Language (Amsterdam:Benjamins, 1995, 27-41)
  17. Wooten, Adam. "A Simple Model Outlining Translation Technology" T&I Business (February 14, 2006)
  18. Appendix III of 'The present status of automatic translation of languages', Advances in Computers, vol.1 (1960), p.158-163. Reprinted in Y.Bar-Hillel: Language and information (Reading, Mass. : Addison-Wesley, 1964), p.174-179.
  19. Google Blog: The machines do the translating (by Franz Och)
  20. GCN — Air force wants to build a universal translator
  21. Papineni, K. , Roukos, S. , Ward, T. and Zhu, W.J. , 2002, July. BLEU: a method for automatic evaluation of machine translation. In Proceedings of the 40th annual meeting on association for computational linguistics (pp. 311-318). Association for Computational Linguistics.

فهرست گزیدهٔ منابع

  • Cohen, J.M. , "Translation", دانشنامه آمریکانا, 1986, vol. 27, pp. ۱۲–۱۵.
  • Hutchins, W. John (1992). An Introduction to Machine Translation. London: Academic Press. ISBN 0-12-362830-X. {{cite book}}: Unknown parameter |coauthors= ignored (|author= suggested) (help)
  • کلود پیرون، Le défi des langues — Du gâchis au bon sens (The Language Challenge: From Chaos to Common Sense), Paris, L'Harmattan, 1994.

پیوند به بیرون