تغییرات

پرش به ناوبری پرش به جستجو
جز
اصلاح فاصله مجازی + اصلاح نویسه با استفاده از AWB
[[نرم‌افزار]]های ترجمه ماشینی کنونی اغلب به کاربر اجازهٔ تغییر دلخواه بر اساس حوزه کاری یا حرفه‌ای دلخواه را می‌دهند (همانند [[هواشناسی|گزارش آب و هوا]]). در واقع ارتقاء کیفیت خروجی با استفاده از محدود کردن کلمات جایگزین شونده، انجام می‌شود.
این تکنیک بطور خاص در حوزهٔ رسمی یا زبانهای فرموله شده استفاده می‌شود. این بدین معنی است که ترجمه ماشینی از اسناد قانونی و دولتی آسان‌تر از تولید خروجی قابل استفاده از مکالمات یا متون غیر چهارچوب بندی شده دیگر است.
همچنین کیفیت خروجی بهبود یافته می‌تواند با استفاده از دخالت انسان بدست آید. برای مثال سیستم‌هایی موجودند که اگر کاربر بطور کاملاً واضحی کلماتی که اسامی خاص هستند را معین کرده باشد، قادر به ترجمه دقیق‌تری هستند. با کمک گرفتن از این تکنیک‌ها ترجمه ماشینی بعنوانبه عنوان یک ابزار برای کمک کردن به مترجمان (انسان‌ها) و بسیاری از موضوع‌های محدود، قادر به تولید خروجی قابل استفاده و نهایی است.
 
در ترجمهٔ ماشینی ویژگی‌هایی وجود دارد که نه تنها از نظر جاذبه و کشش علمی، بلکه، از دیدگاه [[علم اقتصاد|اقتصادی]] و دیگر ضرورت‌ها و اقتضاهای عصر، انجام آن را کاملاً توجیه می‌کند. به عنوان مثال، در مقر [[سازمان ناتو]] در [[بروکسل]] و جامعه اروپا علی‌رغم آنکه حدود ۱۲۰۰ مترجم ورزیده به کار اشتغال دارند، در حال حاضر از ترجمه ماشینی نیز استفاده می‌شود. دلیل این امر سرعت و هزینه‌است. میزان کاری که مترجمی ورزیده در خلال چندین روز انجام می‌دهد، توسط کامپیوتر در عرض چند دقیقه انجام می‌شود. حتی اگر کیفیت و دقت ترجمه ماشینی کمتر از حاصل کار [[مترجم]] باشد، باز هم از جهات گوناگون اهمیت و ارزش خاص آن چشمگیر است.
 
ترجمه گوگل و مترجم گوگل هرگز نمی‌تواند جای مترجمین حرفه ایحرفه‌ای انسانی را بگیرد و متنی سلیس و روان و با عباراتی که کاملاً صحیح باشند، ایجاد نماید. هنگامی که مترجم گوگل به عبارت یا لغتی برخورد می‌کند که دارای تعداد زیادی از معانی است، نمی‌تواند مناسب‌ترین لغت را انتخاب نماید و خروجی آن به احتمال زیاد دارای بیانی غیرطبیعی یا اشتباه خواهد بود و این موضوع استفاده از گوگل ترجمه برای ترجمه متن را غیرممکن می‌نماید.
 
== تاریخچه ==
[[ترجمه|ترجمهٔ]] ماشینی از جملهٔ اولین اهداف مورد نظر در [[علوم رایانه]] و بخصوص در حوزهٔ [[هوش مصنوعی|هوش ماشینی]] به حساب می‌آید و سابقهٔ آن به حدود نیم قرن پیش از این بازمی‌گردد. نخستین ترجمه‌ای که بطور کامل توسط [[کامپیوتر]] انجام شد، ترجمهٔ متنی بود از [[زبان انگلیسی]] به [[زبان روسی]]. گر چه از آن زمان تا کنونتاکنون فناوری ترجمهٔ ماشینی رشد زیادی داشته‌است، هنوز هم نقص‌های فراوانی را داراست. اصولاً چون کامپیوترها نمی‌توانند مانند انسان هوشمند باشند، ترجمه‌ای هم که توسط آنهاآن‌ها انجام شود، ترجمهٔ کاملی نخواهد بود. نمی‌توان انتظار داشت که با استفاده از یک [[نرم‌افزار مترجم]]، هر متنی به آسانی ترجمه شود. نرم‌افزارهای مترجم، در بهترین حالت، عمل ترجمه را با دقتی در حدود ۷۰ درصد انجام می‌دهند. برای به دست آوردن نتیجه بهتر، لازم است قبل و بعد از ترجمه، مقداری ویرایش روی متن انجام شود.
 
در طی چند دههٔ اخیر و هم‌زمان با گسترش و پیشرفت [[زبان‌شناسی محاسباتی|زبان‌شناسی رایانه‌ای]]، در بسیاری از [[کشورهای جهان]]، تلاشهای همه‌جانبه و پیگیر در جهت ترجمهٔ متون از طریق کامپیوتر انجام گرفته، و حاصل کار با توجه به تنگناها، محدودیت‌ها، و مسائل خاص ترجمه درخور توجه‌است. در بعضی از زمینه‌ها حاصل کار واقعاً رضایت‌بخش است، ولی، در برخی موارد نتایج به دست آمده را علی‌رغم قابل فهم بودن، باید ویراستاری کرد. طبیعتاً نوع متن و میزان پیچیدگی آن اهمیت زیادی در نتیجه کار دارد.
در پس این فرایند بظاهر آسان، عملیات [[شناخت]]ی پیچیده‌ای واقع است. به منظور رمز گشایی معنای متن مبدأ، مترجم باید قابلیت تفسیر و تجزیه تحلیل تمام ویژگی‌های متن را داشته باشد. یک فرایند که احتیاج به دانش عمیقی از [[دستور زبان]]، [[جمله‌شناسی]] (نحو)، [[معناشناسی]] و اصطلاحات از هر دو زبان مبدأ و مقصد دارد به همان اندازه باید دانش مربوط به [[فرهنگ]] صحبت کنندگان آن زبان را نیز داشته باشد.
از آن جهت، چالشی در ترجمه ماشینی وجود دارد که چگونه یک کامپیوتر را آموزش دهیم که بتواند همانند یک انسان متنی را بفهمد و بتواند یک متن جدید در زبان مقصد بسازد که بنظر می‌رسد توسط انسان نوشته شده‌است.
این مسئله ممکن است به روشهایروش‌های مختلفی انجام شود.
 
== روش‌ها ==
برای دست یافتن به ترجمه ماشینی می‌توان روشی مبتنی بر قوانین [[زبان‌شناسی]] استفاده کرد، به این معنی که کلمات از نظر زبان‌شناسی ترجمه خواهند شد. (در واقع متناسب‌ترین کلمات مقصد جایگزین کلمات مبدأ خواهند شد)
 
این موضوع که موفقیت ترجمه ماشینی پیش از هر چیز نیازمند [[حل مسئله]] [[فهم زبان طبیعی]] است، اغلب مورد بحث است. به طوربه‌طور عام روش‌های قانون مند،<ref>Rule Based</ref> متن را با استفاده از ساختن واسطی سمبلیک -که نهایتاً متن زبان مقصد از آن ایجاد می‌شود- تجزیه می‌کنند.
 
با توجه به طبیعت نمایش واسطه، یک روش به عنوان ترجمه ماشینی بین زبانی<ref>interlingual machine translation</ref> یا ترجمه ماشینی مبتنی بر انتقال<ref>transfer-based machine translation</ref> معرفی می‌شود. این روش‌ها نیاز به [[واژگان]] وسیعی با اطلاعات [[تک‌واژشناسی]]، [[دستور زبان]] و [[معناشناسی]] دارند.
 
با دادن داده‌های کافی [[نرم‌افزار]]های ترجمه ماشینی حتی برای [[زبان اول|صحبت کنندهصحبت‌کننده بومی]] یک زبان به حدی خوب کار می‌کنند که معنی تقریبی آنچه توسط یک صحبت کنندهصحبت‌کننده بومی دیگر نوشته شده‌است بفهمد.
دشواری کار ترجمه خودکار، بدست آوردن اطلاعات کافی از نوع صحیح آن برای پشتیبانی روشی خاص است. به عنوان مثال یک پیکره وسیع چند زبانی از داده‌ها، برای روشهایروش‌های آماری مورد نیاز است، حال آنکه برای روشهایروش‌های مبتنی بر دستورزبان لازم نیست. اما از سویی دیگر روشهایروش‌های مبتنی بر دستورزبان نیاز به یک زبان‌شناس حرفه‌ای برای طراحی دقیق دستورزبانی که استفاده خواهد شد، دارند.
برای ترجمه بین زبان‌های نزدیک بهم، تکنیکی به نام [[ترجمه ماشینی مبتنی بر انتقال]] سطحی<ref>shallow-transfer machine translation</ref> ممکن است استفاده شود.
 
 
=== روش آماری ===
ترجمه ماشینی به روش آماری، سعی در تولید ترجمه‌هایی دارد که از روشهایروش‌های آماری مبتنی بر [[پیکره‌های متنی دوزبانی]] استفاده می‌کنند. همانند [[پیکره کانادایی هانسارد]](Canadian Hansard corpus)، بایگانی انگلیسی-فرانسوی مجلس کانادا و یوروپارل(EUROPARL) و بایگانی [[پارلمان اروپا]].
 
درحال حاضر این چنین پیکره‌هایی موجودند و نتایج ثمربخشی از ترجمه متون از نوع مشابهی، بدست می‌آید اما این چنین پیکره‌ای هنوز بسیار کمیاب است. اولین نرم‌افزار آماری ترجمه ماشینی، کاندید(CANDIDE) تولیدی شرکت [[آی‌بی‌ام]] بود. [[گوگل]] نیز سیسترن(SYSTRAN) را برای سالهای متمادی استفاده کرد اما نهایتاً در اکتبر ۲۰۰۷ به مترجمی آماری تغییر روش داد. به تازگی، گوگل قابلیت‌های ترجمه خود را بوسیله دادن ۲۰۰ میلیون کلمه از اسناد [[سازمان ملل]] بعنوانبه عنوان ورودی سیستم-برای تعلیم سیستم خود- بهبود بخشیده‌اند. وبدین سان دقت ترجمه‌ها بهبود یافته‌است.<ref>[http://blog.outer-court.com/archive/2005-05-22-n83.html Google Translator: The Universal Language<!-- Bot generated title -->]</ref>
 
=== روش مبتنی بر مثال ===
ترجمه ماشینی مبتنی بر مثال<ref>(Example-based machine translation (EBMT</ref> توسط ماکوتو ناگاوُ(Makoto Nagao)<ref>Nagao, M. 1981. A Framework of a Mechanical Translation between Japanese and English by Analogy Principle, in Artificial and Human Intelligence, A. Elithorn and R. Banerji (eds.) North- Holland, pp. 173-180, 1984.</ref> در سال ۱۹۸۴ مطرح شد. این روش اغلب با عنوان روش استفاده کنندهاستفاده‌کننده از پیکره دوزبانی معرفی می‌شود. درواقعدر واقع این روش، ترجمه‌ای بر اساس [[تمثیل]] است و می‌توان آنراآن را به عنوان پیاده‌سازی روش [[استدلال موردی]] در [[یادگیری ماشینی]] تلقی کرد.
 
=== ترجمه ماشینی پیوندی ===
روش پیوندی، قدرتمندی دو روش آماری و قاعده‌مند را باهم ادغام می‌کند.<ref name="speechtechmag.com">[http://www.speechtechmag.com/Articles/News/News-Feature/AppTek-Launches-Hybrid-Machine-Translation-Software-52871.aspx Boretz, Adam, "AppTek Launches Hybrid Machine Translation Software" SpeechTechMag.com (posted 2 MAR 2009) ]</ref> بسیاری از شرکتهایشرکت‌های ترجمه ماشینی (همانند آسیا آنلاین و سیسترن(SYSTRAN)) مدعی داشتن روشی چندگانه مبتنی بر دو روش قاعده‌مند و آماری در ترجمه ماشینی، هستند. این روشهاروش‌ها به دو گونه مختلف زیر می‌باشند:
* '''قوانین در مرحله دوم توسط روشهایروش‌های آماری پردازش می‌شوند'''
در این روش ترجمه بوسیله موتورهای قاعده‌مند انجام می‌شود. سپس معیارهای آماری برای تنظیم/تصحیح خروجی موتور قاعده‌مند اعمال می‌شوند.
* '''معیارهای آماری از ابتدا توسط قوانین هدایت می‌شوند'''
== مسئله‌های اصلی ==
=== ابهام‌زدایی ===
ابهام‌زدایی از کلمات با یافتن ترجمه مناسب برای کلمه‌ای با بیش از یک معنی در ارتباط است. این مسئله اولین بار در سال ۱۹۵۰ توسط یهوشوا بار-هیلل (Yehoshua Bar-Hillel) مطرح شد.<ref>[http://ourworld.compuserve.com/homepages/WJHutchins/Miles-6.htm Milestones in machine translation - No.6: Bar-Hillel and the nonfeasibility of FAHQT] by John Hutchins</ref> او به این موضوع که بدون یک فرهنگ نامهٔ جهانی، یک ماشین هرگز نمی‌تواند بین دو معنی کلمه، معنی صحیح را تشخیص دهد، تکیه کرد. امروزه روشهایروش‌های بسیاری برای حل این مشکل بوجود آمده‌اند که این روشهاروش‌ها بطور تقریبی به دو دستهٔ روشهایروش‌های «سطحی» و «عمقی» تقسیم می‌شوند.
روشهای سطحی تصور می‌کنند که هیچ دانشی از متن ندارند. آنهاآن‌ها به سادگی روشهایروش‌های آماری را برای کلمات اطراف کلمه مبهم، اعمال می‌کنند. اما روشهایروش‌های عمقی دانشی وسیع از کلمه را متصور می‌شوند. تا بحال، روشهایروش‌های سطحی موفقیت بیشتری داشته‌اند.
آقای کلود پایرون(Claude Piron)، یکی از مترجم‌های بسیار قدیمی [[سازمان ملل]] و [[سازمان بهداشت جهانی]]، نوشته‌است که ترجمهٔ ماشینی، در بهترین نوع آن، آسان‌ترین بخش کار مترجمان را می‌تواند انجام دهد. بخش سخت‌تر و زمان‌گیر معمولاً در ارتباط با تشخیص ابهامات متن منبع است که این عمل نیاز به برطرف کردن آشفتگی‌های دستور زبانی و لغوی زبان مقصد دارد.<ref name="piron">[[کلود پیرون]]، ''Le défi des langues'' (The Language Challenge), Paris, L'Harmattan, 1994. <!-- GFDL translation by Jim Henry --></ref>
 
 
=== واحدهای اسمی ===
واحدهای اسمی (Name entities)، به انتساب اسم به جوهره‌های وجودی در جهان خارج گفته می‌شود. مانند اسامی اشخاص و مکان‌ها و … یا ابزار زمان و کیفیت چیزی. چالش اول در ترجمه ماشین، شناسایی واحدهای اسمی است. مثلاً در ترجمهٔ «European Union» اگر به عنوان واحد اسمی شناسایی نشود ترجمه ماشینی تک به تک کلمات ممکن است به ترجمهٔ «اتحادیه اروپایی» منجر می‌شود با اینکه «اتحادیه اروپا» ترجمه صحیح فارسی آن می‌باشد. باید اشاره کرد که در موارد زیادی یک به خصوص اسم اشخاص ترجمه پذیر نیست و راه جایگزین آن بجایبه جای ترجمه [[نویسه‌گردانی]] است.
 
== نرم‌افزارهای کاربردی ==
درحال حاضر نرم‌افزارهای بسیاری برای ترجمهٔ زبان طبیعی، موجودند که بسیاری از آنهاآن‌ها آنلاین می‌باشند. همانند:
* آسیا آنلاین:<ref>Asia Online: http://en.wikipedia.org/wiki/Asia_Online</ref> موتور ترجمه ماشینی قابل سفارشی سازی است که ادعا می‌شود خروجی اش کیفیتی نزدیک به انسان دارد. آسیا آنلاین همچنین ابزاری برای ویرایش و ساخت ماشین مترجم دلخواه دارد که آنراآن را بوسیلهٔ مجموعهٔ استودیوی زبانی خود، توسعه بخشیده‌است.
* مترجم خودکار [[زبان هندی]] به پنجابی:<ref>Hindi to Punjabi Machine Translation System: http://en.wikipedia.org/wiki/Hindi_to_Punjabi_Machine_Translation_System</ref> مترجمی است که از روش مستقیم استفاده می‌کند. این مترجم امکان ترجمهٔ [[صفحات وب]] هندی به [[زبان پنجابی]] را فراهم می‌سازد. همچنین امکان نوشتن [[پست الکترونیک]] به زبان هندی و ارسال آن به دریافت کنندهدریافت‌کننده به زبان پنجابی را دارد.
* ورد لینگو (Worldlingo): مترجمی که بر مبنای دو روش آماری و قاعده‌مند کار می‌کند (همانند مترجم [[مایکروسافت آفیس]]).
* سیسترن:<ref>SYSTRAN: http://en.wikipedia.org/wiki/SYSTRAN</ref> همان سیستم [[یاهو]]! بیبل فیش (Yahoo! Babel Fish).
* پرامت (Promt): سرویسهای ترجمهٔ آنلاین در Voila.fr و Orange.fr
* اپتک:<ref>Apptek: http://en.wikipedia.org/wiki/Apptek</ref> یک سیستم مترجم خودکار چندگانه (در سال ۲۰۰۹ ارایهارائه شد)
* ایدوماکس:<ref>IdiomaX: http://en.wikipedia.org/wiki/IdiomaX</ref> سرویسهای مترجم آنلاین در idiomax.com
با اینکه هیچ‌یک از سیستمها،سیستم‌ها، خلاصه‌ای بدون خطا، تمام خودکار و با کیفیت بالا نمی‌توانند تولید کنند، بسیاری از سیستم‌های تمام خودکار، خروجی منطقی ای را تولید می‌کنند.<ref>[http://www.benjamins.com/cgi-bin/t_bookview.cgi?bookid=BTL%2014 Melby, Alan. The Possibility of Language (Amsterdam:Benjamins, 1995, 27-41)]</ref><ref>[http://tandibusiness.blogspot.com/2006/02/simple-model-outlining-translation.html Wooten, Adam. "A Simple Model Outlining Translation Technology" T&I Business (February 14, 2006)]</ref><ref>[http://www.mt-archive.info/Bar-Hillel-1960-App3.pdf Appendix III of 'The present status of automatic translation of languages', Advances in Computers, vol.1 (1960), p.158-163. Reprinted in Y.Bar-Hillel: Language and information (Reading, Mass. : Addison-Wesley, 1964), p.174-179.]</ref> کیفیت ترجمه ماشینی اگر حوزهٔ موضوعی متن محدود و کنترل شده باشد، اساساً بهتر خواهد شد.
با وجود محدودیت‌های موروثی، نرم‌افزارهای ترجمه ماشینی در سرتاسر جهان مورد استفاده می‌باشند. احتمالاً بزرگترین مؤسسه استفاده کنندهاستفاده‌کننده از این نرم‌افزارها [[کمیسیون اروپا]]ست. پروژه مولتو(MOLTO)، که بوسیله [[دانشگاه گوتنبورگ]] ایجاد شده‌است، بیش از ۲٫۳۷ میلیون یورو بعنوانبه عنوان بودجهٔ حمایتی از [[اتحادیه اروپا]] برای ساخت ابزار مترجم قابل اطمینان دریافت کرده که بتواند بیشتر زبانهای اتحادیه اروپا را دربر بگیرد.
تاگل تکست(Toggletext)، یک سیستم مبتنی بر انتقال است که زبان [[زبان انگلیسی|انگلیسی]] را به [[زبان اندونزیایی|اندونزیایی]] ترجمه می‌کند.
 
رشد جالب توجه [[شبکه‌های اجتماعی]]، همانند [[فیس بوک]] یا [[پیام‌رسان فوری|پیام‌رسان‌های فوری]] همانند اسکایپ(Skype)، گوگل تاک(Google Talk) و [[ام اس ان]] مسنجر(MSN Messenger)، در سالهای اخیر، مورد استفادهٔ دیگری برای نرم‌افزارهای ترجمه ماشینی شده‌است. چراکه بدین وسیله کابران به زبان‌های محتلف می‌توانند با یکدیگر ارتباط برقرار کنند.
 
نرم‌افزارهای ترجمه ماشینی همچنین برای بسیاری از موبایلها، کامپیوترهای جیبی و.. عرضه شده‌است. بخاطر قابلیت حمل آنها، اینگونه وسایل بعنوانبه عنوان ابزارهای ترجمه برای موبایل مشخص شده‌اند که شبکه تجارتی با استفاده از موبایل را بین شرکایی با زبانهای مختلف ممکن ساخته‌است. همچنین این نرم‌افزارها نیاز به مترجم انسان بعنوانبه عنوان واسطی در مکالمات دوطرف را از بین می‌برند.
 
== ارزیابی ترجمه خودکار در حوزه‌های مختلف ==
 
== ارزیابی ترجمهٔ ماشینی ==
یکی از مسائلی که همواره در زمینه ترجمهٔ ماشینی مورد توجه بوده‌است، روشهاروش‌ها و پارامترهای ارزیابی نتایج ترجمه‌است. قدیمی‌ترین روش استفاده از داورهای انسانی برای ارزیابی کیفیت یک ترجمه است. اگرچه ارزیابی توسط انسان زمان‌بر است اما هنوز قابل اطمینان‌ترین راه برای مقایسهٔ سیستم‌های مختلف همانند سیستم‌های مبتنی بر روش‌های آماری و قاعده‌مند است.
ابزارهای ارزیابی خودکار شامل [[بلو]] محصول شرکت آی‌بی‌ام(BLEU)،<ref>Papineni, K. , Roukos, S. , Ward, T. and Zhu, W.J. , 2002, July. BLEU: a method for automatic evaluation of machine translation. In Proceedings of the 40th annual meeting on association for computational linguistics (pp. 311-318). Association for Computational Linguistics.</ref> نیست(NIST) و متئور(METEOR) می‌باشند. همچنین، دانشگاه بارسلون سیستمی را با نام IQ برای ارزیابی سیستم‌های ترجمه ماشینی ارائه داده‌است که بر اساس چندین روش می‌تواند ارزیابی را انجام دهد. این سیستم ارزیابی بصورتبه صورت [[متن‌باز]] بوده و هر کسی می‌تواند بر اساس نیاز خودش آنراآن را تنظیم نموده و استفاده نماید.
 
بسنده کردن به ترجمهٔ ماشین بدون ویرایش مجدد آن، این حقیقت را که ارتباطات بوسیلهٔ زبان انسان با مفاهیم نهفته شده در آن است، نادیده می‌گیرد؛ و حقیقت دیگر این است که حتی متون کاملاً ترجمه شده توسط انسان نیز ممکن است خطا و اشتباه داشته‌است. درنتیجه برای اطمینان حاصل کردن از اینکه ترجمهٔ تولید شده توسط ماشین برای انسان مورد استفاده خواهد بود و کیفیت قابل قبولی خواهد داشت، متون ترجمه شده توسط ماشین باید نهایتاً توسط انسان بازبینی و ویرایش شوند. گرچه، سیستم‌هایی که مبتنی بر روشهایروش‌های خاصی از ترجمه ماشینی عمل می‌کنند، بعضاً مستقلاً خروجی قابل قبولی را تولید می‌کنند که نیازی به نظارت نهایی انسان ندارد.
 
== پانویس ==
۱۳۳٬۲۴۲

ویرایش

منوی ناوبری