ترجمه ماشینی مبتنی بر انتقال

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو

ترجمه ماشینی مبتنی بر انتقال گونه‌ای از ترجمهٔ ماشینی است که بر ایده ترجمه بین زبانی استوار است و اکنون یکی از وسیع ترین و رایج ترین متدهای ترجمه ماشینی است.

طراحی[ویرایش]

هر دو نوع ترجمه ماشینی مبتنی بر ترجمه بین زبانی و مبتنی بر انتقال بر یک ایده استوار است: برای ترجمه کردن این لازم است که یک رابط یا واسطه‌ای وجود داشته یاشد که معنی جمله اصلی را برای ترجمه صحیح دریافت کند. با این تفاوت که در روش مبتنی بر بین زبانی وابسته به زبان‌های در سوال است. درحالیکه ترجمه مبتنی بر انتقال وابسته به زبانی است که با آن درگیر شده است. روش‌هایی که ترجمه ماشینی مبتنی بر انتقال بر آن استوار است اساساً تفاوت‌های غیر قابل ملاحظه‌ای دارد. اما در اصل همه آنها از چند الگو پیروی می‌کنند: آنها مجموعه‌ای از دستورات زبان شناسی را که زبان هدف است بکار می‌برند. مرحله اول شامل آنالیز متن ورودی برای تکواژشناسی است تا یک ارایه داخلی تولید شود. ترجمه از این ارایه منتج می‌شود. با این توضیح که از دیکشنری‌های دوزبانه و قواعد گرامری (هر دو) در ترجمه استفاده می‌شود. با این استراتژی ترجمه ماشینی ممکن است که بتوانیم به ترجمه‌هایی با کیفیت بسیار بالا دست یابیم که ناحیه اطمینان صحت آن بیش از ۹۰% است. هر چند این اطمینان پذیری به شدت به ربان درگیر با این متن وابسته است. برای مثال فاصله و اختلاف بین دو زبان بسیار مهم و تاثیر گذار است.

بهره برداری[ویرایش]

در یک سیستم ترجمه مبتنی بر قاعده، متن اصلی ابتدا برای تکواژشناسی آنالیز می‌شود تا بتوان یک ارایه مطابق با قواعد صرف و نحوی رسید. پس از آن می‌توانید ارایه را به سطح مطلوب تری با تاکید بر بخش‌های مربوط به ترجمه و نادیده گرفتن بخش‌های کم اهمیت تر ویرایش کنید. فرایند انتقال آن گاه این ارایه نهایی را به ارایه‌ای هم سطح و هم کیفیت خود در زبان مقصد تبدیل می‌کند. به این دو متن ترجمه‌ای ارایه شده، ارایه‌های واسطه‌ای می گویند. از ارایه (به زبان مقصد) نیز مراحل به صورت معکوس اعمال می‌شود تا به ارایه‌ای از زبان مبدا دست یابیم.

آنالیزها و انتقال‌ها[ویرایش]

متدهای متنوعی برای آنالیز و انتقال وجود دارند که می‌توانند قبل از رسیدن به نتیجه پایانی به کار برده شوند. همراه با این روش‌های آماری ممکن است تولید سیستم‌های ترکیبی افزوده شود. روشی که انتخاب شده و نیز تاکیدات تا حد زیادی بستگی به طراحی سیستم دارد. با این حال، بیشتر سیستم‌ها شامل حداقل مراحل زیر است:

  • آنالیزهای Morphological: اشکال سطحی از متن ورودی به عنوان بخشی از گفتار (به عنوان مثال اسم، فعل، و غیره) و زیر رده (تعداد، جنس، زمان، و غیره) طبقه بندی می‌شوند. همه آنالیزهای ممکن برای هر شکل سطحی به طور معمول در این مرحله (به همراه اصل واژه) استخراج می‌شوند.
  • طبقه بندی واژگانی: در هر متن برخی از کلمات ممکن است بیش از یک معنی داشته باشد، که این باعث ابهام در تجزیه و تحلیل می‌شود. طبقه بندی واژگانی به محتوای کلمه توجه می‌کند تا بتواند معنای صحیحی را ارایه دهد تا با محتوای متن سازگاری مفهومی کامل را داشته باشد.. این می‌تواند شامل برچسب زدن بخشی از گفتار جهت ابهام زدایی یا... باشد.
  • انتقال واژگانی: این بخش اساساً ترجمه فرهنگ لغتی است. اصل زبان مبدأ (شاید با اطلاعات مفهومی) در یک فرهنگ لغت دو زبانه جستجو می‌شود و ترجمه انتخاب می‌گردد.
  • انتقال ساختاری: در حالی که مراحل قبلی با کلمات سروکار داشتند، این مرحله به ترکیبات بزرگتری، (برای مثال عبارات) می‌پردازد. ویژگی‌های این مرحله عبارتند از: تطابق جنس و تعداد و مرتب سازی مجدد از کلمات یا عبارات.
  • تولید Morphological: از خروجی مرحله انتقال ساختاری، فرم‌های سطحی زبان مقصد (هدف) تولید می‌شود.

انواع انتقال[ویرایش]

یکی از ویژگی‌های اصلی سیستم‌های ترجمه ماشینی مبتنی بر انتقال، مرحله‌ای است که در آن انتقال ارایه واسطه‌ای از زبان مبدا به ارایه واسطه‌ای زبان مقصد صورت می‌گیرد. (مرحله‌ای که ترجمه حد واسط از زبان مبدا به مقصد صورت می‌گیرد.) این می‌تواند در یکی از دو سطح از تجزیه و تحلیل زبانی انجام شود، و یا اینکه در جایی در میانه این دو سطح باشد.

  • انتقال سطحی (یا نحوی): این سطح با انتقال "ساختارهای نحوی" بین منبع و زبانهای هدف مشخص است. مناسب برای زبان در همان خانواده و یا از همان نوع است، برای مثال در زبان‌های رمانتیک بین اسپانیایی، کاتالان، فرانسوی، ایتالیایی، و غیره.
  • انتقال عمیق (یا معنایی): این سطح شامل ارایه‌های (ترجمه اولیه) معناشناختی است که وابسته به زبان مبدأ است. این ارایه می‌تواند از یک سری از ساختارها که معناگرا و نشان دهنده معنی است تشکیل شود. در این انتقال محمولات سیستم به طور معمول تولید می‌شود. در این سیستم‌های انتقال گزاره‌ها تولید می‌شوند. برای ترجمه نیز به طور معمول نیاز به انتقال ساختاری است. این سطح انتقال برای ترجمه زبان‌های دورتر (مثلاً اسپانیایی و زبان انگلیسی یا اسپانیایی و زبان باسکویی) استفاده می‌شود.

جستارهای وابسته[ویرایش]

منابع[ویرایش]

مشارکت‌کنندگان ویکی‌پدیا، «Transfer-based machine translation»، ویکی‌پدیای انگلیسی، دانشنامهٔ آزاد (بازیابی در ۸ ژوئن ۲۰۱۳).