پرش به محتوا

ترجمه ماشینی عصبی گوگل

از ویکی‌پدیا، دانشنامهٔ آزاد

ترجمه ماشینی عصبی گوگل (GNMT) یک سیستم ترجمه عصبی (NMT) است که توسط گوگل ایجاد شده‌است و در ماه نوامبر سال ۲۰۱۶ معرفی شد، که از شبکه عصبی مصنوعی برای افزایش روانی ترجمه و دقت در گوگل ترنسلیت استفاده می‌کند.

ترجمه ماشینی عصبی گوگل کیفیت ترجمه را با اعمال ترجمه ماشینی مثال محور بهبود می‌بخشد، روشی که در آن سیستم از میلیون‌ها مثال، ترجمه را می‌آموزد. معماری پیشنهادی ترجمه ماشینی عصبی گوگل ابتدا بر روی بیش از صد زبان پشتیبانی شده توسط گوگل ترنسلیت آزمایش شد.. با چارچوب (Framework) بزرگ پایان‌به‌پایان (end-to-end)، سیستم در طول زمان ایجاد ترجمه‌های بهتر و طبیعی‌تر را یادمی‌گیرد. ترجمه ماشینی عصبی گوگل قادر به ترجمه تمام جملات به صورت همزمان است، نه فقط جمله به جمله. شبکه ترجمه ماشینی عصبی گوگل می‌تواند با استفاده از رمزنگاری معانی یک جمله به جای یاد داشتن ترجمه‌های اصطلاح به اصطلاح، قادر به انجام ترجمه ماشین میان‌زبانی باشد.

تاریخچه

[ویرایش]

پروژه مغز گوگل در سال ۲۰۱۱ در "آزمایشگاه تحقیقاتی مخفی گوگل X" توسط یکی از همکاران گوگل جف دین، پژوهشگر گوگل گرگ کورادو، و استاد علوم کامپیوتر دانشگاه استنفورد اندرو انجی. فعالیت‌های انجی به برخی از بزرگترین پیشرفت‌ها در گوگل و استنفورد منجر شده‌است.

در سپتامبر ۲۰۱۶ یک تیم تحقیقاتی در گوگل اعلام کرد که سیستم ترجمه ماشینی عصبی گوگل (GNMT) را توسعه داده و در ماه نوامبر، گوگل ترجمه با استفاده از ماشین عصبی خود (NMT) را به جای شیوه دیگری که از اکتبر ۲۰۰۷ به کار گرفته بود، یعنی ترجمه آماری (SMT) آغاز کرد.

سیستم ترجمه عصبی گوگل ترنسلیت از یک شبکه عصبی مصنوعی بزرگ که قادر به یادگیری عمیق است استفاده می‌کند. با استفاده از میلیون‌ها نمونه، ترجمه ماشینی عصبی گوگل کیفیت ترجمه را بهبود می‌بخشد، سپس نتیجه تغییر ساختار داده شده و با گرامر زبان انسانی سازگار می‌شود. معماری پیشنهادی ترجمه ماشینی عصبی گوگل ابتدا بر روی بیش از صد زبان پشتیبانی شده توسط گوگل ترنسلیت آزمایش شد. ترجمه ماشینی عصبی گوگل زبان میانی خود را نساخت، بلکه از اشتراکاتی که میان تعداد زیادی زبان وجود داشت استفاده کرد، فعالیتی که بیشتر روانشناسان و زبان‌شناسان را درگیر می‌کرد تا دانشمندان حوزه کامپیوتر. موتور جدید ترجمه برای اولین بار در سال ۲۰۱۶ برای هشت زبان انگلیسی و فرانسوی، آلمانی، اسپانیایی، پرتغالی، چینی، ژاپنی، کره ای و ترکی فعال شد. در مارس ۲۰۱۷، سه زبان دیگر فعال شد: روسی، هندی و ویتنامی همراه با تایلندی پشتیبانی از آن بعداً اضافه شد. پشتیبانی از زبان عبری و عربی نیز با کمک انجمن ترجمه گوگل (متشکل از کاربران داوطلب) در همان ماه اضافه شد. در اواسط آوریل ۲۰۱۷، گوگلِ هلند پشتیبانی از زبان هلندی و دیگر زبان‌های اروپایی نزدیک به انگلیسی را اعلام کرد. پشتیبانی بیشتر برای نه زبان هندی، یعنی: هندی، بنگالی، مراتی، گجراتی، پنجابی، تامیل، تلوگو، مالایالام و کاناده در پایان آوریل ۲۰۱۷ اضافه.

زبان‌های پشتیبانی شده توسط GNMT

[ویرایش]

در ادامه لیستی از جفت زبان‌های قابل ترجمه توسط ماشین ترجمه عصبی گوگل ارائه شده‌است. (نام زبان‌ها ترجمه نشده‌است)

جفت زبان‌ها کد زبان‌ها
Afrikaans ↔ English afen
Albanian ↔ English sqen
Amharic ↔ English amen
Arabic ↔ English aren
Armenian ↔ English hyen
Azerbaijani ↔ English azen
Basque ↔ English euen
Bengali ↔ English bnen
Bosnian ↔ English bsen
Bulgarian ↔ English bgen
Catalan ↔ English caen
Cebuano ↔ English ceben
Chinese (Simplified) ↔ English zh-CN * ↔ en
Chinese (Traditional) ↔ English zh-TWen
Corsican ↔ English coen
Croatian ↔ English hren
Czech ↔ English csen
Danish ↔ English daen
Dutch ↔ English nlen
Esperanto ↔ English eoen
Estonian ↔ English eten
Finnish ↔ English fien
French ↔ English fren
Frisian ↔ English fyen
Galician ↔ English glen
Georgian ↔ English kaen
German ↔ English deen
Greek ↔ English elen
Gujarati ↔ English guen
Haitian Creole ↔ English hten
Hausa ↔ English haen
Hawaiian ↔ English hawen
Hebrew ↔ English iwen
Hindi ↔ English hien
Hmong ↔ English hmnen
Hungarian ↔ English huen
Icelandic ↔ English isen
Igbo ↔ English igen
Indonesian ↔ English iden
Irish ↔ English gaen
Italian ↔ English iten
Japanese ↔ English jaen
Javanese ↔ English jwen
Kannada ↔ English knen
Kazakh ↔ English kken
Khmer ↔ English kmen
Korean ↔ English koen
Kurdish ↔ English kuen
Lao ↔ English loen
Latvian ↔ English lven
Lithuanian ↔ English lten
Luxembourgish ↔ English lben
Macedonian ↔ English mken
Malagasy ↔ English mgen
Malay ↔ English msen
Malayalam ↔ English mlen
Maltese** <- English mt <- en
Maori ↔ English mien
Marathi ↔ English mren
Mongolian ↔ English mnen
Nepali ↔ English neen
Norwegian ↔ English noen
Nyanja (Chichewa) ↔ English nyen
Pashto ↔ English psen
Persian ↔ English faen
Polish ↔ English plen
Portuguese (Portugal, Brazil) ↔ English pten
Punjabi ↔ English paen
Romanian ↔ English roen
Russian ↔ English ruen
Samoan ↔ English smen
Scots Gaelic ↔ English gden
Serbian ↔ English sren
Sesotho ↔ English sten
Shona ↔ English snen
Sindhi ↔ English sden
Sinhala (Sinhalese) ↔ English sien
Slovak ↔ English sken
Slovenian ↔ English slen
Somali ↔ English soen
Spanish ↔ English esen
Swahili ↔ English swen
Swedish ↔ English sven
Tagalog (Filipino) ↔ English tlen
Tajik ↔ English tgen
Tamil ↔ English taen
Telugu ↔ English teen
Thai ↔ English then
Turkish ↔ English tren
Ukrainian ↔ English uken
Urdu ↔ English uren
Uzbek ↔ English uzen
Vietnamese ↔ English vien
Welsh ↔ English cyen
Xhosa ↔ English xhen
Yiddish ↔ English yien
Yoruba ↔ English yoen
Zulu ↔ English zuen

ترجمه زیرو شات

[ویرایش]

گفته می‌شود سیستم ترجمه ماشینی عصبی گوگل پیشرفتی را نسبت به گوگل ترنسلیت پیشین از لحاظ توانایی در «ترجمه زیرو شات» نشان می‌دهد، یعنی به‌طور مستقیم یک زبان را به زبانی دیگر ترجمه می‌کند (به عنوان مثال از ژاپنی به کره ای). گوگل ترنسلیت قبلاً ابتدا زبان منبع را به زبان انگلیسی ترجمه می‌کرد و سپس انگلیسی را به زبان مقصد، نه به‌طور مستقیم از یک زبان به زبان دیگر. در حال حاضر، هیچ جفت زبان غیر انگلیسی پشتیبانی نمی‌شود.

همچنین نگاه کنید به

[ویرایش]

پیوند به بیرون

[ویرایش]