زبانشناسی رایانشی: تفاوت میان نسخهها
اطلاعات کمی کامل تر شد |
با فرض حسن نیت ویرایش 5.106.98.161 (بحث) خنثیسازی شد. (تل) |
||
خط ۱: | خط ۱: | ||
{{زبانشناسی}} |
{{زبانشناسی}} |
||
'''زبانشناسی رایانشی''' (Computational |
'''زبانشناسی رایانشی''' (Computational linguistics) حوزهای میانرشتهای است که میکوشد با بهرهگیری از روشهای آماری و قاعدهبنیاد (rule-based)، به مدلسازی زبان طبیعی بپردازد. |
||
به شکل سنتی امر زبانشناسی رایانشی توسط دانشمندان کامپیوتری صورت میگرفت که در حوزه پردازش یک زبان خاص توسط کامپیوتر تخصص لازم را کسب کرده بوند. امروزه زبان شناسان رایانشی به عنوان اعضای گروههای میان رشتهای به فعالیت میپردازند، که اعضای این تیمها میتوانند شامل زبانشناسان (به شکل خاص در زمینه زبانشناسی همگانی تخصص دارند)، کارشناسان زبان (افرادی با پیش زمینه و تا حدی دارای مهارتهای عملی مرتبط با پروژه مورد نظر)، و دانشمندان علم کامپیوتر باشند. به طور کلی، زبانشناسی رایانشی از همکاری دانشمندان و کارشناسان رشتههای [[زبانشناسی]]، [[علوم رایانهای]]، متخصصین زمینهٔ [[هوش مصنوعی]]، [[ریاضی]]، [[منطق]]، [[علوم شناختی]]، [[روانشناسی شناختی]]، [[روان-زبانشناسی]]، [[مردمشناسی]]، [[عصبشناسی]] و برخی دیگر رشتهها استفاده میکند. |
|||
زبانشناسی رایانشی دارای زیر شاخههای نظری و کاربردی میباشد. زبانشناسی رایانشی نظری به بررسی و مطالعه [[زبانشناسی نظری]] با در نظر داشتن علوم شناختی میپردازد و زبانشناسی رایانشی کاربردی نتیاج کاربردی بحث مدل سازی برای زبان را مد نظر قرار میدهد.<ref>Hans Uszkoreit. What Is Computational Linguistics? [http://www.coli.uni-saarland.de/~hansu/what_is_cl.html] Department of Computational Linguistics and Phonetics of Saarland University</ref> |
زبانشناسی رایانشی دارای زیر شاخههای نظری و کاربردی میباشد. زبانشناسی رایانشی نظری به بررسی و مطالعه [[زبانشناسی نظری]] با در نظر داشتن علوم شناختی میپردازد و زبانشناسی رایانشی کاربردی نتیاج کاربردی بحث مدل سازی برای زبان را مد نظر قرار میدهد.<ref>Hans Uszkoreit. What Is Computational Linguistics? [http://www.coli.uni-saarland.de/~hansu/what_is_cl.html] Department of Computational Linguistics and Phonetics of Saarland University</ref> |
||
در ایران، این رشته در حال حاضر توسط دانشگاه صنعتی شریف و دانشگاه تهران در مقطع کارشناسی ارشد ارائه میشود. |
|||
== خاستگاه == |
== خاستگاه == |
||
خط ۱۳: | خط ۱۲: | ||
بعد از بررسی نحوه انجام ترجمه صحیح توسط انسانها چنین مشاهده شد که فرد مترجم میبایست به [[دستور]]، [[تکواژشناسی]] و همچنین [[نحو|قواعد نحوی]] هر دو زبان آگاهی داشته باشد. مبانی آگاهی از نحو نیز، داشتن دانش [[معناشناسی]]، [[واژگان]] و همچنین [[کاربردشناسی]] شناسایی شدند؛ بنابراین تلاش در جهت تحقق ترجمهٔ ماشینی به شاخهای پیچیده از علوم برای توصیف، نمایش و پردازش ماشینی زبانهای انسانی تبدیل شد.<ref>[http://www-nlpir.nist.gov/MINDS/FINAL/NLP.web.pdf Natural Language Processing by Liz Liddy, Eduard Hovy, Jimmy Lin, John Prager, Dragomir Radev, Lucy Vanderwende, Ralph Weischedel]</ref> |
بعد از بررسی نحوه انجام ترجمه صحیح توسط انسانها چنین مشاهده شد که فرد مترجم میبایست به [[دستور]]، [[تکواژشناسی]] و همچنین [[نحو|قواعد نحوی]] هر دو زبان آگاهی داشته باشد. مبانی آگاهی از نحو نیز، داشتن دانش [[معناشناسی]]، [[واژگان]] و همچنین [[کاربردشناسی]] شناسایی شدند؛ بنابراین تلاش در جهت تحقق ترجمهٔ ماشینی به شاخهای پیچیده از علوم برای توصیف، نمایش و پردازش ماشینی زبانهای انسانی تبدیل شد.<ref>[http://www-nlpir.nist.gov/MINDS/FINAL/NLP.web.pdf Natural Language Processing by Liz Liddy, Eduard Hovy, Jimmy Lin, John Prager, Dragomir Radev, Lucy Vanderwende, Ralph Weischedel]</ref> |
||
== |
== موارد کاربرد == |
||
در مورد استفاده از آن از جمله میتوان به کاربردهای زیر اشاره کرد: |
در مورد استفاده از آن از جمله میتوان به کاربردهای زیر اشاره کرد: |
||
=== |
=== فرایافت concept و تجزیه زبانهای برنامهنویسی === |
||
[[نوآم چامسکی]] توانست تشابه زبانهای طبیعی و زبانهای برنامهنویسی را به اثبات برساند. یعنی یک زبان رایانهای مانند زبانهای طبیعی دارای یک دستور زبان و یک فرهنگ میباشد. |
[[نوآم چامسکی]] توانست تشابه زبانهای طبیعی و زبانهای برنامهنویسی را به اثبات برساند. یعنی یک زبان رایانهای مانند زبانهای طبیعی دارای یک دستور زبان و یک فرهنگ میباشد. |
||
تفسیر یک متن از تجزیهٔ واژهها lexicon آغاز سپس با تجزیه نحو syntax و در آخر با تجزیه مفهوم semantic آن پایان میابد. |
تفسیر یک متن از تجزیهٔ واژهها lexicon آغاز سپس با تجزیه نحو syntax و در آخر با تجزیه مفهوم semantic آن پایان میابد. |
||
=== |
=== ترجمه ماشینی === |
||
مقالهٔ اصلی: [[ترجمه ماشینی]] (خودکار) |
مقالهٔ اصلی: [[ترجمه ماشینی]] (خودکار) |
||
این شاخه از زبانشناسی رایانهای زمان درازی کماهمیت جلوه میکرد. اما امروزه یکی از موارد مورد علاقه پژوهشگران این رشته میباشد. پس از مرحلهٔ شکافت واژهها و نحو میباید تجزیهٔ مفهوم و سپس پرگماتیک را نیز افزود. در واقع این دو کوشش بر شناخت مفهوم خاص یک واژه در مکانی که ظاهر میشود را دارد. |
این شاخه از زبانشناسی رایانهای زمان درازی کماهمیت جلوه میکرد. اما امروزه یکی از موارد مورد علاقه پژوهشگران این رشته میباشد. پس از مرحلهٔ شکافت واژهها و نحو میباید تجزیهٔ مفهوم و سپس پرگماتیک را نیز افزود. در واقع این دو کوشش بر شناخت مفهوم خاص یک واژه در مکانی که ظاهر میشود را دارد. |
||
⚫ | |||
'''<big>- بازشناسی گفتار و متن و تبدیل آنها به یکدیگر</big>''' |
|||
'''<big>- تبدیل تصویر به متن قابل پردازش</big>''' |
|||
'''<big>- مطالعات شناختی درباره نحوه پردازش زبان توسط مغز انسان و مدلسازی آن توسط کامپیوتر</big>''' |
|||
⚫ | |||
این ایده مدتی بهعنوان پاسخی قانعکننده به مسئله ارتباط انسان و ماشین تلقی میشد. این دید در واقع جنبهٔ گستردهتری از دستور زایشی چامسکی است. |
این ایده مدتی بهعنوان پاسخی قانعکننده به مسئله ارتباط انسان و ماشین تلقی میشد. این دید در واقع جنبهٔ گستردهتری از دستور زایشی چامسکی است. |
||
=== |
=== صرف محاسباتی === |
||
مقالهٔ اصلی: [[صرف محاسباتی]] |
مقالهٔ اصلی: [[صرف محاسباتی]] |
||
نسخهٔ ۱۸ فوریهٔ ۲۰۱۷، ساعت ۲۰:۲۵
بخش از مجموعه |
زبانشناسی |
---|
درگاه |
زبانشناسی رایانشی (Computational linguistics) حوزهای میانرشتهای است که میکوشد با بهرهگیری از روشهای آماری و قاعدهبنیاد (rule-based)، به مدلسازی زبان طبیعی بپردازد. به شکل سنتی امر زبانشناسی رایانشی توسط دانشمندان کامپیوتری صورت میگرفت که در حوزه پردازش یک زبان خاص توسط کامپیوتر تخصص لازم را کسب کرده بوند. امروزه زبان شناسان رایانشی به عنوان اعضای گروههای میان رشتهای به فعالیت میپردازند، که اعضای این تیمها میتوانند شامل زبانشناسان (به شکل خاص در زمینه زبانشناسی همگانی تخصص دارند)، کارشناسان زبان (افرادی با پیش زمینه و تا حدی دارای مهارتهای عملی مرتبط با پروژه مورد نظر)، و دانشمندان علم کامپیوتر باشند. به طور کلی، زبانشناسی رایانشی از همکاری دانشمندان و کارشناسان رشتههای زبانشناسی، علوم رایانهای، متخصصین زمینهٔ هوش مصنوعی، ریاضی، منطق، علوم شناختی، روانشناسی شناختی، روان-زبانشناسی، مردمشناسی، عصبشناسی و برخی دیگر رشتهها استفاده میکند.
زبانشناسی رایانشی دارای زیر شاخههای نظری و کاربردی میباشد. زبانشناسی رایانشی نظری به بررسی و مطالعه زبانشناسی نظری با در نظر داشتن علوم شناختی میپردازد و زبانشناسی رایانشی کاربردی نتیاج کاربردی بحث مدل سازی برای زبان را مد نظر قرار میدهد.[۱]
خاستگاه
پیدایش حوزه زبانشناسی رایانشی به عنوان یک حوزه علمی و مطالعاتی، در واقع به قبل از پیدایش هوش مصنوعی (حوزهای که زبا شناسی رایانشی اغلب زیر شاخهای از آن محسوب میشود) بازمیگردد. محل تولد زبانشناسی رایانشی را باید در تلاشهای ایالات متحده در دهه ۱۹۵۰ جست و جو کرد، یعنی زمانی که آنها در تلاش بودند تا بتوانند با استفاده از رایانه به شکل خودکار متون زبانهای بیگانه، به خصوص منابع علمی به زبان روسی، را به انگلیسی ترجمه کنند.[۲] از آنجایی که سیستمهای رایانهای، پردازشهای ریاضیاتی را بسیار سریع تر از انسانها انجام میدهند در ابتدا چنین تصور شد که مسایل تکنیکی ترجمه ماشینی به سرعت حل خواهند شد و آنها قادر خواهند بود تا ماشینهای ترجمه با تواناییهای مشابه انسان بسازند.[۳]
هنگامی که ترجمه ماشینی (نام دیگر: ترجمه مکانیکی) طراحی شده آن زمان نتوانست از انجام ترجمه صحیح متون برآید، بحث پردازش زبان انسان بسیار پیچیدهتر از آنچه پیشتر تصور میشد به حساب آمد. نام زبانشناسی رایانشی به عنوان نام شاخهای جدید از علوم متولد و ایجاد شد که به بررسی و تولید الگوریتمها و نرمافزارهای بررسی هوشمند دادههای زبانی میپردازد. زمانی که در سالهای ۱۹۶۰ زبانشناسی رایانشی پا به عرصهٔ وجود گذاشت، به عنوان زیر شاخهای از هوش مصنوعی که به بررسی، فهم و تولید زبان در سطح هوشی انسانی میپردازد در نظر گرفته شد.
بعد از بررسی نحوه انجام ترجمه صحیح توسط انسانها چنین مشاهده شد که فرد مترجم میبایست به دستور، تکواژشناسی و همچنین قواعد نحوی هر دو زبان آگاهی داشته باشد. مبانی آگاهی از نحو نیز، داشتن دانش معناشناسی، واژگان و همچنین کاربردشناسی شناسایی شدند؛ بنابراین تلاش در جهت تحقق ترجمهٔ ماشینی به شاخهای پیچیده از علوم برای توصیف، نمایش و پردازش ماشینی زبانهای انسانی تبدیل شد.[۴]
موارد کاربرد
در مورد استفاده از آن از جمله میتوان به کاربردهای زیر اشاره کرد:
فرایافت concept و تجزیه زبانهای برنامهنویسی
نوآم چامسکی توانست تشابه زبانهای طبیعی و زبانهای برنامهنویسی را به اثبات برساند. یعنی یک زبان رایانهای مانند زبانهای طبیعی دارای یک دستور زبان و یک فرهنگ میباشد. تفسیر یک متن از تجزیهٔ واژهها lexicon آغاز سپس با تجزیه نحو syntax و در آخر با تجزیه مفهوم semantic آن پایان میابد.
ترجمه ماشینی
مقالهٔ اصلی: ترجمه ماشینی (خودکار)
این شاخه از زبانشناسی رایانهای زمان درازی کماهمیت جلوه میکرد. اما امروزه یکی از موارد مورد علاقه پژوهشگران این رشته میباشد. پس از مرحلهٔ شکافت واژهها و نحو میباید تجزیهٔ مفهوم و سپس پرگماتیک را نیز افزود. در واقع این دو کوشش بر شناخت مفهوم خاص یک واژه در مکانی که ظاهر میشود را دارد.
پرسش و پاسخ با زبانهای طبیعی
این ایده مدتی بهعنوان پاسخی قانعکننده به مسئله ارتباط انسان و ماشین تلقی میشد. این دید در واقع جنبهٔ گستردهتری از دستور زایشی چامسکی است.
صرف محاسباتی
مقالهٔ اصلی: صرف محاسباتی
به مطالعات مربوط به ساختارهای[۵] درونی واژه هاصرف گفته میشود. اغلب دستآوردها و نتایج پژوهشهای صرف محاسباتی در سایه تلاشهای علمی انسان به منظور ایجاد و ساخت سامانه هایپردازش زبانهای طبیعی انسانی فراهم آمدهاست.
پانویسها
- ↑ Hans Uszkoreit. What Is Computational Linguistics? [۱] Department of Computational Linguistics and Phonetics of Saarland University
- ↑ John Hutchins: Retrospect and prospect in computer-based translation. Proceedings of MT Summit VII, 1999, pp. 30–44.
- ↑ Arnold B. Barach: Translating Machine 1975: And the Changes To Come.
- ↑ Natural Language Processing by Liz Liddy, Eduard Hovy, Jimmy Lin, John Prager, Dragomir Radev, Lucy Vanderwende, Ralph Weischedel
- ↑ Structures
منابع
- Crystal D. , The Cambridge Encyclopedia of Language, 2nd edition, Cambridge University Press, 1996. ISBN 0-521-55967-7
- Manning, C. D. , and Schutze, H. , Foundations of Statistical Natural Language Processing, 5th edition, The MIT Press, 2002. ISBN 0-262-13360-1
- Linguistique informatique, Wikipedia
- O'Grady, W. , Dobrovolsky, M. , and aronoff, M. , Contemporary Linguistics, An Introduction, 2nd edition, St. Martin' Press, Inc. , 1993. ISBN 0-312-06780-1
پیوند به بیرون
- منظور از زبانشناسی محاسباتی چیست؟ (انگلیسی)
- انجمن زبانشناسی محاسباتی (انگلیسی)
- مرکز مطالعات زبانها و اطلاعات، مؤسسه تحقیقات عالی پیرامون برخوردهای انسانها با علوم و فناوری، دانشگاه استانفورد (انگلیسی)
- مرجع دادگان زبان فارسی پیکرههای فارسی مورد استفاده در پردازش رایانهای زبان و مطالعات زبانشناختی