پردازش زبانهای طبیعی
از ویکیپدیا، دانشنامهٔ آزاد
پردازش زبانهای طبیعی یکی از زیرشاخههای بااهمیت در حوزه گسترده هوش مصنوعی، و نیز در دانش زبانشناسی است. تلاش عمده در این زمینه ماشینی کردن فرایند درک و برداشت مفاهیم بیان گردیده با یک زبان طبیعی انسانیست. به تعریف دقیقتر پردازش زبانهای طبیعی عبارت است از استفاده از رایانه برای پردازش زبان گفتاری و نوشتاری. با استفاده از آن میتوان به ترجمه زبانها پرداخت، از صفحات وب و بانکهای اطلاعاتی نوشتاری جهت پاسخ دادن به پرسشها استفاده کرد، یا با دستگاهها مثلاً برای مشورت گرفتن به گفتگو پرداخت. [۱]
اینها تنها مثالهایی از کاربردهای متنوع پردازش زبانهای طبیعی هستند. گفتنیست هنوز سیستم کارآمدی برای پردازش زبانهای طبیعی به وجود نیامدهاست.[نیازمند منبع]
فهرست مندرجات |
[ویرایش] محدودیتها
پردازش زبانهای طبیعی رهیافت بسیار جذابی برای ارتباط بین انسان و ماشین محسوب میشود و در صورت عملی شدنش به طور کامل میتواند تحولات شگفتانگیزی را در پی داشتهباشد. سیستمهای قدیمی محدودی مانند SHRDLU که با واژههای محدود و مشخصی سر و کار داشتند، بسیار عالی عمل میکردند، به طوری که پژوهشگران را به شدت نسبت به این حوزه امیدوار کردهبودند. اما در روبهرویی با چالشهای جدیتر زبانی و پیچیدگیها و ابهامهای زبانها، این امیدها کمرنگ شدند. مسئلهٔ پردازش زبانهای طبیعی معمولاً یک مسئلهٔ AI-Complete محسوب میشود، چرا که محقق شدن آن به طور کامل مستلزم سطح بالایی از درک جهان خارج و حالات انسان برای ماشین است.
[ویرایش] موانع اساسی
- نیاز به درک معانی: رایانه برای آن که بتواند برداشت درستی از جملهای داشته باشد و اطلاعات نهفته در آن جمله را درک کند، گاهی لازم است که برداشتی از معنای کلمات موجود در جمله داشته باشد و تنها آشنایی با دستور زبان کافی نباشد. مثلاً جمله حسن سیب را نخورد برای این که کال بود. و جمله حسن سیب را نخورد برای این که سیر بود. ساختار دستوری کاملاً یکسانی دارند و تشخیص این که کلمات کال و سیر به حسن برمیگردند یا به سیب بدون داشتن اطلاعات قبلی درباره ماهیت حسن و سیب ممکن نیست.
- دقیق نبودن دستور زبانها: دستور هیچ زبانی آنقدر دقیق نیست که با استفاده از قواعد دستوری همیشه بتوان به نقش هر یک از اجزای جملههای آن زبان پی برد. برای مثال در جمله کوتاه باز روی زمین نشست. نمیتوان تشخیص داد که باز قید جمله به معنای دوباره است یا این که فاعل جمله به معنای نوعی پرنده شکاری است.
[ویرایش] پردازش زبانهای طبیعی آمارگرا
پردازش زبانهای طبیعی به شکل آمارگرا عبارت است از استفاده از روشهای تصادفی، احتمالاتی و آماری برای حل مسائلی مانند آنچه که در بالا ذکر شده. به خصوص از این روشها برای حل مسائلی استفاده میکنند که ناشی از طولانی بودن جملات و زیاد بودن تعداد حالات ممکن برای نقش کلمات هستند. این روشها معمولاً مبتنی بر نمونههای متنی و مدلهای مارکف هستند.
[ویرایش] کارکردهای مهم پردازش زبانهای طبیعی
- خلاصهسازی خودکار
- استخراج اطلاعات
- بازیابی اطلاعات
- ترجمه ماشینی
- تشخیص نوری نویسهها
- تشخیص گفتار
- ویرایش
[ویرایش] تاریخچه
نخستین تلاشها برای ترجمه توسط رایانه ناموفق بودند، به طوری که ناامیدی بنگاههای تأمین بودجهٔ پژوهش از این حوزه را نیز در پی داشتند. پس از اولین تلاشها آشکار شد که پیچیدگی زبان بسیار بیشتر از چیزیست که پژوهشگران در ابتدا پنداشتهبودند. بیگمان حوزهای که پس از آن برای استعانت مورد توجه قرار گرفت زبانشناسی بود. اما در آن دوران نظریهٔ زبانشناسی وجود نداشت که بتواند کمک شایانی به پردازش زبانها بکند. در سال ۱۹۵۷ کتاب ساختارهای نحوی اثر نوام چامسکی زبانشناس جوان آمریکایی که از آن پس به شناختهشدهترین چهرهٔ زبانشناسی نظری تبدیل شد به چاپ رسید.[۲]از آن پس پردازش زبان با حرکتهای تازهای دنبال شد اما هرگز قادر به حل کلی مسئله نشد.
[ویرایش] پانویس
[ویرایش] پیوندهای بیرونی
- مرکز مطالعات زبان و اطلاعات، استانفورد
- تهیه بانک پرحجم واژگان برای کاربرد در نظامهای متن سازی و سازه یابی و بازیابی اطلاعات، ترجمه: سید مهدی سمائی، مرکز اطلاعات و مدارک علمی ایران
[ویرایش] منابع
-
Crystal D., The Cambridge Encyclopedia of Language, ۲nd edition, Cambridge University Press, ۱۹۹۶. ISBN: ۰-۵۲۱-۵۵۹۶۷-۷
-
Manning, C. D., and Schutze, H., Foundations of Statistical Natural Language Processing, ۵th edition, The MIT Press, ۲۰۰۲. ISBN: ۰-۲۶۲-۱۳۳۶۰-۱
[ویرایش] جستارهای وابسته

