زبان‌شناسی پیکره‌ای

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو

زبان‌شناسی پیکره‌ای (به انگلیسی: corpus linguistics) شاخه‌ای از زبان‌شناسی است که در آن ازطریق ایجاد پایگاه‌های داده‌ایِ گسترده‌ای از متون و واژگان رایجِ یک زبان و بررسی این متون به مطالعهٔ جنبه‌های گوناگون آن زبان می‌پردازد.[۱]

این شاخه تنها در آخرین دهه‌های قرن بیستم ایجاد شد و در همین زمان کوتاه تبدیل به یکی از فعال‌ترین و پرکاربردترین زمینه‌ها شده‌است.[۲]

پیکرهٔ زبانی عبارت است از مجموعه‌ای از متن‌های نوشتاری یا گفتاری که می‌توان در توصیف و تحلیل زبان از آن بهره گرفت. پیکره ممکن است به‌شکل برگه‌های یادداشت یا پرونده‌های رایانه‌ای شامل متن‌های کامل یا گزیده‌هایی از آنها، و یا بخش‌های پیوسته‌ای از متون یا گزیده‌ای از نقل‌قول‌ها و نکات و حتی فهرست‌های واژگانی باشد.[۳]

برای گویاتر شدن پیکره و کاربردهای خاص، کدهای متفاوتی به آن افزوده می‌شود. این نشانه‌گذاری ازیک‌سو می‌تواند برای ارتباط دادن بخش‌های یک پیکره به ساختار کلی آن باشد، مانند شمارهٔ سطر، صفحه، فصل و مانند اینها، و یا بافت زبانی را مشخص كند، مانند شرایط تولید زبانی، گونهٔ زبانی، رسانه و مانند آن. ازسوی‌دیگر، نشانه‌گذاری می‌تواند صرفاً زبانی باشد.[۴]

برنامه‌های پایشگری زبان برای پی‌گیری و ردگیری تحولات زبانی نیز از امکانات پیکره‌های زبانی سود می‌برند. این‌گونه پیکره‌ها را "پیکرهٔ پویا" یا "پیکرهٔ پایشگر" می‌نامند.[۵]

منابع[ویرایش]

  1. مجموعهٔ واژه‌های مصوّب فرهنگستان زبان و ادب فارسی تا پایان سال ۱۳۸۹.
  2. عاصی، مصطفی: از پیکرهٔ زبانی تا زبان‌شناسی پیکره‌ای، در نشریهٔ «پژوهشگران»، مرداد و شهریور ـ مهر و آبان ۱۳۸۵، شمارهٔ ۸ و ۹.
  3. عاصی، مصطفی: از پیکرهٔ زبانی تا زبان‌شناسی پیکره‌ای، در نشریهٔ «پژوهشگران»، مرداد و شهریور ـ مهر و آبان ۱۳۸۵، شمارهٔ ۸ و ۹.
  4. عاصی، مصطفی: زبان‌شناسیِ پیکره‌ای؛ پردازش دستوریِ زبان فارسی با رایانه، ۱۶ فوریهٔ ۲۰۱۱.
  5. عاصی، مصطفی: زبان‌شناسیِ پیکره‌ای؛ پردازش دستوری زبان فارسی با رایانه، ۱۶ فوریهٔ ۲۰۱۱.