پیکره متنی

از ویکی‌پدیا، دانشنامهٔ آزاد
(تغییرمسیر از مجموعه متن)
پرش به: ناوبری، جستجو

در زبان‌شناسی پیکره‌ای، پیکرهٔ متنی یا پیکرهٔ واژگانی (به‌اختصار: پیکره) (به انگلیسی: text corpus, corpus) به مجموعه‌ای خام از داده‌های زبانیِ نوشتاری یا گفتاری گفته می‌شود که می‌توان در توصیف و تحلیل زبان از آن بهره گرفت، از جمله در ارزیابی‌ها و تحلیل‌های آماریِ زبان‌شناختی و نیز در فرهنگ‌نویسی، دستورنویسی، گویش‌شناسی و جز آنها.[۱]

روش‌های فراهم ساختن پیکره[ویرایش]

در گذشته، فراهم ساختن پیکره‌های زبانی برای تألیف فرهنگ بسیار وقت‌گیر، پرزحمت و پرهزینه بود، مثلاً زنده‌یاد دهخدا برای تألیف لغت‌نامه سالیان درازی متون منظوم و منثور زبان فارسی را سطربه‌سطر خواند و برگه‌های انبوهی حاوی واژه‌ها، شواهد و ارجاعات آنها فراهم آورد. مجموعهٔ داده‌های زبانی‌ای که دهخدا به روش سنتیِ برگه‌نویسی فراهم آورد، به‌لحاظ حجم، به‌ویژه درمورد متون کهن زبان فارسی، در آن زمان و حتی تا زمانهٔ ما، بی‌نظیر بوده و هست. امروزه، پیشرفت‌های شگرف بشر در زمینهٔ فناوری اطلاعات، به‌ویژه رایانه، استفاده از این ابزار را برای گردآوری داده‌های زبانی و تألیف فرهنگ‌های مختلف براساس این داده‌ها ناگزیر می‌سازد. چنان‌که در کشورهای پیشرفته، روش سنتی گردآوری داده‌ها به‌کلی متروک شده و فرهنگ‌های گوناگونی، ازجمله کوبیلد (Cobuild)، فرهنگ بیست‌جلدی آکسفُرد و جز آنها براساس پیکره‌های زبانی رایانه‌ای تألیف یا تکمیل می‌گردند.[۲]

جستارهای وابسته[ویرایش]

پانویس[ویرایش]

  1. صادقی، علی‌اشرف. فرهنگ جامع زبان فارسی، جلد آ. ۱۳۹۲. راهنمای استفاده از فرهنگ، ص ۱۰. 
  2. صادقی، علی‌اشرف. فرهنگ جامع زبان فارسی، جلد آ. ۱۳۹۲. راهنمای استفاده از فرهنگ، ص ۹.

منابع[ویرایش]

صادقی، علی‌اشرف. فرهنگ جامع زبان فارسی. ج. آ. تهران: فرهنگستان زبان و ادب فارسی، ۱۳۹۲. شابک ‎۹۷۸–۶۰۰–۶۱۴۳–۳۷–۸. 

پانویس[ویرایش]