پیکره متنی

از ویکی‌پدیا، دانشنامهٔ آزاد
(تغییرمسیر از مجموعه متن)
پرش به: ناوبری، جستجو

در زبان‌شناسی پیکره‌ای، پیکرهٔ متنی یا پیکرهٔ واژگانی (به‌اختصار: پیکره) (به انگلیسی: text corpus, corpus) به مجموعه‌ای خام از داده‌های زبانیِ نوشتاری یا گفتاری گفته می‌شود که می‌توان در توصیف و تحلیل زبان از آن بهره گرفت، از جمله در ارزیابی‌ها و تحلیل‌های آماریِ زبان‌شناختی و نیز در فرهنگ‌نویسی، دستورنویسی، گویش‌شناسی و جز آنها.[۱]

روش‌های فراهم ساختن پیکره[ویرایش]

در گذشته، فراهم ساختن پیکره‌های زبانی برای تألیف فرهنگ بسیار وقت‌گیر، پرزحمت و پرهزینه بود، مثلاً زنده‌یاد دهخدا برای تألیف لغت‌نامه سالیان درازی متون منظوم و منثور زبان فارسی را سطر به سطر خواند و برگه‌های انبوهی حاوی واژه‌ها، شواهد و ارجاعات آنها فراهم آورد. مجموعۀ داده‌های زبانی‌ای که دهخدا به روش سنتیِ برگه‌نویسی فراهم آورد، به‌لحاظ حجم، به‌ویژه درمورد متون کهن زبان فارسی، در آن زمان و حتی تا زمانۀ ما بی‌نظیر بوده و هست. امروزه، پیشرفت‌های شگرف بشر در زمینۀ فناوری اطلاعات، به‌ویژه رایانه، استفاده از این ابزار را برای گردآوری داده‌های زبانی و تألیف فرهنگ‌های مختلف براساس این داده‌ها ناگزیر می‌سازد. چنان‌که در کشورهای پیشرفته، روش سنتی گردآوری داده‌ها به‌کلی متروک شده و فرهنگ‌های گوناگونی، ازجمله کوبیلد (Cobuild)، فرهنگ بیست‌جلدی آکسفُرد و جز آنها براساس پیکره‌های زبانی رایانه‌ای تألیف یا تکمیل می‌گردند.[۲]


پانویس[ویرایش]

  1. صادقی، علی‌اشرف. فرهنگ جامع زبان فارسی، جلد آ. ۱۳۹۲. راهنمای استفاده از فرهنگ، صفحهٔ ۱۰. 
  2. صادقی، علی‌اشرف. فرهنگ جامع زبان فارسی، جلد آ. ۱۳۹۲. راهنمای استفاده از فرهنگ، صفحهٔ ۹.


جستارهای وابسته[ویرایش]


منبع[ویرایش]

صادقی، علی‌اشرف. فرهنگ جامع زبان فارسی. ج. آ. تهران: فرهنگستان زبان و ادب فارسی، ۱۳۹۲. شابک ‎۹۷۸–۶۰۰-۶۱۴۳–۳۷-۸. 


پانویس[ویرایش]