مجموعه متن

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو

در زبان‌شناسی، "مجموعه متن" یا "پیکرهٔ متنی" (پیکره) (به انگلیسی: corpus) به مجموعهٔ همهٔ متون حقیقی و مجازیِ موجود در یک زبان و یا یک موضوع گفته می‌شود. مجموعه متن (پیکرهٔ متنی یا پیکره) به‌منظور ارزیابی‌ها و تحلیل‌های آماریِ زبان‌شناختی و همچنین آزمون فرض آماریِ یک زبان مورد استفاده قرار می‌گیرد. مجموعه متن (پیکرهٔ متنی یا پیکره) برای تصحیح و ویرایش قوانین و معتبرسازی دستور زبان در یک حیطهٔ خاص به‌کار برده می‌شود. مثلاً می‌گوییم مجموعه متن (پیکرهٔ متنی یا پیکرهٔ) آثار فلان نویسنده دارای ۱۲۰۰ عدد (دفعاتِ تکرار) واژهٔ "عشق" است.

جستارهای وابسته[ویرایش]

منابع[ویرایش]