مجموعه متن

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو

در زبان‌شناسی؛ مجموعه متن (به انگلیسی: corpus) به مجموعه همه متون حقیقی و مجازی موجود در یک زبان و یا یک موضوع گفته می‌شود. مجموعه متن به منظور ارزیابی‌ها و آنالیزهای آماری زبان‌شناسی و همچنین آزمون فرض آماری یک زبان مورد استفاده قرار می‌گیرد. مجموعه متن برای تصحیح و ویرایش قوانین و معتبرسازی دستور زبان در یک حیطه خاص به کار برده می‌شود. مثلا" می‌گوییم مجموعه متن آثار فلان نویسنده دارای ۱۲۰۰ عدد واژه عشق است.

جستارهای وابسته[ویرایش]

منابع[ویرایش]