فراوانی وزنی تی‌اف-آی‌دی‌اف

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو

فراوانی وزنی تی‌اف-آی‌دی‌اف (به انگلیسی: tf–idf weight)‏ مخفف فراوانی - عکس فراوانی سند است. در این شیوه به لغات یک وزن بر اساس فراوانی آن در سند داده می شود. در واقع این سیستم وزن دهی نشان می دهد چقدر یک کلمه برای یک سند (مدرک) مهم است. این مساله کاربردهای بسیاری در بازیابی اطلاعات دارد. وزن کلمه با افزایش تعداد تکرار آن در متن افزایش می یابد، اما توسط تعداد کلمات در متن کنترل می شود، چرا که می دانیم در صورت زیاد بودن طول متن، بعضی از کلمات به طول طبیعی بیشتر از دیگران تکرار خواهند شد، اگرچه چندان اهمیتی در معنی نداشته باشند.

منابع[ویرایش]

http://en.wikipedia.org/wiki/Tf%E2%80%93idf