ایست‌واژه

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به ناوبری پرش به جستجو

کلمات توقف یا کلمات بازدارنده یا کلمات ممنوعه یا استاپ‌وورد (انگلیسی: Stop words) کلماتی هستند که قبل یا بعد از پردازش داده‌های زبان طبیعی فیلتر می‌شوند. با وجودی که کلمات توقف به معمول‌ترین کلمات در یک زبان اشاره دارد، هیچ فهرست جامع از آنها برای استفاده در تمام ابزارهای پردازش زبان طبیعی وجود ندارد. در واقع همه ابزارها از چنین فهرستی استفاده نمی‌کنند.

برخی از ابزارهای پردازش زبان برای پشتیبانی از جستجوی عبارت، به‌طور خاص از حذف این کلمات اجتناب می‌کنند.

هر گروه از کلمات را می‌توان به عنوان کلمه توقف برای یک هدف مشخص انتخاب کرد. برای برخی از موتورهای جستجو، این کلمات برخی از رایج‌ترین و معمول‌ترین کلمات هستند، مثل این، آن، در، به، و غیره.

گاهی جستجوی عباراتی که شامل کلمات توقف باشد، مانند «در به درها»، به دلیل حذف کلمات توقف با مشکل مواجه می‌شوند.

تعدادی از موتورهای جستجو برخی از معمول‌ترین کلمات که شامل واژگانی مانند «خواستن» هستند را برای بهبود عملکرد از پرس و جو حذف می‌کنند.

در فرهنگ اصطلاحات بهینه‌سازی موتور جستجو، به رایج‌ترین کلماتی که اغلب موتورهای جستجو از آن اجتناب می‌کنند کلمه توقف گفته می‌شود که برای صرفه‌جویی در فضا و زمان پردازش داده‌های بزرگ در حین خزیدن یا شاخص‌گذاری کاربرد دارند. حذف این کلمات به موتورهای جستجو کمک می‌کند تا در حافظهٔ پایگاه‌های اطلاعاتی‌شان صرفه‌جویی کنند.

جستارهای وابسته[ویرایش]

پیوند به بیرون[ویرایش]

منابع[ویرایش]