نمایه‌سازی در موتورهای جستجو

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو

نمایه‌سازی در موتورهای جستجو (به انگلیسی: Search engine indexing) به مرحله‌ای گفته می‌شود که ربات‌ها وب‌سایت‌ها را توسط آن شناسائی می‌کنند.

به طور کلی، همهٔ موتورهای جستجوگر، فرایند جستجو و بازیابی اطلاعات را از طریق برقراری ارتباط میان سه جزء اصلی تشکیل دهندهٔ خود یعنی ربات‌ها، پایگاه اطلاعاتی و نرم‌افزار بازیابی اطلاعات انجام می‌دهند. مهم ترین مراحل این فرایند عبارت است از:

  • شناسایی و نمایه سازی اطلاعات صفحات یا سایت‌های وب توسط روبات ها؛
  • انتقال و درج اطلاعات گرداوری شده در پایگاه اطلاعاتی موتور کاوش؛
  • جستجوی اطلاعات در پایگاه اطلاعاتی از طریق نرم‌افزار بازیابی اطلاعات؛
  • بازیابی، رتبه بندی و نمایش اطلاعات مبتنی بر اطلاعات موجود در پایگاه اطلاعاتی.

معیارهای انتخاب سایت‌ها برای نمایه سازی[ویرایش]

  • سایت‌های دارای داده‌های ارزشمند با صفحات زیاد؛
  • سایت‌هایی که دارای بازدید کنندگان زیادی می‌باشند؛
  • سایت‌های در حال توسعه که در حال اضافه کردن اطلاعات جدید و ارزشمند می‌باشند.[۱]

راهنماهای موضوعی[ویرایش]

راهنماهای موضوعی وب، پایگاه‌هایی هستند که اطلاعات صفحات یا سایت‌های وب منتخب را توسط نیروی انسانی در پایگاه خود نمایه می‌کنند. در راهنماهای موضوعی وب، فرایند شناسایی، بررسی، تجزیه تحلیل، ارزیابی و نمایه سازی صفحات یا سایت‌های وب توسط نیروی انسانی و بر اساس معیارهای از پیش تهیه شده انجام می‌شود. از آنجایی که فرایند نمایه سازی و تجزیه و تحلیل صفحات وب توسط نیروی انسانی متخصص انجام می‌گیرد، اطلاعات نمایه شده در پایگاه راهنمای موضوعی وب از کیفیت بالاتری نسبت به موتورهای کاوش برخوردار است. علاوه بر این، رویکرد نمایه سازی انسانی در راهنماهای وب، سبب شده است که آنها نسبت به موتورهای کاوش که فرایند گرداوری اطلاعات در آنها به صورت خودکار و ماشینی صورت می‌گیرد، از ریزش کاذب بسیار کمتری برخوردار باشند.

ابر موتورهای کاوش[ویرایش]

بر خلاف موتورهای کاوش و راهنماهای منفرد، ابر موتورهای کاوش خود پایگاه اطلاعاتی ندارند و به جمع آوری و جستجوی صفحات وب از طریق روبات‌ها نمی‌پردازند. کاری که ابر موتورهای کاوش می‌کنند، فرستادن همزمان واژه (های) حستحو به پایگاه چند موتور کاوش یا راهنمای منفرد در شبکه جهانی وب است. به طور مثال از طریق ابر موتور کاوش متاکراولر، می‌توان از طریق واسط جستحوی واحد، به طور همزمان در پایگاه ۱۳ موتور کاوش منفرد به جستجو پرداخت. در بیانی کلی می‌توان گفت که در حوزه فناوری ذخیره و بازیابی اطلاعات در وب رویکردهای نمایه سازی متفاوتی وجود دارد از جمله نمایه سازی محتوا محوری (بر مبنای کلید واژه‌های متن)، استناد محوری (مبتنی بر تحلیل پیوندها)، معنا محوری (توجه به مفاهیم انتزاعی). هر کدام از این رویکردها مزایا و معایبی دارند که توجه به آنها در جامعیت و مانعیت اطلاعات تاثیر گذار است.[۲]

استفاده از اصطلاحنامه در نمایه سازی[ویرایش]

هدف اصلی اصطلاحنامه کمک به بازیابی اطلاعات و همچنین فراهم کردن امکان تولید فهرست‌های کلید واژه‌ای است. تهیه کنندگان پایگاه‌های اطلاعاتی از اصطلاحنامه در چکیده نویسی و نمایه سازی رایانه‌ای و کاربران نیز برای بازیابی اطلاعات استفاده می‌کنند، و به این وسیله با ایجاد درکی مشترک از اصطلاح‌های حوزه‌های مختلف به افزایش ربط در بازیابی یاری می رسانند. اصطلاحنامه با ایجاد رابطه میان اصطلاح‌های مرجح و نامرجح و مدخل قرار دادن اصطلاح مرجح و تدوین نظام ارجاع‌ها و هدایت جستجوگر از واژگان نامرجح به مرجح، امکان بازیابی مدارک را به وجود می‌آورد.[۳]

منابع[ویرایش]

  1. هنینگر، مورین؛ مترجم: نوروزی چاکلی، عبدالرضا. ” چه عواملی یک نمایه وب مناسب به وجود می‌آورند؟”. پیام کتابخانه. سال دوازدهم، شماره سوم و چهارم.
  2. کاظم‌پور، زهرا(1388). مقدمه‌ای بر نمایه سازی و چکیده نویسی. تهران: چاپار.
  3. نوروزی چاکلی، عبدالرضا(1383). ” تاثیر کاربرد اصطلاحنامه بر افزایش ربط در نظام‌های اطلاعاتی”. مجله اطلاع شناسی. سال دوم، شماره 1.