خزنده وب

از ویکی‌پدیا، دانشنامهٔ آزاد

نسخه‌ای که می‌بینید نسخه‌ای قدیمی از صفحه است که توسط مصطفی کوهستانی (بحث | مشارکت‌ها) در تاریخ ‏۱۷ مهٔ ۲۰۲۱، ساعت ۲۲:۰۵ ویرایش شده است. این نسخه ممکن است تفاوت‌های عمده‌ای با نسخهٔ فعلی داشته باشد.

خزندهٔ وب، (انگلیسی: Web Crawler)[۱] یک برنامه رایانه‌ای است که توانایی مرور و ثبت اطلاعات را از وب‌سایت‌ها به صورت خودکار دارد. «خزندهٔ وب» به چندین شکل مختلف تعریف می‌شود که برخی از آنان:

  • عنکبوت‌های وب (انگلیسی: Web Spider)
  • فهرست سازان خودکار (انگلیسی: Automatic Indexers)
  • ربات‌های نرم‌افزاری خودکار (انگلیسی: Web Robots)
  • نرم‌افزارهای FOAF.[۲]
  • ...

را شامل می‌شود.

دلایل استفاده

به عنوان مثال موتورهای جستجوگر با بهره‌گیری از این گونه نرم‌افزارها به صورت خودکار صفحات مختلف وب سایت‌ها را ثبت، آنالیز و رده‌بندی می‌کند.

نمونه‌ها

نمونه‌های متن‌باز

  • Frontena
  • GNU Wget
  • GRUB
  • Heritrix
  • ht://Dig
  • HTTrack
  • mnoGoSearch
  • news-please
  • Apache Nutch
  • Open Search Server
  • PHP-Crawler
  • Scrapy
  • Seeks
  • Sphinx
  • StormCrawler
  • Xapian
  • YaCy
  • Octoparse

منابع