گنو دبلیوگت

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو
Wget
Wget-screenshot.png
نمایی از Wget در لینوکس
نوشته شده به C
سیستم‌عامل چندسکویی
پروانه نرم‌افزار آزاد (جی‌پی‌ال)
وب‌گاه http://www.gnu.org/software/wget

GNU Wget ( یا فقط Wget ) برنامه‌ای رایانه‌ای است برای دریافت محتویات از کارسازهای وب و بخشی از پروژه‌ی گنو است. نام این نرم‌افزار از World Wide Web و get مشتق شده است که به کار اصلی این برنامه اشاره دارد. این برنامه از دانلود توسط پروتکلهای HTTP، HTTPS و FTP که پروتکل‌های متداولی در شبکه‌های مبتنی بر TCP/IP هستند پشتیبانی می‌کند.

ویژگی‌های این نرم‌افزار دانلود بازگشتی (تودرتو)، تبدیل پیوندها برای مشاهده‌ی آفلاین پرونده‌های HTML، پشتیبانی از پراکسی و خیلی امکانات دیگر است.

Wget با زبان قابل حمل C نوشته شده است و براحتی در سیستم‌های شبه یونیکس نصب می‌شود و برای محیط‌های کاری مختلفی همچون مک اواس، مایکروسافت ویندوز پورت شده است.

برای Wget پوسته‌های گرافیکی‌ای همچون gwget برای میزکار گنوم و KGet که مختص میزکار کی‌دی‌ای است ساخته شده است.

Wget نرم‌افزار آزاد است[ویرایش]

ویژگیها[ویرایش]

هوشمندی[ویرایش]

Wget عملکرد هوشمندانه‌ای در شبکه‌هایی که سرعت پایینی دارند یا ناپایدارند دارد. اگر بدلیل مشکل شبکه، دریافت بطور کامل به اتمام نرسد، Wget بطور اتوماتیک دریافت فایل را از جایی که ارتباط قطع شده بود ادامه می‌دهد و تا جایی که فایل بطور کامل دریافت شود این عمل را تکرار می‌کند. Wget از اولین کلاینتهایی است که از هیدر Range در پروتکل HTTP استفاده می‌کند.

دانلود بازگشتی[ویرایش]

Wget می‌تواند مانند یک خزنده‌ی وب عمل کند و با استخراج منابعی که پیوندهای آنان در صفحات اچ‌تی‌ام‌ال موجود است آنان را بصورت متوالی دانلود کند و اینکار را تا زمانی که تمام صفحات دانلود شوند یا به عمق نفوذی که کاربر تعیین کرده است برسد انجام می‌دهد. صفحات دانلود شده در دایرکتوریهایی همانند سرور راه دور ذخیره می‌شوند. این نوع دانلود بازگشتی این امکان را می‌دهد که بتوان توسط پروتکل HTTP یک وب‌گاه را Mirror کرد. همچنین Wget این قابلیت را دارد که پیوندهای موجود در صفحات HTML را برای مرور آفلاین آنها تنظیم کند. هنگامی که از این روش برای Mirror کردن وب‌گاهها استفاده می‌شود، Wget از استاندارد استاندارد ممانعت رباتها پیروی می‌کند (مگر اینکه خود شما صراحتاً این حالت را غیر فعال کنید e robots=off- )

دانلود بازگشتی برای پروتکل FTP نیز بخوبی کار می‌کند. بطوریکه Wget از فرمان LIST برای پیدا کردن فایلهایی که باید دانلود شوند استفاده می‌کند و اینکار را برای تمام دایرکتوریهای موجود در زیر دایرکتوری اصلی که در URL تعیین شده است انجام می‌دهد.

وقتی که از امکان دانلود بازگشتی استفاده شود، Wget می‌تواند با بازرسی اختلاف زمانی فایلهای محلی و راه دور، فقط فایلهایی را از سرور دریافت کند که جدیدتر از نسخه‌ی محلی هستند. اما این قابلیت Wget مستعد اشتباه است و قابل مقایسه با نرم‌افزارهایی که اختصاصاً برای پشتیبان‌گیری ساخته شده‌اند نیست. ( مانند rsync )

عملکرد بدون تعامل[ویرایش]

Wget می‌تواند بدون تعامل داشتن با کاربر و یا چاپ وضعیت خود در یک دستگاه خروجی به کار خود ادامه دهد و می‌تواند وضعیت عملکرد خود را در فایل جداگانه‌ای ذخیره نماید. این قابلیت به کاربر این امکان را میدهد که Wget را اجرا کند و سپس از سیستم خارج (Logout) شود. در مقابل اکثر مرورگرهای گرافیکی یا متنی صفحات وب که نیاز دارند کاربر وارد سیستم بماند و در صورت بروز خطا در دریافت فایلها بصورت دستی آنها را از اول بکار بیندازد.

قابل حمل[ویرایش]

Wget بزبان قابل حمل C نوشته شده است و نیاز آن به کتابخانه‌های پیش‌نیاز به حداقل رسانده شده است. مانند یک برنامه‌ی تحت یونیکس از خط فرمان فراخوانده می‌شود و به تعدادی از محیط‌های شبه‌یونیکس پورت شده است، از جلمه مایکروسافت ویندوز بواسطه‌ی Cygwin و Mac OS X .

ویژگیهای دیگر[ویرایش]

  • پشتیبانی از دانلود توسط پروکسی
  • پشتیباتی از IPv۶
  • پشتیبانی از امنیت لایه انتقال برای دانلود رمزگزاری شده توسط کتابخانه‌ی اپن‌اس‌اس‌ال
  • سرعت دانلود قابل تنظیم است. این امکان برای زمانی که مایل باشیم Wget تمام پهنای باند را به خود اختصاص ندهد مورد استفاده قرار می‌گیرد.
  • امکان استفاده از عبارات منظم

طرز استفاده[ویرایش]

استفاده معمولی[ویرایش]

بطور ساده GNU Wget توسط واسط خط فرمان و با دادن یک URL به آن قابل استفاده است:

# Download the title page of example.com to a file
# named "index.html".
wget http://www.example.com/
# Download Wget's source code from the GNU ftp site.
wget ftp://ftp.gnu.org/pub/gnu/wget/wget-latest.tar.gz

همچنین می‌توان Wget را برای دانلود فرمتهای خاصی از ساختار دایرکتوری یک وبسایت استفاده کرد :

# Download *.gif from a website
# (globbing, like "wget http://www.server.com/dir/*.gif", only works with ftp)
wget -e robots=off -r -l1 --no-parent -A.gif http://www.server.com/dir/

دانلود صفحه‌ی اول یک وبسایت بهمراه تمام نیازمندیهای آن مانند تصاویر و فایلهای Style Sheet و تبدیل لینکهای آن برای مشاهده‌ی آفلاین :

# Download the title page of example.com, along with
# the images and style sheets needed to display the page, and convert the
# URLs inside it to refer to locally available content.
wget -p -k http://www.example.com/

دانلود کامل یک وبسایت :

# Download the entire contents of example.com
wget -r -l 0 http://www.example.com/

پیوند به بیرون[ویرایش]