پروتکل انتقال ابرمتن

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو

منشور انتقال ابرمتن (به انگلیسی: Hypertext Transfer Protocol) (مخفف انگلیسی: HTTP) یک پروتکل لایهٔ کاربرد (Application Layer) برای سیستم‎های توزیع شده می‎باشد. این پروتکل عمومی علاوه بر استفاده اصلی آن در ابرمتن‎ها در بسیاری از زمینه‎های دیگر کامپیوتری مانند سامانهٔ نام دامنه (DNS) قابل استفاده است. از نسخه اولیه، این پروتکل در وب جهانی استفاده می‎شد و آخرین به‎روز رسانی آن در ماه جون ۱۹۹۹ تحت عنوان «HTTP/1.1» صورت گرفت. [۱]

گسترش این پروتکل بر عهدهٔ نیروی ضربت مهندسی اینترنت (IETF) و کنسرسیوم وب جهان‌شمول (W3C) می‎باشد. این امر در گروه کاری پروتکل انتقال ابرمتن (HTTP Working Group) صورت می‎گرد.

تاریخچه[ویرایش]

تیم برنرز لی، به وجود آورندهٔ وب جهانی

تیم برنرز لی، طراح و پیشنهاد دهنده وب جهانی که اکنون تحت عنوان WWW شناخته می‎شود، برای اولین بار پروتکل انتقال ابرمتن را به همراه ساختار اولیهٔ زبان نشانه گذاری ابرمتن (HTML) در یک وب سرور ساده و یک مرورگر مبتنی بر متن ارائه داد. در این نسخهٔ اولیه تنها روش درخواست (Request Method) موجود GET و تمامی پاسخ ها به زبان HTML بودند.[۲]

اولین نسخهٔ مستند پروتکل انتقال ابرمتن نسخهٔ ۰٫۹ آن بود که در سال ۱۹۹۱ منتشر شد. [۲] دیو راگت، که در سال ۱۹۹۵ گروه کاری پروتکل انتقال ابرمتن (HTTP Working Group) را رهبری می‎کرد، خواستار گسترش این پروتکل شد و نهایتاً نسخه ۱٫۰ تحت عنوان «HTTP/1.0» در سال ۱۹۹۶ به صورت رسمی معرفی شد.[۳][۴]

گروه کاری این پروتکل در ژانویه سال ۱۹۹۷ اولین استاندارد نسخهٔ ۱٫۱ را که در همان زمان توسط بسیاری از مرورگرها پشتیبانی می‎شد[۵]، به صورت رسمی منتشر کرد.[۶] آخرین به‎روز رسانی نسخهٔ ۱٫۱ در جون سال ۱۹۹۹ در درخواست شماره ۲۶۱۶ (RFC 2616) انجام شد.[۱]

ساختار کلی[ویرایش]

پروتکل انتقال ابرمتن یک پروتکل درخواست و پاسخ در مدل کلاینت–سرور می‎باشد. برای مثال یک مرورگر وب می تواند یک کلاینت و نرم‎افزار موجود بر روی سرویس‎دهندهٔ وبسایت، یک سرور باشد. شروع این پروتکل از طرف کلاینت است که با ارسال یک درخواست HTTP به سمت سرور گفت‎وگو را آغاز می‎کند. سرور بر اساس درخواست ارسالی یا منبعی مانند یک فایل را در اختیار کلاینت می‎گذارد و یا عملیات خاصی را انجام می‎دهد. نتیجهٔ این عملِ سرور در بستهٔ پاسخ HTTP برای کلاینت ارسال می‎شود. بستهٔ پاسخ شامل اطلاعات وضعیت و احتمالاً محتویات منبع درخواست شده می‎باشد.

مرورگر وب یک نمونه از عامل کاربر (به انگلیسی: User Agent) است. از دیگر عوامل کاربر می‎توان به خزندهٔ وب، نرم‎افزار های تلفن‎های همراه و نرم‎افزار های دیگری که به وب متصل شده و از اطلاعات آن استفاده و یا صفحه‎ای را نمایش می‎دهند، اشاره کرد.

پروتکل انتقال ابرمتن یک پروتکل لایهٔ کاربرد است که در مجموعه پروتکل اینترنت طراحی شده و مورد استفاده قرار می‌گیرد. این پروتکل با فرض اینکه لایهٔ حمل (Transport Layer) زیرین آن قابل اعتماد است طراحی شده و معمولاً از پروتکل هدایت انتقال (TCP) به عنوان لایهٔ زیرین استفاده می‎کند. با این حال از این پروتکل بر روی لایه‎های غیرقابل اطمینان نیز استفاده می‎شود. مثلا در پروتکل SSDP، پروتکل انتقال ابرمتن بر روی پروتکل داده‎نگار کاربر (یک پروتکل غیر امن) مورد استفاده قرار می‎گیرد.

منابع HTTP همگی با یک شناسانهٔ یکنواخت منبع (URI) یا به طور مشخص‎تر با یک نشانی وب (URL) آدرس‎دهی و مشخص می‎شوند. تمامی این آدرس‎ها با نشانهٔ http یا https آغاز می‎گردد. از این آدرس‎ها در زبان نشانه‌گذاری ابرمتن به صورت گسترده برای انتقال بین صفحات مختلف استفاده می‎گردد و از آن تحت عنوان پیوند یا لینک یاد می‎شود.

نسخهٔ ۱٫۱ این پروتکل برخلاف نسخهٔ ۱٫۰ قابلیت استفاده از یک اتصال (به انگلیسی: Connection) برای چندین درخواست را دارد. مثلا می‎تواند عکس‎ها، فایل‎های اسکریپت و … موجود در یک صفحه را با همان اتصال اولیه دریافت کند. لذا سرعت آن به دلیل حذف شدن برقراری ارتباط مجدد TCP نسبت به نسخهٔ ۱٫۰ افزایش یافته است.

جلسه[ویرایش]

در پروتکل انتقال ابرمتن به دنباله‎ای از درخواست‎ها و پاسخ‎ها جلسه (به انگلیسی: Session) گفته می‎شود. کلاینت با ایجاد یک اتصال هدایت انتقال (TCP) بر روی یک درگاهِ از پیش تعیین شده بر روی سرور ( معمولا درگاه شماره ۸۰؛ فهرست عددهای درگاه تی‌سی‌پی و یودی‌پی )، جلسه را آغاز می‎کند. سرور وب همواره بر روی درگاه در انتظار درخواست‎های کلاینت‎ها می‎باشد. بعد از دریافت درخواست ارسال شده، سرور با ارسال یک خط وضعیت (به انگلیسی: Status Line) و بدنه، پاسخ کلاینت را به او بازمی‎گرداند. بدنه بستهٔ پاسخ معمولاً حاوی منبع درخواست شده است؛ با این حال از آن برای ارسال خطا و اطلاعات دیگر نیز استفاده می‎شود.[۱]

یک نمونه از خط وضعیت در پاسخ به یک درخواست مجاز:

HTTP/1.1 200 OK

روش‎های درخواست[ویرایش]

پروتکل انتقال ابرمتن روش‎هایی را برای درخواست تعریف کرده است (به انگلیسی: Request Method)که هر کدام از آن‎ها باعث انجام عمل خاص در سمت سرور می‎شوند. نسخهٔ ۱٫۰ روش‎های درخواست GET، POST و HEAD را دارا بود.[۷][بخش ۸] در نسخهٔ ۱٫۱ پنج روش جدید افزوده شد[۱][بخش ۹]: OPTIONS، PUT، DELETE، TRACE و CONNECT. از آنجایی که عملکرد این روش‎ها به طور کامل تعریف و شرح داده شده است، لذا تمامی مرورگر ها و سرور ها به راحتی می‎توانند این روش‎ها را پیاده‎سازی و استفاده نمایند. اگر روشی برای سرور تعریف نشده باشد، با آن به عنوان یک روش غیرِامن برخورد خواهد کرد. در تعداد روش‎ها هیچ محدودیتی وجود ندارد. این نکته باعث می‎شود که گسترش احتمالی این پروتکل در آینده به زیرساخت‎ها فعلی آن آسیبی نرساند و آن‎ها را تغییر ندهد. برای مثال در حال حاضر پروتکل WebDAV هفت روش جدید درخواست را تعریف کرده است. [۸]

GET
درخواست نمایش منبعِ درخواست‎داده‎شده را می‎دهد. (این منبع معمولا یک فایل یا پرونده می‎باشد.) این روش فقط اطلاعات را از سرور دریافت می‎کند و نباید هیچ تاثیری بر روی منابع سرور بگذارد.
HEAD
این روش دقیقا مانند روش GET عمل می‎کند با این تفاوت که بدنه پاسخ را نمی‎خواهد. از این روش برای به‎دست‎آوردن فراداده‎های موجود در سرآیند (به انگلیسی: Header) استفاده می‎شود. یکی از استفاده‎های رایج این نوع درخواست، بررسی تغییر یافتن یک منبع است.
POST
در این روش به همراه بستهٔ درخواست اطلاعاتی نیز فرستاده می‎شود. سرور با توجه به نشانی وب (URL) درخواست شده و اطلاعات ارسال شده، منبع مورد نظر را در بستهٔ پاسخ برمی‎گرداند. این اطلاعات ارسالی می‎تواند نامِ‎کاربری و کلمهٔ‎عبور، یک نظر بر روی یک مطلب و یا اطلاعات هر فرم دیگری که توسط کاربر وارد شده است، باشد.[۱][بخش ۹٫۵]
PUT
در این روش منبعی به همراه بستهٔ درخواست ارسال شده و از سرور تقاضا می‎شود که این منبع را در آدرس موجود در بسته بارگذاری کند. اگر در محلِ درخواست شده قبلا منبع دیگری قرار داشته باشد، منبع جدید جایگزین خواهد شد.
DELETE
از سرور درخواست می‎کند که آدرس فرستاده شده را حذف نماید.
TRACE
در این روش سرور اطلاعات ارسال شده را عیناً به کلاینت باز می‎گرداند. (برای بررسی تغییراتی که واسط‎های شبکه بر روی بسته می‎گذارند، از این روش استفاده می‎شود.)
OPTIONS
از سرور تقاضا می‎کند تا روش‎های درخواستِ (به انگلیسی: Request Method) موجود برای نشانی فرستاده شده را اعلام نماید. برای گرفتن تمامی روش‎های درخواست قابل اجرا بر روی سرور می‎توان از نشانی '*' استفاده کرد.
CONNECT
بستهٔ پروتکل ابرمتن را به یک تونل TCP/IP تبدیل می‎کند. این عمل معمولاً برای برقراری ارتباط امن (HTTPS) بر روی یک پراکسی سرور ناامن استفاده می‎شود.[۹]
PATCH
این روش که در سال ۲۰۱۰ به پروتکل افزوده شد، برای ایجاد تغییرات جزیی بر روی منابع استفاده می‎شود.[۸]

سرورهای وب موظف هستند حداقل روش‎های GET و HEAD را پیاده‎سازی نمایند.[۱][بخش ۵٫۱٫۱]

وضعیت جلسه[ویرایش]

پروتکل انتقال ابرمتن یک پروتکل Stateless می‎باشد. بدین معنی که سرور در یک جلسه هیچ ردی از کاربر ذخیره نمی‎کند. به طور مثال، سرور وب هیچگاه نمی تواند به یاد بیاورد که شما در این وبسایت لاگین کرده‎اید یا نه! اما به دلیل نیاز شدید نرم‎افزار های تحت وب به ثبت وضعیت، با استفاده از تکنیک‎ها زیر این عمل انجام می‎گیرد:

  • کوکی
  • استفاده از متغیر های پنهان در فرم‎های وب
  • استفاده از متغیر های موجود در رشتهٔ درخواست. مانند: index.php?session_id=some_unique_id

کدهای وضعیت[ویرایش]

از نسخهٔ ۱٫۰ پروتکل انتقال ابرمتن به بعد، خطِ اولِ پاسخِ سرور تحت عنوان خط وضعیت شناخته شده است. این خط حاوی یک کد عددی (مانند ۴۰۴) که به عنوان کد وضعیت شناخته می‎شود و یک پیام متنی (مانند "یافت نشد" یا "Not Found") که با عنوان علت وضعیت شناخته می‎شود، می‎باشد. نحوهٔ برخورد عامل کاربر با پاسخ، بستگی کامل به کد وضعیت و فیلدهای سرآیند بستهٔ پاسخ دارد. با این حال استفاده از کدهای سفارشی (که در پروتکل اصلی موجود نیستند) نیز بلامانع می‎باشد. زیرا عوامل کاربر در برخورد با کدهای تعریف نشده، از رقم اول عدد آن‎ها برای شناسایی نوع کلی کد استفاده می‎کنند. [۱][بخش ۶٫۱]

کدهای وضعیت پروتکل انتقال ابرمتن به ۵ دستهٔ کلی تقسیم می‎شوند:

  • کدهای 1xx یا اطلاعاتی: این کدها با عدد ۱ آغاز می‎شوند. این گروه، این پیام کلی را مشخص می‎کنند: «درخواست شما دریافت شد، ادامه دهید».
  • کدهای 2xx یا موفقیت: این کدها با عدد ۲ آغاز می‎شوند. یعنی «درخواستِ ارسالی دریافت شده، درک شده، پذیرفته شده و با موفقیت انجام شده است».
  • کدهای 3xx یا تغییر مسیر: این کدها با عدد ۳ آغاز می‎شوند. یعنی «کلاینت برای کامل شدن درخواست نیازمند انجام عملیات اضافی است».
  • کدهای 4xx یا خطای کلاینت: این کدها با عدد ۴ آغاز می‎شوند. این گروه از کدها مشخص می‎کنند که «کلاینت در درخواست خود اشتباه کرده و یا باعث بروز خطا شده است».
  • کدهای 5xx یا خطای سرور: این کدها با عدد ۵ آغاز می‎شوند. با این مفهوم که «سرور در انجام عملیات مربوط به یک بستهٔ درخواستِ ظاهراً صحیح، ناموفق بوده و با خطا مواجه شده است».

علت وضعیت هایی که در متن تعریف پروتکل آمده‎اند پیشنهادی بوده و می‎توانند با متون دیگر، به صلاحِ دید توسعه دهنده، تغییر پیدا کنند. این عبارت می‎تواند توسط عامل کابر به عنوان توضیحات اضافی به کاربر نمایش داده شود.

مثال[ویرایش]

در زیر مثالی از یک جلسه بین یک کلاینت HTTP و یک سرور HTTP که بر روی www.wikipedia.com قرار دارد، ارائه شده است.

درخواست کلاینت[ویرایش]

GET /inex.html HTTP/1.1
Host: www.wikipedia.com

در درخواست کلاینت، خط اول روش، نشانی و نسخهٔ پروتکل استفاده شده در درخواست را مشخص می‎کند. از خط دوم هر خط حاوی یک فیلد سرآیند (به انگلیسی: Header Field) می‎باشد و این فیلدها با یک خط خالی به پایان می‎رسند. پایان هر خط در این پروتکل با ۲ حرف Carriage Return و Line Feed پشتِ‎سرهم مشخص می‎شود. (r\n\)

پاسخ سرور[ویرایش]

HTTP/1.1 200 OK
Date: Mon, 23 May 2005 22:38:34 GMT
Server: Apache/1.3.3.7 (Unix) (Red-Hat/Linux)
Last-Modified: Wed, 08 Jan 2003 23:11:55 GMT
Content-Type: text/html; charset=UTF-8
Content-Length: 131
Connection: close

<html>
<head>
  <title>An Example Page</title>
</head>
<body>
  Hello World, this is a very simple HTML document.
</body>
</html>

در پاسخ سرور، خط اول، که خط وضعیت نامیده می‎شود، یکی از وضعیت‎های تعریف شده در پروتکل را مشخص می‌کند. در اینجا کد وضعیت ۲۰۰ به معنای صحیح و مجاز بودن درخواست می‎باشد. از خط دوم، هر خط حاوی یک فیلد سرآیند (به انگلیسی: Header Field) پاسخ است. این فیلدها با یک خط خالی به پایان می‎رسند. پایان هر خط نیز مانند بستهٔ درخواست با ۲ حرف Carriage Return و Line Feed پشتِ‎سرِهم مشخص می‎شود. بعد از یک خط خالی (که به معنای پایان فیلدهای سرآیند است)، بدنه پاسخ آغاز می‎شود. طول بدنهٔ پاسخ معمولاً در فیلد سرآیند Content-Length توسط سرور مشخص می‎شود. در صورتی که این فیلد مشخص نشود، اطلاعات ارسالی تا بسته شدن کامل ارتباط، بدنهٔ پاسخ محسوب خواهند شد.

جستارهای وابسته[ویرایش]

پروتکل انتقال ابرمتن
اتصال پایا · فشرده‎سازی · نسخهٔ امن (HTTPS)
فیلدهای سرآیند
برچسب موجودیت · کوکی · ارجاع دهنده · مسیر
کدهای وضعیت
۳۰۱ منتقل شده‌است
۳۰۲ یافت شد
۳۰۳ مراجعه کنید به
۴۰۳ دسترسی ممنوع
۴۰۴ یافت نشد

منابع[ویرایش]

پانویس[ویرایش]