تابع لجستیک

از ویکی‌پدیا، دانشنامهٔ آزاد
تابع سیگمویید لُجستیک استاندارد که در آن

یک تابع لُجستیک (به انگلیسی: logistic function) یا منحنی لُجستیک، یک منحنی معمول Sشکل (منحنی سیگموئید) با معادله زیر است:

که در آن

  • ، مقدار برای نقطه میانه سیگموید است.
  • ، مقدار ماکزیمم منحنی است.
  • ، نرخ رشد لُجستیک یا شیب منحنی است.[۱]

برای مقادیر x در دامنه اعداد حقیقی، از تا ، منحنی S نشان‌داده شده در چپ به دست می‌آید، که در آن گراف موقعی که به نزدیک می‌شود، به نزدیک می‌شود، و موقعی که به نزدیک می‌شود، به صفر نزدیک می‌شود.

تابع لُجستیک کاربردهایی در زمینه‌های مختلف دارد که شامل زیست‌شناسی (مخصوصا بوم‌شناسیزیست‌شناسی ریاضیاتی، شیمی، جمعیت‌شناسی، علم اقتصاد، علوم زمین، روان‌شناسی ریاضی، احتمالات، جامعه‌شناسی، علوم سیاسی، زبان‌شناسی، آمار، و شبکه‌های عصبی مصنوعی است. تابع هایپربولیک نوع ۱، نوعی تعمیم برای تابع لُجستیک است.

ویژگی‌های ریاضیاتی[ویرایش]

تابع لُجستیک استاندارد همان تابع لُجستیک با پارامترهای ، ، ، که منجر به زیر می‌شود:

در عمل به دلیل طبیعت تابع نمایی ، معمولاً فقط کافی است تا تابع لُجستیک استاندارد را برای روی محدوده کوچکی از اعداد حقیقی، مثل محدوده موجود در [−۶, +۶] محاسبه کنیم، زیرا این تابع بسیار سریع به مقادیر نزدیک به اشباع یعنی ۰ و ۱ همگرا می‌شود.

تابع لُجستیک این ویژگی متقارن را دارد:

بنابراین یک تابع فرد است.

تابع لُجستیک یک آفست و تابع تانژانت هذلولوی مقیاس‌دهی شده‌است:

یا

این موضوع از زیر به دست آمده‌است:

مشتق[ویرایش]

مشتق تابع لُجستیک استاندارد به سادگی محاسبه می‌شود. به این مشتق «توزیع لُجستیک» می‌گویند:

انتگرال[ویرایش]

به صورت برعکس، پاد مشتق را می‌توان با جایگذاری محاسبه کرد، زیرا ، از این رو (با حذف ثابت انتگرال‌گیری)

در شبکه‌های عصبی مصنوعی، به آن، تابع سافت‌پلاس (به انگلیسی: softplus) می‌گویند و (با مقیاس‌دهی) یک تقریب صاف از تابع شیب است، همان‌طور که تابع لُجستیک (با مقیاس‌دهی) یک تقریب صاف از تابع پله‌ای هویساید است.

معادله دیفرانسیلی لُجستیک[ویرایش]

تابع لُجستیک استاندارد راه‌حل معادله دیفرانسیل معمولی غیرخطی مرتبه-اول ساده زیر:

با شرط حدی است. این معادله نسخه پیوسته تناظر لُجستیک است. توجه کنید که تابع لُجستیک وارون همان راه‌حل برای یک معادله دیفرانسیل معمولی خطی مرتبه-اول ساده است.[۲]

رفتار کیفی این تابع به صورت ساده به صورت خط فازی قابل فهم است: موقعی که تابع ۱ است، مشتق ۰ است، موقعی که تابع بین ۰ و ۱ است، مشتق مثبت است، و موقعی که بالای ۱ یا پایین ۰ است، مشتق منفی است (اگرچه جمعیت منفی معمولاً با یک مدل فیزیکی متناظر نیست). این موضوع منجر به یک تعادل غیرپایدار در نقطه ۰ و تعادل پایدار در نقطه ۱ می‌شود، و از این رو برای هر مقدار تابع بزرگتر از ۰ و کمتر از ۱، به سمت ۱ رشد می‌کند.

معادله لُجستیک نوع خاصی از معادله دیفرانسیلی برنولی است، و راه‌حل زیر را دارد:

با انتخاب ثابت انتگرال‌گیری یک تعریف مشهور دیگر برای منحنی لُجستیک به دست می‌آید:

به صورت کمی‌تر، همان‌طور که از راه‌حل تحلیلی قابل مشاهده است، منحنی لُجستیک یک رشد نمایی ابتدایی برای آرگومان منفی نشان می‌دهد، که به یک رشد خطی با شیب ۱/۴ برای آرگومان نزدیک به ۰ می‌رسد، و سپس با یک شکاف تنزلی نمایی به ۱ نزدیک می‌شود.

تابع لُجستیک وارون تابع لوجیت طبیعی است، و از این رو از آن می‌توان استفاده کرد تا «لگاریتم بخت» را به «احتمال» تبدیل نمود. در نمادگذاری ریاضیاتی، تابع لُجستیک را گاهی به صورت "expit"[۳] می‌نویسند، که این موضوع، شکلی مشابه "logit" دارد. تبدیل از نسبت لاگ-درست‌نمایی دو جایگزین نیز شکل منحنی لُجستیک را به خود می‌گیرد.

معادله دیفرانسیل به دست آمده در بالا نوع خاصی از معادله دیفرانسیل عمومی است که فقط تابع سیگمویید را برای مدل‌سازی می‌کند. در بسیاری از کاربردهای مدل‌سازی، شکل عمومی‌تر:[۴]

ممکن است پسندیده‌تر باشد. حل آن همان سیگموید منتقل شده و مقیاس‌دهی شده است.

رابطه تانژانت-هایپربولیک منجر به شکل دیگری از مشتق تابع لُجستیک می‌شود:

که این موضوع تابع لُجستیک را به «توزیع لُجستیک» پیوند می‌دهد.

تقارن چرخشی حول نقطه (۰, ۱/۲)[ویرایش]

جمع تابع لُجستیک و معکوس آن حول محول عمودی، یعنی به این صورت است:

از این رو تابع لُجستیک حول نقطه (۰, ۱/۲) به صورت چرخشی متقارن است.[۵]

کاربردها[ویرایش]

آقای لینک[۶] یک گسترش برای نظریه آقای والد برای تحلیل ترتیبی برای تجمع فاقدتوزیع برای متغیرهای تصادفی، تا موقعی که به یک حد منفی یا مثبت اول برابر شود یا بالاتر شود، ساخت. لینک[۷] احتمال اولین حد مثبت برابر یا بیشتر را به صورت به دست آورد که همان تابع لُجستیک است. این اولین اثباتی بود که تابع لُجستیک می‌توانست به عنوان مبنای یک فرایند تصادفی داشته باشد. لینک[۸] مثال‌هایی از یک سده از نتایج تجربی «لُجستیک»، و رابطه تازه به دست آمده بین این احتمال و زمان جذب در حدود را ایجاد کرد.

در آمار و یادگیری ماشین[ویرایش]

توابع لُجستیک در چندین نقش در آمار استفاده شده‌است. برای مثال آن‌ها تابع توزیع تجمعی برای خانواده لُجستیک برای توزیع‌ها هستند، و از آن‌ها به صورت ساده در مدل‌سازی شانس یک بازیکن شطرنج که باید حریف خود را در سامانه نرخ‌دهی الو شکست دهد، استفاده می‌شوند. مثال‌های خصوصی‌تر در ادامه می‌آید.

رگرسیون لُجستیک[ویرایش]

از توابع لُجستیک در رگرسیون لجستیک استفاده می‌شود تا این موضوع که چقدر احتمال از یک رخداد ممکن است از یک یا بیشتر متغیر توضیح‌دهنده تأثیر بپذیرد را مدل‌سازی کنند، یک مثال آن برای مدل زیر است:

که در آن متغیر توضیح‌دهنده است، و پارامتر مدل برای متناسب شدن هستند، و همان تابع لُجستیک استاندارد است.

به صورت معمول از رگرسیون لجستیک و دیگر مدل‌های لاگ-خطی در یادگیری ماشین استفاده می‌شود. یک تعمیم از تابع لجستیک به چندین ورودی، تابع فعال‌سازی سافت‌مکس است، که در رگرسیون لجستیک چندجمله‌ای از آن استفاده می‌شود.

کاربرد دیگر تابع لجستیک در مدل رش است، که در نظریه پاسخ مورد از آن استفاده می‌شود. بخصوص، مدل رش یک مبنا برای تخمین احتمال حداکثری برای محل اشیا یا افراد در یک پیوستار، بر اساس گردآوردی از داده طبقه‌ای می‌سازد، برای مثال توانایی افراد در یک پوستار مبتنی بر پاسخ‌ها قرار دارد، که به صورت درست یا نادرست طبقه‌بندی شده‌اند.

شبکه‌های عصبی[ویرایش]

معمولاً از توابع لُجستیک در شبکه‌های عصبی برای معرفی غیرخطی‌بودن در مدل یا برای گیرانداختن سیگنال‌ها به داخل یک محدوده معین استفاده می‌شود. یک عنصر شبکه عصبی یک ترکیب خطی از سیگنال‌های ورودی‌اش را محاسبه می‌کند، و تابع لُجستیک محدود به عنوان تابع فعال‌سازی به جواب اعمال می‌شود؛ این مدل را می‌توان به عنوان نوع «صاف‌شده» عصب آستانه کلاسیک دانست.

یک گزینه معمول برای توابع فعال‌سازی یا «کوبیدن یا له‌کردن» که از آن برای اتصال به مقادیر بزرگ و برای محدود نگهداشتن پاسخ شبکه عصبی استفاده می‌شود،[۹] به صورت زیر است:

که یک تابع لجستیک است.

این موضوع منجر به پیاده‌سازی‌های ساده شبکه‌های عصبی مصنوعی با عصب‌های مصنوعی می‌شود. متخصصان احتیاط می‌کنند که توابع سیگموییدی که حول مبدأ پادمتقارن هستند (مثل تانژانت هذلولوی) موقعی که شبکه را با پس‌انتشار آموزش می‌دهیم منجر به همگرایی سریع‌تر می‌شوند.[۱۰]

تابع لُجستیک خودش مشتق تابع فعال‌سازی پیشنهادی دیگری، به نام سافت‌پلاس است.

در زبان‌شناسی: دگرگونی زبانی[ویرایش]

در زبان‌شناسی، از تابع لُجستیک برای مدل‌سازی دگرگونی زبانی استفاده می‌شود:[۱۱] یک نوآوری که در محدوده اول است، با گسترش سریع‌تری در زمان شروع می‌شود، و سپس با قبول‌شدن جهانی آن، گسترش آن آهسته‌تر می‌شود.

جستارهای وابسته[ویرایش]

پانویس[ویرایش]

  1. Verhulst, Pierre-François (1838). "Notice sur la loi que la population poursuit dans son accroissement" (PDF). Correspondance Mathématique et Physique. 10: 113–121. Retrieved 3 December 2014.
  2. Kocian, Alexander; Carmassi, Giulia; Cela, Fatjon; Incrocci, Luca; Milazzo, Paolo; Chessa, Stefano (7 June 2020). "Bayesian Sigmoid-Type Time Series Forecasting with Missing Data for Greenhouse Crops". Sensors. 20 (11): 3246. doi:10.3390/s20113246. PMC 7309099. PMID 32517314.
  3. expit documentation for R's clusterPower package.
  4. Kyurkchiev, Nikolay, and Svetoslav Markov. "Sigmoid functions: some approximation and modelling aspects". LAP LAMBERT Academic Publishing, Saarbrucken (2015).
  5. Raul Rojas. Neural Networks – A Systematic Introduction (PDF). Retrieved 15 October 2016.
  6. S. W. Link, Psychometrika, 1975, 40, 1, 77–105
  7. S. W. Link, Attention and Performance VII, 1978, 619–630
  8. S. W. Link, The wave theory of difference and similarity (book), Taylor and Francis, 1992
  9. Gershenfeld 1999, p. 150.
  10. LeCun, Y.; Bottou, L.; Orr, G.; Muller, K. (1998). Orr, G.; Muller, K., eds. Efficient BackProp (PDF). Neural Networks: Tricks of the trade. Springer. ISBN 3-540-65311-2.
  11. Bod, Hay, Jennedy (eds.) 2003, pp. 147–156

منابع[ویرایش]

مشارکت‌کنندگان ویکی‌پدیا. «Logistic function». در دانشنامهٔ ویکی‌پدیای انگلیسی، بازبینی‌شده در ۱۰ اوت ۲۰۲۱.