توزیع پارتو

از ویکی‌پدیا، دانشنامهٔ آزاد
توزیع پارتو نوع I
تابع چگالی احتمال
k
تابع توزیع احتمالی پارتو برای مقادیر مختلف و . وقتی که حد k به بی‌نهایت میل می‌کند تابع توزیع احتمالی به (δ(xxm میل می‌کند که δ تابع دلتای دیراک می‌باشد.
تابع توزیع تجمعی
Pareto cumulative distribution functions for various k
تابع توزیع تجمعی پارتو برای مقادیر مختلف و .
پارامترها مکان (حقیقی)
شکل (حقیقی)
تکیه‌گاه
تابع چگالی احتمال
تابع توزیع تجمعی
میانگین for
میانه
مُد
واریانس for
چولگی for
کشیدگی for
آنتروپی
تابع مولد گشتاور تعریف نشده
تابع مشخصه
اطلاع فیشر

Right:

توزیع پارتو (به انگلیسی: Pareto distribution) نوعی توزیع احتمال قانون-توانی است، که در توصیف پدیده‌های قابل مشاهده، از نوع اجتماعی، علمی، ژئوفیزیکی، و بیم‌سنجی و بسیاری موارد دیگر استفاده می‌شود. این توزیع در اصل برای توصیف توزیع ثروت در یک جامعه استفاده شده بود، و با این گرایش توزیع ثروت که «بخش زیادی از ثروت توسط بخش اندکی از جمعیت نگهداری می‌شود»، هماهنگ است.[۱] به صورت محاوره‌ای به این توزیع «اصل پارتو» یا «قاعده ۸۰–۲۰» هم می‌گویند، همچنین گاهی به آن «اصل میتو» گفته می‌شود. این قاعده می‌گوید: برای مثال، «۸۰ درصد از ثروت یک جامعه توسط ۲۰ درصد از جمعیت آن نگهداری می‌شود». با این حال، نباید توزیع پارتو را با اصل پارتو یکسان دانست، زیرا توزیع پارتو فقط برای مقدار خاصی این نتیجه را تولید می‌کند (α = log45 ≈ ۱٫۱۶). با اینکه یک پراسنجه است، مشاهدات تجربی نشان داده‌اند که توزیع ۸۰–۲۰، هماهنگی خوبی با نمونه‌های متنوع و گسترده دارد، که این نمونه‌ها از نوع پدیده‌های طبیعی[۲] و فعالیت‌های انسانی[۳] می‌باشند.

توزیع پارتو از نام مهندس عمران، اقتصاددان و جامعه‌شناس ایتالیایی، ویلفردو پارتو گرفته شده‌است. واژه Pareto در انگلیسی به صورت «پِرِیتو» (US: ‎/pəˈrt/‎ pə-RAY-toh) تلفظ می‌شود.

تاریخچه[ویرایش]

در سال ۱۸۹۷، اقتصاددان ایتالیایی ویلفردوپارتو (۱۹۲۳–۱۸۴۸) که شاگرد لئون والراس بود و پس از او به احراز کرسی اقتصاد سیاسی دانشگاه لوزان دست یافت، باعث ایجاد نظم خاصی در توزیع درآمدها در کشورهای سرمایه‌داری و نیز کشورهایی که در شرایط فئودالی و سرمایه‌داری اولیه بودند شد. پارتو قصد داشت براساس این قانون نتایجی با ماهیت اقتصادی و اجتماعی به‌دست‌آورد.

پارتو دومین نفر از مکتب لوزان است؛ مکتب لوزان توسط لئون والراس (۱۸۳۴–۱۹۱۰) پایه‌گذاری شد؛ این مکتب علاوه بر بحث دربارهٔ مقوله مطلوبیت، به هزینه و عرضه نیز پرداخته‌است؛ با این بیان که اگر قیمت، بالاتر از هزینه تولید قرار گیرد، عرضه افزایش پیدا می‌کند تا قیمت را پایین آورد و بالعکس؛ اگر هزینه از قیمت پیشی گیرد، عرضه کاهش پیدا کرده و قیمت‌ها بالا می‌روند. پارتو یکی از بنیانگذاران اقتصاد ریاضی نیز شناخته شده‌است. دیدگاه او در مقوله تعادل عمومی در اقتصاد رفاه، جایگاه اساسی دارد.

پارتو بر مبنای آمارهای کشورهای مختلف، توزیع‌های فراوانی بدست آورد که معرف تعداد افرادی بودند که درآمدشان برابر مقداری معین یا بیشبر از آن بود. آنگاه نمودارهای این توزیع‌های فراوانی را رسم کرد. محور افقی این نمودارها معرف درآمد و محور عمودی، تعداد افراد با درآمد x یا بیشتر را نشان می‌داد.

پارتو دریافت که دراغلب حالات مورد بررسی، منحنی‌های نشان دهندهٔ این نوع توزیع‌های درآمد شکلی مشابه دارند؛ یعنی منحنی‌هایی هستند که معادله آنها با فرمول زیر مشخص می‌شود:

که در آنها b کمترین حد درآمدی است که منحنی از آن شروع می‌شود، درحالی که A, پارامترهای معین مثبت هستند. نمودار این منحنی، منحنی پارتو نام دارد.[۴]

تعریف[ویرایش]

تابع چگالی احتمال[ویرایش]

تابع چگالی احتمال یک توزیع پارتو چنین است.

ویژگی‌ها[ویرایش]

تابع توزیع تجمعی[ویرایش]

تابع توزیع تجمعی در توزیع پارتو برابر است با:

و همچنین معکوس آن برابر است با:

میانه[ویرایش]

میانه در توزیع پارتو برابر است با:

مد[ویرایش]

مد در توزیع پارتو برابر است با:

امید ریاضی[ویرایش]

امید ریاضی یک توزیع پارتو برابر است با:

واریانس[ویرایش]

واریانس یک توزیع پارتو برابر است با:

برای واریانس تعریف نشده‌است.

انحراف معیار[ویرایش]

انحراف معیار یک توزیع پارتو برابر است با:

توزیع پارتو تعمیم‌یافته[ویرایش]

۵ نوع توزیع تعمیم یافته وجود دارد که توزیع پارتو را تعمیم می‌دهد.[۵][۶]

توزیع‌های پارتو
شرایط
نوع ۱
نوع ۲
نوع Lomax
نوع ۳
نوع ۴

کاربردها[ویرایش]

اصل پارتو[ویرایش]

پارتو در ابتدا از این توزیع برای توصیف تخصیص ثروت در میان افراد استفاده می‌کرد، زیرا به نظر می‌رسید که بخش بزرگی از ثروت هر جامعه متعلق به درصد کمتر از مردم در آن جامعه است. او همچنین برای توصیف توزیع درآمد از آن استفاده کرد.[۷] این ایده گاهی به سادگی به عنوان اصل پارتو یا "حکم ۸۰–۲۰" بیان می‌شود که می‌گوید ۲۰ درصد از جمعیت ۸۰ درصد ثروت را کنترل می‌کنند.[۸] با این وجود، قواعد ۸۰–۲۰ به ارزش خاص مربوط می‌شود و در واقع، اطلاعات پارتو دربارهٔ مالیات بر درآمد بریتانیا در سیاست‌های اقتصادی خود نشان می‌دهد که حدود ۳۰ درصد از جمعیت حدود ۷۰ درصد درآمد داشته‌است. نمودار تابع چگالی احتمال (PDF) نشان می‌دهد که احتمال یا کسری از جمعیت که دارای مقدار کمی ثروت در هر فرد است نسبتاً بالا است و پس از آن به‌طور ثابتی به عنوان افزایش ثروت کاهش می‌یابد. (توجه داشته باشید که توزیع پارتو برای ثروت برای انتهای پایین واقع‌گرایانه نیست. در حقیقت، ارزش خالص ممکن است حتی منفی باشد).
«انجام هر کدام از کارهای موجود در لیست شما ممکن است به یک اندازه وقت شما را بگیرد ولی انجام یک یا دو تای آنها چند برابر هر یک از سایر موارد برای شما سودمند خواهد بود. گاهی پیش می‌آید که ارزش یکی از ده کار یا فعالیتی که شما در لیست خود دارید به تنهایی می‌تواند بیش از مجموع سایر فعالیت‌ها در موفقیت شما ارزشمند باشد. این کار بی تردید همان قورباغه ای است که باید اول از همه قورت بدهید. می‌توانید حدس بزنید که یک فرد معمولی احتمالاً در انجام چه کارهایی بیشتر تنبلی می‌کند؟ واقعیت تاسف بار این است که اکثر مردم در مورد انجام همان ده یا بیست درصد از فعالیت‌هایی که در صدر قرار دارند و بیشترین ارزش و اهمیت را دارند تنبلی می‌کنند یعنی در مورد همان اقلیت بسیار مهم. در عوض وقت خود را صرف هشتاد درصد فعالیت‌هایی می‌کنند که در موفقیت آنها اهمیت بسیار کمی دارد و تأثیر ناچیزی در دست یابی به نتایج ارزشمند می‌گذارد؛ یعنی همان اکثریت کم‌اهمیت.»[۹]

دیگر کاربردهای آن[ویرایش]

بسیاری از پدیده‌های اجتماعی، علمی و ژئوفیزیکی توسط توزیع پارتو توصیف می‌شوند. این توزیع در مباحث طول عمر و قابلیت اعتماد دارای اهمیت فراوان است.
از دیگر کاربردهای آن می‌توان به موارد زیر اشاره کرد:
  • اندازه شهرک‌های انسانی (چند شهر بزرگ دربرابر بسیاری از شهرهای کوچک و روستاها)[۱۰]
  • توزیع حجم فایل ترافیک اینترنتی که از پروتکل TCP استفاده می‌کند (چند عدد بزرگ دربرابر بسیاری از عددهای کوچک)[۱۰]
  • نرخ خطا در هارد دیسک[۱۱]
  • خوشه‌های معادله بوز-اینشتین نزدیک صفر مطلق
  • ارزش ذخایر نفت در میدان‌های نفتی (چند میدان بزرگ دربرابر بسیاری از میدان‌های کوچک)[۱۰]
  • توزیع طولی در مشاغل سوپر کامپیوترها (چند عدد بزرگ دربرابر بسیاری از عددهای کوچک)
  • قیمت استاندارد شده بر روی سهام فردی[۱۰]
  • اندازه ذرات شن و ماسه[۱۰]
  • اندازه شهاب سنگ‌ها
  • بارندگی سالانه حداکثر یک روزه و تخلیه رودخانه[۱۲]

نمونه‌ای از توزیع پارتو[ویرایش]

درآمد یک جمعیت خاص[ویرایش]

فرض کنید که درآمد یک جمعیت خاص دارای توزیع پارتو با و است.[۱۳]

حال می‌خواهیم نسبت جمعیت افراد با درآمد ۲۰۰۰ تا ۴۰۰۰ را بدست آوریم.

حال می‌خواهیم درآمد آن‌ها را بدست آوریم.

درآمد کل نیز برابر است با:

بنابراین ۱۰٫۹۳۷۵ درصد افراد دارای درآمدی بین ۲۰۰۰ تا ۴۰۰۰ هستند که ۱۸٫۷۵ درصد درآمد کل را دارند.

کد در زبان R[ویرایش]

library("EnvStats") # Package for Environmental Statistics

pareto <- rpareto(n = 10000000, location = 1000, shape = 3) # Get 10000000 numbers of Pareto distribution
pareto <- pareto[pareto > 1000] # Get numbers greater than 1000
number <- 0 # Number of people with income from 2000 to 4000

for (i in pareto) {
  if (i <= 4000 && i >= 2000) {
    number = number + 1
  }
}
cat("proportion of people with income from 2000 to 4000:", number / length(pareto))

paretoPlot <- pareto[pareto < 5000] # Get numbers less than 5,000 to draw charts
hist(paretoPlot, breaks = 150) # Draw charts

منابع[ویرایش]

  1. Pareto, Vilfredo (1898). "Cours d'economie politique". Journal of Political Economy. 6.
  2. VAN MONTFORT, M.A.J. (1986). "The Generalized Pareto distribution applied to rainfall depths". Hydrological Sciences Journal. 31 (2): 151–162. doi:10.1080/02626668609491037.
  3. Oancea, Bogdan (2017). "Income inequality in Romania: The exponential-Pareto distribution". Physica A: Statistical Mechanics and Its Applications. 469: 486–498. Bibcode:2017PhyA..469..486O. doi:10.1016/j.physa.2016.11.094.
  4. «پایان‌نامه تحصیلی دورهٔ کارشناسی ارشد». رضا پورطاهری. شهریور 70. تاریخ وارد شده در |تاریخ= را بررسی کنید (کمک)
  5. B.، Douglas, J. (۱۹۸۰). Analysis with standard contagious distributions. Fairland, Md.: International Co-operative Pub. House. OCLC 7792137. شابک ۰۸۹۹۷۴۰۱۲X.
  6. Kotz، Samuel, ویراستار (۲۰۰۴-۰۷-۱۵). Encyclopedia of Statistical Sciences. Hoboken, NJ, USA: John Wiley & Sons, Inc. شابک ۰۴۷۱۶۶۷۱۹۶.
  7. Pareto، Vilfredo (۱۹۶۴). Cours d'économie politique. Librairie Droz. شابک ۹۷۸۲۶۰۰۰۴۰۱۴۳.
  8. Notestein, Frank W. (1974-01). "The World Population Year". Population Index. 40 (1): 18. doi:10.2307/2733536. ISSN 0032-4701. {{cite journal}}: Check date values in: |date= (help)
  9. Sardana, G.D. (2007-07). "Eat That Frog! Brian Tracy". Paradigm. 11 (2): 83–84. doi:10.1177/0971890720070213. ISSN 0971-8907. {{cite journal}}: Check date values in: |date= (help)
  10. ۱۰٫۰ ۱۰٫۱ ۱۰٫۲ ۱۰٫۳ ۱۰٫۴ Reed, William J.; Jorgensen, Murray (2004-12-31). "The Double Pareto-Lognormal Distribution—A New Parametric Model for Size Distributions". Communications in Statistics - Theory and Methods (به انگلیسی). 33 (8): 1733–1753. doi:10.1081/sta-120037438. ISSN 0361-0926.
  11. Schroeder, Bianca; Damouras, Sotirios; Gill, Phillipa (2010-09-01). "Understanding latent sector errors and how to protect against them". ACM Transactions on Storage. 6 (3): 1–23. doi:10.1145/1837915.1837917. ISSN 1553-3077.
  12. Random Variables and Cumulative Distribution. 1000 20th Street, Bellingham, WA 98227-0010 USA: SPIE. صص. ۳–۳. شابک ۹۷۸۰۸۱۹۴۸۷۰۱۸.
  13. "AP Statistics Curriculum 2007 Pareto - Socr". wiki.stat.ucla.edu (به انگلیسی). Retrieved 2018-10-29.