تابع چگالی احتمال

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو

در آمار و احتمالات تابع چگالی احتمال به تابعی اطلاق می‌شود که توزیعی آماری را به شکل انتگرالی نمایش دهد. مقدار این تابع غیر منفی است.

توزیع پیوسته یک متغیره[ویرایش]

تابع توزیع نرمال N(0, σ2).

احتمال آنکه متغیر تصادفی در بازه [a,b] واقع شود از رابطهٔ زیر بدست می‌آید:

\Pr(a \leq X \leq b) =\int_a^b f(x)\,dx

همچنین کل مساحت زیر نمودار برابر است با ۱؛ یعنی:

 \int_{-\infty}^\infty \,f(x)\,dx = 1

در نتیجه تابع توزیع تجمعی را می‌توان بصورت زیر نوشت:

F(x) = \int_{-\infty}^x f(u) \, \mathrm{d}u ,

و اگر f تابعی پیوسته باشد:

 f(x) = \frac{\mathrm{d}}{\mathrm{d}x} F(x).

تعریف[ویرایش]

متغیر تصادفی X را در نظر بگیرید که مقدار آن در فضای اندازه (\mathcal{X}, \mathcal{A}) تعریف شده و توزیع احتمال آن اندازه XP در (\mathcal{X}, \mathcal{A}) است، آنگاه چگالی X نسبت به اندازه مرجع μ در (\mathcal{X}, \mathcal{A}) بواسطه مشتق رادون−نیکودیم به شکل زیر تعریف می‌شود:

f = \frac{\mathrm d X_*P}{\mathrm d \mu}.

بعبارت دیگر، به ازای هر مجموعه اندازه‌پذیر A \in \mathcal{A}، f می‌تواند هر تابع قابل اندازه‌گیری با ویژگی زیر باشد:

\Pr [X \in A ] = \int_{X^{-1}A} \, \mathrm d P = \int_A f \, \mathrm d \mu

برخلاف احتمالی که به یک متغیر تصادفی گسسته نسبت داده می‌شود، تابع چگالی احتمال می‌تواند مقادیر بیشتر از یک را نیز اختیار کند. به طور مثال توزیع یکنواخت در بازه [۱/۲ ,۰] چگالی احتمالی f(x) = 2 برای 0 ≤ x ≤ ½ دارد و f(x) = 0 برای خارج این بازه دارد با داشتن تابع چگالی احتمالی متغیر تصادفی X می‌توان مقدار امید ریاضی آن را به شکل زیر محاسبه کرد


  \operatorname{E}[X] = \int_{-\infty}^\infty x\,f(x)\,dx.

چند روش محاسبه[ویرایش]

از روش‌های بدست آوردن تابع چگالی احتمالی متغیر تصادفی X مشتق گیری از تابع توزیع تجمعی (FX(x آن است و که به صورت زیر تعریف می‌شود x \to F_X(x) = \operatorname{P}(X\leq x)


  \frac{d}{dx}F(x) = f(x).

یک روش دیگر برای بدست آوردن تابع چگالی احتمالی متغیر تصادفی X تخمین مقدار آن در یک بازه کوچک مانند  [x, x + \varepsilon] : است.


  \Pr(x<X<x+\varepsilon) = f(t)\,\varepsilon.

یا به عبارت دیگر 
\lim_{\varepsilon \to 0} P(x <X <x + \varepsilon) / \varepsilon
:

رابطه بین توزیع‌های گسسته و پیوسته[ویرایش]

می‌توان بعضی از متغیرهای تصادفی گسسته را نیز با استفاده از تابع چگالی احتمالی توصیف کرد. به طور مثال برای متغیر تصادفی که دو مقدار ۱ و -۱ را هر کدام با احتمال ۱/۲ می‌گیرد، می‌توان چگالی احتمال زیر را نسبت داد

f(t) = \frac{1}{2}(\delta(t+1)+\delta(t-1)).

به طور کلی اگر متغیر تصادفی n مقدار حقیقی را اختیار کند می‌توان تابع چگالی احتمال آن را به این شکل نوشت

f(t) = \sum_{i=1}^np_i\, \delta(t-x_i),

که مقادیر x1, …, xn مقادیری هستند که متغیر تصادفی X با احتمال p1, …, pn اختیار می‌کند..

چگالی احتمال توابع چند متغیره[ویرایش]

برای متغیرهای تصادفی X1, …, Xn همچنین این امکان وجود دارد که یک تابع چگالی چند متغیره تعریف کنیم که به تمامی "X"‌ها بستگی داشته باشد که به آن تابع چگالی احتمال مشترک (توأم) گویند. این تابع چگالی تابع چگالی n متغیره نام دارد به طوری که به ازای هر فضای احتمال "n" بعدی "D" از متغیرهای تصادفی x1, …, xn احتمال اینکه این دسته متغیرها در "D" قرار بگیرند، به صورت زیر است:

\Pr \left(X_1,\ldots,X_N \isin D \right)
 = \int_D f_{X_1,\dots,X_N}(x_1,\ldots,x_N)\,dx_1 \cdots dx_N.

اگر(F(x1, …, xn) = Pr(X1 ≤ x1, …, Xn ≤ xn باشد، به آن توزیع تجمعی احتمال بردار (X1, …, Xn) گوییم که در آن صورت توزیع چگالی احتمال توأم از طریق مشتق گیری از آن بدست می‌آید:


  f(x) = \frac{\partial^n F}{\partial x_1 \cdots \partial x_n} \bigg|_x

چگالی توزیع حاشیه‌ای[ویرایش]

(fXi(xi به ازای i=۱, ۲, …,n چگالی توزیع حاشیه‌ای می‌گوییم که فقط تابع Xi است. می‌توان آنرا از طریق انتگرال گیری از توزیع تجمعی نسبت به n-1 متغیر دیگر بدست آورد.

f_{X_i}(x_i) = \int f(x_1,\ldots,x_n)\, dx_1 \cdots dx_{i-1}\,dx_{i+1}\cdots dx_n.

استقلال[ویرایش]

تابع توزیع مشترک n متغیره X1, …, Xn مستقل از تک تک آنها مستقل است اگر و تنها اگر:

f_{X_1,\dots,X_n}(x_1,\ldots,x_n) = f_{X_1}(x_1)\cdots f_{X_n}(x_n).

نتیجه فرعی[ویرایش]

اگر بتوان تابع توزیع مشترک یک بردار n تایی را به صورت حاصلضرب n تابع تک متغیره نوشت

f_{X_1,\dots,X_n}(x_1,\ldots,x_n) = f_1(x_1)\cdots f_n(x_n),

(لزومی ندارد که هر fi یک چگالی احتمال باشد) در آن صورت n متغیر از یکدیگر مستقل هستند و چگالی توزیع احتمال هریک به صورت زیر محاسبه می‌شود:

f_{X_i}(x_i) = \frac{f_i(x_i)}{\int f_i(x)\,dx}.

مثال[ویرایش]

این مثال ابتدایی حالت ساده دو متغیره از تعریف تابع چکالی احتمال چند متغیره است. فرض کنید فضای \vec R یک فضای دو متغیره با بردار مختصات (X, Y) است. احتمال اینکه \vec R در کنج مثبت باشد، اینگونه است:

\Pr \left(X> 0, Y> 0 \right)
 = \int_0^\infty \int_0^\infty f_{X,Y}(x,y)\,dx\,dy.

جمع دو متغیر تصادفی مستقل[ویرایش]

تابع چگالی احتمال دو متغیر مستقل U و V، که هر یک دارای یک تابع چگالی احتمالند، کانولوشن تابع چگالی تک تک آن هاست:


f_{U+V}(x) = \int_{-\infty}^\infty f_U(y) f_V(x - y)\,dy
= \left(f_{U} * f_{V} \right) (x)

می‌توان رابطه بالا را به N متغیر مستقل، با چگالی‌های U1, …, UN تعمیم داد:


f_{U_{1} + \ldots + U_{N}}(x)
= \left(f_{U_{1}} * \ldots * f_{U_{N}} \right) (x)

متغیرهای وابسته و تغییر متغیر[ویرایش]

اگر تابع چگالی احتمال متغیر تصادفی X به صورت (fX(x داده شده باشد، می‌توان (ولی معمولاً غیر ضروری است، زیر را مشاهده کنید) تابع چگالی احتمال متغیری مانند (Y = g(X را محاسبه کرد. به این کار «تغییر متغیر» می‌گویند و در عمل برای تولید متغیر تصادفی با شکل دلخواه fg(X) = fY با استفاده از مولد عدد تصادفی شناخته شده (برای مثال یکنواخت)، مورد استفاده قرار می‌گیرد.

اگر تابع g یکنواخت باشد، در آن صورت تابع چگالی حاصل به صورت زیر است:

f_Y(y) = \left| \frac{1}{g'(g^{-1}(y))} \right| \cdot f_X(g^{-1}(y)).

در اینجا منظور از g−1، تابع معکوس و منظور از 'g، تابع مشتق است.

این به دنبال این حقیقت ناشی می‌شود که احتمال در ناحیه مشتق گیری تحت تأثیر تغییر متغیر، باید ثابت بماند. یعنی:

\left| f_Y(y)\, dy\right| = \left| f_X(x)\, dx\right|,

یا

f_Y(y) = \left| \frac{dx}{dy} \right| f_X(x) = \left| \frac{1}{g'(x)} \right| f_X(x) = \left| \frac{1}{g'(g^{-1}(y))} \right|f_X(g^{-1}(y)).

برای توابعی که یکنواخت نیستند، تابع چگالی احتمال "y" به صورت زیر است:

\sum_{k=1}^{n(y)} \left| \frac{1}{g'(g^{-1}_{k}(y))} \right| \cdot f_X(g^{-1}_{k}(y))

که در آن (n(y تعداد جواب‌های "x" برای رابطه g(x) = y و (g−1k(y‌ها همان جواب‌ها هستند.

حال وسوسه انگیز است که در مورد امید ریاضی((E(g(X نیز بیاندیشیم. به این منظور ابتدا باید چگالی احتمال(fg(X را برای متغیر تصادفی جدید (Y = g(X بیابیم. به جای محاسبه

 E(g(X)) = \int_{-\infty}^\infty y f_{g(X)}(y)\,dy,

بهتر است

E(g(X)) = \int_{-\infty}^\infty g(x) f_X(x)\,dx.

را محاسبه کرد.

دو انتگرال در تمامی شرایط در حالی که X و (g(X دارای تابع توزیع چگالی باشند، جواب یکسانی دارند. هیچ الزامی وجود ندارد که تابع g یک تابع یک به یک باشد. برخی مواقع انتگرال دوم، بسیار راحت تر از اولی قابل محاسبه است.

متغیرهای چندگانه[ویرایش]

فرمول بالا را می‌توان به متغیرهایی (که آنها را دوباره y می‌نامیم) وابسته به چند متغیر تصادفی تعمیم داد. (f(x0, x1, …, xm−1 را می‌توان به عنوان تابع چگالی احتمال y در نظر گرفت که به آنها وابسته است که این وابستگی به صورت y = g(x0, x1, …, xm−1) است. در نتیجه تابع چگالی به صورت زیر بدست می‌آید:

 \int\limits_{y = g(x_0, x_1, \dots, x_{m-1})} \frac{f(x_0, x_1,\dots, x_{m-1})}{\sqrt{\sum_{j=0}^{j<m}} (\frac{\partial g}{\partial x_j}(x_0, x_1, \dots , x_{m-1}))^2} \; dV

که در آن انتگرال روی m-1 بعد است و باید dV را متناسب با این انتگرال پارامتریزه جایگزین کرد. متغیرهای تصادفی x0, x1, …, xm−1 بالطبع توابعی از این پارامتریزه کردن‌ها هستند.

شاید بصری به نظر برسد، ولی این ناشی از مطلب زیر است: فرض کنید 'x' یک متغیر تصادفی n-بعدی با تابع چگالی احتمال f است. اگر y = H(x) و H تابعی دوسویه و تشخیص پذیر باشد، y دارای چگالی احتمال g است:

g(\mathbf{y}) = f(\mathbf{x})\left\vert \det\left(\frac{d\mathbf{x}}{d\mathbf{y}}\right)\right \vert

که مشتق در نظر گرفته شده، ماتریس ژاکوبی معکوس تابع H نسبت به y است.

با استفاده از تابع دلتا، (و فرض بر استقلال) جواب یکسانی به صورت زیر بدست می‌آید.

اگر تابع چگالی احتمال متغیرهای تصادفی مستقل Xi, i = ۱, ۲, …n به صورت (fXi(xi داده شده باشند، می‌توان تابع چگالی احتمال متغیرهایی مانند (Y = G(X1, X2, …Xn را حساب کرد. فرمول زیر ارتباطی بین تابع چگالی احتمال y که با (fY(y نشان می‌دهیم و (fXi(xi با استفاده از تابع دلتای دیراک برقرار می‌کند:

f_Y(y) = \int_{-\infty}^\infty \int_{-\infty}^\infty \ldots \int_{-\infty}^\infty f_{X_1}(x_1)f_{X_2}(x_2) \ldots f_{X_n}(x_n)\delta(y-G(x_1,x_2,\ldots x_n))\,dx_1\,dx_2\,\ldots dx_n

منابع[ویرایش]

  • مشارکت‌کنندگان ویکی‌پدیا، «Markov chain»، ویکی‌پدیای انگلیسی، دانشنامهٔ آزاد (بازیابی در ۲۶ ژوئیهٔ ۲۰۱۲).
  • مشارکت‌کنندگان ویکی‌پدیا، «Probability density»، ویکی‌پدیای انگلیسی، دانشنامهٔ آزاد (بازیابی در ۲۸ ژوئیهٔ ۲۰۱۲).
  • Probability and Statistics in Engineering And Management Science, William W. Hines, Douglas C. Montgomery, Third Edition, John Wiley and Sons, 1990, ISBN 0-471-60090-3.