میانگین متحرک خودگردان یکپارچه

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو

در آمار و اقتصادسنجی و به ویژه در آنالیز سری‌های زمانی یک "میانگین متحرک خودگردان یکپارچه"(ARIMA) یک مدل گسترده تر از میانگین متحرک خودگردان(ARMA) است. این مدلها در سریهای زمانی برای فهم بهتر مدل یا پیش بینی آینده به کار می‌روند. این مدل‌ها در جایی که داده‌ها غیر ایستا (non-stationary) باشند به کار می‌روند. در این حالت با یک بار دیفرانسیل گیری(متناظر با جز "یکپارچه"(integrated non-stationary بودن داده‌ها از بین می‌رود و امکان برآورد یک ARMA در داده‌های جدید به وجود می‌آید.

این مدل در اکثر موارد به صورت ARIMA(p،d،q نشان داده می‌شود که در آن p، d، q اعداد حقیقی غیرمنفی هستند که درجه خودگردانی، یکپارچگی و میانگین متحرک را معلوم می‌کنند. مدل‌های ARIMA بخش مهمی از رویکرد باکس-جنکینز به مدل‌های سری زمانی را می‌سازند. در صورتی که یکی از جزء‌ها برابر با صفر باشند معمولا به صورتAR، I یا MA" نوشته می‌شود. برای مثال یک I(۱) همان مدل ARIMA(۰،۱،۰) است و یا " (۱)MA" همان " (ARIMA(۰،۰،۱" است.

تعریف[ویرایش]

به ازای یک سری زمانی X_tداده شده که در آن tیک عدد صحیح شاخص و X_tاعداد حقیقی هستند، در اینصورت ARMA(p، q) به صورت زیر است:


\left(
  1 - \sum_{i=1}^{p} \alpha_i L^i
\right) X_t
=
\left(
  1 + \sum_{i=1}^q \theta_i L^i
\right) \varepsilon_t \,
که در آن Lاپراتور تاخیر و \alpha_iپارامترهای بخش خودگردان مدل هستند و\theta_i پارامترهای بخش میانگین متحرک هستند و \varepsilon_tبخش خطای مدل. ترم‌های خطا \varepsilon_t به طوز کلی فرض می‌شوند متغیرهای تصادفی با توزیع مستقل و یکسان هستند. متغیرهای تصادفی از توطیع‌های نرمال با میانگین صفر برداشته می‌شوند. فرض کنید که چندجمله‌ای \left( 1 - \sum_{i=1}^{p} \alpha_i L^i \right) یک ریشه واحد از درجه "d" دارد. در اینصورت می‌توان نوشت:


\left(
  1 - \sum_{i=1}^p \alpha_i L^i
\right)
=
\left(
  1 + \sum_{i=1}^{p-d} \phi_i L^i
\right)
\left(
  1 - L
\right)^{d} .

یک مدل ARIMA(p،d،q) فاکتورهای این چندجمله‌ای را به صورت زیر بیان می‌کنند:


\left(
  1 - \sum_{i=1}^p \phi_i L^i
\right)
\left(
  1-L
\right)^d
X_t
=
\left(
  1 + \sum_{i=1}^q \theta_i L^i
\right) \varepsilon_t \,

و بنابراین می‌تواند به صورت یک نمونه خاص ARMA("p+d"،"q") که دارای بخش خودگردانی با ریشه‌های واحد است دیده شود.به همین دلیل هر ARIMA با "d" >۰ به طور کلی stationary نیست.

دیگر مدل‌های خاص[ویرایش]

مشخصه فاکتور گیری بخش چندجمله‌ای خودگردان به صورت بالا، می‌تواند به موارد دیگر نیز تعمیم داده شود. اولا وجود چندجمله‌ای برای بخش میانگسن متحرک و ثانیا برای شمول دیگر فرم‌های مدل.برای مثال، داشتن فاکتور\left( 1 - L^s \right) در مدل یک روش برای ایجاد non-stationarity فصلی دوره "s" در مدل است.مثال بعدی فاکتور \left( 1 -\sqrt{3} L + L^2\right) است که شامل یک non-stationary فصلی دوره ۱۲ است.اثر فاکتور نوع اول این است که احازه می‌دهد تا مقدار عرض از مبدا هر فصل به طور مجزا تغییر کند درصورتیکه در نوع دوم این مقدار برای همه فصل‌ها با هم تغییر می‌کند. شناسایی و تعیین درجه هربخش ARIMA مرحله مهمی در مدلسازی است زیرا می‌تواند سبب کاهش تعداد متغیرهای مورد برآورد در مدل شود.

پیش بینی با مدلهای ARIMA[ویرایش]

مدل هایARIMA برای داده‌های با فرآیندهایnon-stationary که روندهایی کاملا قابل تشخیص دارند به کار می‌روند:

  • یک روند ثابت (با میانگین صفر) مدل شده به صورت d=0
  • یک روند خطی (برای مثال رفتار رشد خطی) مدل شده به صورتd=1
  • یک روند مربعی (برای مثال رفتار رشد مرتبه دوم) مدل شده به صورت d=2

در این موارد مدل ARIMA را می‌توان به صورت ترکیبی از دو مدل دید. اولیnon-stationary است:


Y_t
=
\left(
  1-L
\right)^d
X_t

در حالیکه دومی wide-stationary است:


\left(
  1 - \sum_{i=1}^p \phi_i L^i
\right)
Y_t
=
\left(
  1 + \sum_{i=1}^q \theta_i L^i
\right) \varepsilon_t \, .

در این حالت تکنیک‌های استاندارد پیش بینی می‌تواند برای فرموله کردن فرآیند Y_t به کار رود وسپس با داشتن تعداد کافی مشاهدات اولیه به پیش بینی X_t پرداخت.

مثال‌ها[ویرایش]

بعضی از مثالهای معروف به سادگی به دست می‌آیند.برای مثال ARIMA(۰،۱،۰) به صورت زیر نشان داده می‌شود که یک قدم تصادفی است: X_t = X_{t-1} + \varepsilon_t تعدادی از نمونه‌های ARIMA به گستردگی به کار می‌روند.برای مثال اگر سری زمانی‌های چندتایی به کار روند X_t را می‌توان به صورت برداری دید و استفاده از یک VARIMA مناسب به نظر می‌رسد. گاهی موارد به وجود یک اثر فصلی در مدل ظنین می‌شویم. برای مثال مدل حجم ترافیک روزانه راه‌ها را در نظر بگیرید.به سادگی مشاهده می‌شود که تعطیلات آخر هفته داده‌های متفاوتی از دیگر ایام هفته نشان می‌دهد.در این موارد به نظر درست تر می‌آید که به جای استفاده از مدلARIMA با درجه AR یا MA بزرگتر از مدل SARIMA (ARIMA فصلی) استفاده شود.اگر فکر می‌کنیم سری زمانی ممکن است وابستگی بلند مدت از خود نشان دهد در اینصورت پارامترd می‌تواند با مقادیر غیر صحیح جایگزین شود که در اینصورت به مدل ARIMA نسبی(FARIMA یا ARFIMA) گفته می‌شود.

همچنین ببینید[ویرایش]

مراجع[ویرایش]

  • Mills، Terence C. (۱۹۹۰) Time Series Techniques for Economists.

Cambridge University Press

  • Percival، Donald B. and Andrew T. Walden. (۱۹۹۳) Spectral Analysis

for Physical Applications. Cambridge University Press.

لینک‌های دیگر[ویرایش]

for "seasonally adjusted" data (programs، docs، and papers here)]