خودهمبستگی

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو
نمودار نشان دهنده 100 عدد تصادفی با یک تابع مثلثاتی "پنهان" و خود همبستگی (correlogram) از سری های پایین.

خود همبستگی، همبستگی متقابل یک سیگنال با خودش است. بطور غیر رسمی، خود همبستگی، همسانی بین مشاهدات به عنوان تابعی از زمان جدایی بین آنها میباشد. این مفهوم، یک ابزار ریاضی برای یافتن الگوهای تکراری مانند حضور یک سیگنال تناوبی است که تحت نویز پوشانده شده است، و یا شناسایی فرکانس اساسی گم شده در سیگنال ضمنی فرکانس های هارمونیک. از خود همبستگی، اغلب در پردازش سیگنال برای تحلیل توابع یا مجموعه ای از مقدارها از جمله حوزه زمان سیگنالها استفاده می شود.

تعریف[ویرایش]

زمینه‌های مختلف مطالعه، تعاریف متفاوتی از خود همبستگی ارائه می‌دهند و هیچیک از این تعاریف، یکسان نیستند. در بعضی از زمینه‌ها، خود همبستگی را می‌توان به جای اتوکوواریانس بکار برد.

آمار[ویرایش]

در آمار، خود همبستگی یک فرایند تصادفی همبستگی بین مقدارهای فرایند در نقاط مختلف زمان را به عنوان تابع دو زمانه یا تفاضل زمانی توصیف می‌کند. اگر X فرایندی تکرارپذیر باشد و i نقطه‌ای از زمان بعد از آغاز فرایند (i ممکن است عدد صحیح برای فرایندی با گسستگی زمان یا عدد حقیقی برای فرایندی با پیوستگی زمان باشد). بنابراین Xi مقدار (یا تحقق) تولید شده بوسیله اجرای فرایند داده شده در زمان i است. فرض کنید فرایند، برای میانگین μi و واریانس σ۲i برای همه زمانهای i تعریف شده است. بنابراین تعریف خود همبستگی بین هر دو زمان s و t عبارت است از:


R(s,t) = \frac{\operatorname{E}[(X_t - \mu_t)(X_s - \mu_s)]}{\sigma_t\sigma_s}\, ,

که "E" عملگر مقدار مورد انتظار است. توجه کنید که این بیان برای همه فرایندها یا سریهای زمانی، خوش تعریف نیست، چون ممکن است واریانس برابر صفر (برای یک فرایند ثابت) یا بینهایت باشد. اگر تابع R خوش تعریف باشد، مقدار آن باید در محدوده [۱،۱-] قرار گیرد، که ۱ نشان دهنده همبستگی کامل و ۱- نشان دهنده ضد همبستگی کامل است. اگر Xt یک فرایند ثابت مرتبه دوم باشد بنابراین میانگین μ و واریانس σ۲ مستقل از زمان هستند و خود همبستگی فقط به تفاضل t و s بستگی دارد: همبستگی فقط به فاصله زمانی بین دو مقدار بستگی دارد اما به موقعیت آنها در زمان بستگی ندارد. این موضوع بیان می کند که این خود همبستگی می تواند به عنوان تابع تاخیر زمانی بیان شود، و همچنین باید یک تابع زوج از τ = s − t باشد.


R(\tau) = \frac{\operatorname{E}[(X_t - \mu)(X_{t+\tau} - \mu)]}{\sigma^2}\, ,

و با توجه به زوج بودن این تابع، می توانیم بگوییم:


R(\tau) = R(-\tau).\,

این عمل مشترک در برخی رشته ها به غیر از آمار و تحلیل سریهای زمانی، برای نرمال کردن به وسیله σ۲ و استفاده از "خود همبستگی" مترادف با "اتو کوواریانس" است. به هر حال، نرمال کردن به دو دلیل اهمیت دارد: به علت تفسیر خود همبستگی به عنوان یک همبستگی که مقدار بدون مقیاس "قدرت وابستگی آماری" را فراهم می کند و چون نرمال کردن روی خصوصیات آماری خود همبستگی های برآورد شده موثر است.

پردازش سیگنال[ویرایش]

در پردازش سیگنال، تعریف بالا اغلب بدون نرمال کردن استفاده می شود.یعنی بدون کسر میانگین و تقسیم بر واریانس. وقتی تابع خود همبستگی به وسیله میانگین و واریانس نرمال شده است، گاهی اوقات به ضریب خودهمبستگی مربوط می شود.[۱]

برای سیگنال معین f(t)، خودهمبستگی پیوسته R_{ff}(\tau) غالباً به صورت انتگرال همبستگی متقابل پیوسته f(t) با خودش، با تاخیر \tau تعریف می شود:

R_{ff}(\tau) = (f(t) * \overline{f}(-t))(\tau) = \int_{-\infty}^\infty f(t+\tau)\overline{f}(t)\, {\rm d}t = \int_{-\infty}^\infty f(t)\overline{f}(t-\tau)\, {\rm d}t

که \overline{f} مزدوج مختلط و * پیچیدگی را نشان می دهند. برای یک تابع حقیقی،\overline{f} = f. خود همبستگی گسسته R با تاخیر j برای یک سیگنال گسسته x_n بصورت زیر است:

R_{xx}(j) = \sum_n x_n\,\overline{x}_{n-j}.

تعریف های بالا برای سیگنالهایی کاربرد دارند که دو بار انتگرال پذیرند یا دو بار جمع پذیرند. برای سیگنالهایی با فرایندهای تصادفی با روند ثابت، خود همبستگی بر اساس مقادیر مورد انتظار تعریف می شوند:

R_{ff}(\tau) = \operatorname{E}\left[f(t)\overline{f}(t-\tau)\right]
R_{xx}(j) = \operatorname{E}\left[x_n\,\overline{x}_{n-j}\right].

برای فرایندهایی که ثابت نیستنداین روابط، توابعی از t و n نیز خواهند بود. برای فرایندهایی که ارگودیک نیز هستند، امید می تواند توسط حد یک میانگین زمانی جایگزین شود. خود همبستگی یک فرایند ارگودیک گاهی به صورت زیر تعریف می شود[۱]:

R_{ff}(\tau) = \lim_{T \rightarrow \infty} \frac{1}{T} \int_0^T f(t+\tau)\overline{f}(t)\, {\rm d}t
R_{xx}(j) = \lim_{N \rightarrow \infty} \frac{1}{N} \sum_{n=0}^{N-1}x_n\,\overline{x}_{n-j}.

این تعاریف این مزیت را دارند که برای توابع متناوب نتایج تک پارامتری خوش تعریف معقولی می دهند، حتی وقتی این توابع، خروجی فرایندهای ارگودیک ثابت نیستند. سیگنالهایی که همیشه میتوانند به وسیله تحلیل یک تابع خود همبستگی کوتاه مدت اجرا شوند (برای یک فرایند وابسته، به تبدیل فوریه کوتاه مدت نگاه کنید) خود همبستگی چند بعدی بطور مشابه تعریف شده است. برای مثال، در سه بعد، خود همبستگی یک سیگنال گسسته دوبار جمع پذیر عبارت است از:

R(j,k,\ell) = \sum_{n,q,r} x_{n,q,r}\,x_{n-j,q-k,r-\ell}.

وقتی مقدارهای میانگین از سیگنالها کسر می شوندقبل از محاسبه یک تابع خود همبستگی، تابع نتیجه معمولاً یک تابع کوواریانس نامیده می شود.

خصوصیات[ویرایش]

در ادامه، تنها خصوصیات خود همبستگی های تک بعدی را شرح خواهیم داد، چون بیشتر خصوصیات به آسانی از یک مورد تک بعدی به موارد چند بعدی قابل تبدیل است.

  • ویژگی اساسی خود همبستگی، تقارن است، R(i) = R(-i)، که اثبات آن از تعریف به سادگی به دست می آید. در موارد پیوسته، خود همبستگی یک تابع زوج است.
R_f(-\tau) = R_f(\tau)\,
وقتی f یک تابع حقیقی و خود همبستگی یک تابع هرمیتی است.
R_f(-\tau) = R_f^*(\tau)\,
وقتی f یک تابع مختلط است.
  • تابع خود همبستگی پیوسته در مبدا به قله خود می رسد، که در آن یک مقدار حقیقی را می دهد. برای مثال برای هر تاخیر \tau، |R_f(\tau)| \leq R_f(0). این، یک نتیجه نامساوی کوشی شوارتز است. همین نتیجه در مورد گسسته نیز بدست می آید.
  • خود همبستگی یک تابع متناوب، متناوب است با همان دوره تناوب.
  • خود همبستگی مجموع دو تابع کاملاً غیر همبسته (همبستگی متقابل برای همه \tauها صفر است)، برابر مجموع خود همبستگی های هر تابع به طور جداگانه است.
  • چون خود همبستگی نوع خاصی از همبستگی متقابل است، همه خصوصیات همبستگی متقابل را حفظ می کند.
  • خود همبستگی یک سیگنال نویز سفید با پیوستگی زمانی، یک پیک شدید خواهد داشت (بوسیله یک تابع دلتای دیراک نشان داده شده) در \tau=0 و برای همه \tauهای دیگر مطلقاً صفر خواهد بود.
  • قضیه کینچین-وینر، تابع خود همبستگی را به چگالی طیفی توان به وسیله تبدیل فوریه مرتبط می سازد:
R(\tau) = \int_{-\infty}^\infty S(f) e^{j 2 \pi f \tau} \, {\rm d}f
S(f) = \int_{-\infty}^\infty R(\tau) e^{- j 2 \pi f \tau} \, {\rm d}\tau.
  • برای توابع با مقدار حقیقی، تابع خود همبستگی متقارن یک تبدیل متقارن حقیقی دارد. بنابراین قضیه وینر-کینچین می تواند تنها بر حسب کسینوس حقیقی دوباره بیان شود:
R(\tau) = \int_{-\infty}^\infty S(f) \cos(2 \pi f \tau) \, {\rm d}f
S(f) = \int_{-\infty}^\infty R(\tau) \cos(2 \pi f \tau) \, {\rm d}\tau.

محاسبه کارایی[ویرایش]

برای اطلاعات بیان شده به عنوان یک ترکیب گسسته، لازم است خود همبستگی با کارایی بالا محاسبه کنیم. هنکامی که الگوریتم brute force مرتبه n^2 است، چندین الکوریتم کارا وجود دارد که می تواند خود همبستگی را در مرتبه n\,\log(n) محاسبه کند. برای مثال، قضیه وینر-کیچین، محاسبه خود همبستگی از داده های خام X(t) با دو تبدیل سریع فوریه (FFT)را ممکن می سازد.[۲]

S(f) = F_R(f) {F_R}^*(f)
R(\tau) = \text{IFFT}(S(f))

که IFFT، معکوس FFT را نشان می دهد، * نشان دهنده مزدوج مختلط است. یک همبستگی چندگانه \tau می تواند با استفاده از محاسبه brute force برای مقدار های پایین \tau اجرا شود، و سپس تدریجاً استخراج داده های X(t) با یک چگالی لگاریتمی برای محاسبه مقدارهای بزرگتر، با همان کارایی n\,\log(n) اما با حافظه مورد نیاز کمتر.

برآورد[ویرایش]

برای یک فرایند گسسته به طول n که به صورت \{X_1,\,X_2,\,\ldots,\,X_n\} با میانگین و واریانس معلوم، ین تخمین خود همبستگی به صورت زیر بدست می آید:

 \hat{R}(k)=\frac{1}{(n-k) \sigma^2} \sum_{t=1}^{n-k} (X_t-\mu)(X_{t+k}-\mu)

برای هر عدد صحیح مثبت k<n. وقتی میانگین صحیح \mu و واریانس \sigma معلومند، این براورد، بدون تورش است. اگر میانگین و واریانس فرایند نامعلوم باشند چند احتمال وجود دارد:

  • اگر \mu و \sigma به وسیله فرمول استاندارد برای میانگین نمونه و واریانس نمونه جایگزین شده باشد، این براورد تورش دار است.
  • یک براورد بر اساس periodogram، n-k در فرمول بالا را با n جایگزین می کند. این براورد همیشه تورش دار است، به هر حال معمولاً میانگین مربعات خطای کمتری دارد[۳][۴]
  • احتمال دیگر از رفتار دو بخش از داده های \{X_1,\,X_2,\,\ldots,\,X_{n-k}\} و \{X_{k+1},\,X_2,\,\ldots,\,X_n\} به طور جداگانه و محاسبه میانگین های نمونه و/یا واریانس های نمونه برای استفاده در تعریف براورد، مشتق می شود.

مزیت براوردهای نوع اخیر این است که مجموعه خود همبستگی های براورد شده، به عنوان تابعی از k، به صورت تابعی است که دارای خود همبستگی معتبر است به این معنی که می توان فرایند تئوریکی تعریف کرد که دقیقاً همان خود همبستگی را داشته باشد. براوردهای دیگر می توانند از این مسئله رنج ببرند که اگر برای محاسبه واریانس یک ترکیب خطی از Xها استفاده شوند، واریانس محاسبه شده ممکن است منفی بدست آید.

تحلیل رگرسیون[ویرایش]

در تحلیل رگرسیون داده های سری زمانی، خود همبستگی خطاها یک مشکل است. خود همبستگی خطاهایی که غیر قابل مشاهده اند، می تواند به طور کلی بخاطر تولید خود همبستگی در residualهای قابل مشاهده نمایان شود. (خطاها در اقتصاد سنجی، "عناصر خطا" نامیده می شوند.) خود همبستگی، فرض حداقل مربعات معمولی (OLS) که عناصر خطا ناهمبسته اند را نقض می کند. زمانی که براورد ضرایب OLS بدون تورش است، خطاهای استاندارد وقتی خود همبستگی خطاها در lagهای پایین مثبت است، کمتر از مقدار واقعی تخمین زده می شود (و t-مقدار بیشتر از مقدار واقعی). آزمون مرسوم برای وجود خود همبستگی مرتبه اول، آماره دوربین-واتسون است، یا اگر متغیرهای توضیح دهنده شامل متغیر وابسته لنگی باشد، آزمون انعطاف پذیرتر برای پوشش خود همبستگی مراتب بالاتر و برای اینکه آیا رگرسورهای شامل متغیر وابسته لنگی قابل اجراست یا نه، تست براش-گادفری است. این شامل یک رگرسیون کمکی است، در جایی که residualهای به دست آمده از برآورد مدل مورد علاقه روی (الف) رگرسور اصلی و (ب) k باقی‌مانده لنگی، رگرس شده اند، که k مرتبه آزمون می باشد. ساده ترین تفسیر آماره آزمون از این رگرسیون کمکی، TR۲ است که T اندازه نمونه و R۲ ضریب تعیین هستند. تحت فرضیه صفر (عدم وجود خود همبستگی) این آماره به طور مجانبی، توزیع \chi^2 با k درجه آزادی دارد. پاسخ به خود همبستگی غیر صفر شامل حداقل مربعات تعمیم یافته و تخمین زن Newey-West HAC (واریانس ناهمسانی و خود همبستگی سازگار) می باشد.[۵]

کاربردها[ویرایش]

بعضی از کاربردهای خود همبستگی به شرح زیر است:

  • یک کاربرد خود همبستگی، اندازه گیری طیف نوری و اندازه گیری پالس های نوری خیلی کوتاه مدت تولید شده به وسیله لیزرها است.هردو با استفاده از autocorrelator اپتیکال انجام می شوند.
  • برای اندازه گیری توزیع اندازه ذرات micelles یا ذرات بسیار ریز معلق در مایع. یک لیزر به مخلوط می تابانند که با حرکت ذرات در ارتباط است.

خود همبستگی سیگنال عکسی از سرعت انتشار ذرات می دهد. از این، ویسکوزیته مایع و اندازه های ذرات محاسبه می شود.

  • در پردازش سیگنال، خود همبستگی می تواند در مورد رویدادهای تکرار شونده مانند ضربان موسیقی (برای مثال، برای تعیین گام)یا فرکانس پولسار باشد، اگرچه نمی‌تواند موقعیت را در زمان ضربه بگوید. همچنین می تواند برای براورد گام تن موسیقی استفاده شود.
  • در اپتیک، خود همبستگی نرمال شده و همبستگی متقابل، درجه انسجام یک فیلد الکترومغناطیس را می دهد.
  • در ضبط موسیقی، خود همبستگی به عنوان یک الگوریتم تعیین گام قبل از پردازش صوتی، به عنوان یک اثر اعوجاج، یا برای حذف اشتباهات و خطاهای نامطلوب به کار می رود.[۶]
  • خود همبستگی در فضا نسبت به زمان، از طریق تابع Patterson، به وسیله انکسار X-ray برای کمک به بهبود "اطلاعات فاز فوریه" روی موقعیت های غیر قابل دسترس اتم تنها از طریق پراش به کار می رود.
  • در آمار، خود همبستگی فضایی بین موقعیت های نمونه به براورد مقدار میانگین عدم قطعیت وقتی نمونه گیری از یک جامعه نا متجانس باشد، کمک می کند.
  • در داده های پانل، خود همبستگی فضایی به همبستگی یک متغیر با خودش در تمام فضا اشاره دارد.

پیوست به بیرون[ویرایش]

منابع[ویرایش]

  1. ۱٫۰ ۱٫۱ Patrick F. Dunn, ISBN 0-07-282538-3
  2. Box, G. E. P., G. M. Jenkins, and G. C. Reinsel
  3. M.B. Priestley
  4. Percival,Donald B.,Andrew T. 0-521-43541-2 pp190--195
  5. Christopher F. Baum
  6. Tyrangiel, Josh
  • Patrick F. Dunn، Measurement and Data Analysis for Engineering and Science، New York: McGraw–Hill، ۲۰۰۵ ISBN ۰-۰۷-۲۸۲۵۳۸-۳
  • Box، G. E. P.، G. M. Jenkins، and G. C. Reinsel. Time Series Analysis: Forecasting and Control. ۳rd ed. Upper Saddle River، NJ: Prentice-Hall، ۱۹۹۴
  • Spectral analysis and time series، M.B. Priestley (London، New York : Academic Press، ۱۹۸۲)
  • Percival، Donald B.; Andrew T. Walden (۱۹۹۳). Spectral Analysis for Physical Applications: Multitaper and Conventional Univariate Techniques. Cambridge University Press. ISBN ۰-۵۲۱-۴۳۵۴۱-۲.
  • Christopher F. Baum (۲۰۰۶). An Introduction to Modern Econometrics Using Stata. Stata Press. ISBN ۱۵۹۷۱۸۰۱۳۰. http://books.google.com/?id=acxtAylXvGMC&pg=PA141&dq=newey-west-standard-errors+generalized-least-squares.
  • Tyrangiel، Josh (۲۰۰۹-۰۲-۰۵). "Auto-Tune: Why Pop Music Sounds Perfect". Time Magazine. http://www.time.com/time/magazine/article/0,9171,1877372,00.html.