خودهمبستگی

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به ناوبری پرش به جستجو
نمودار نشان دهنده 100 عدد تصادفی با یک تابع مثلثاتی "پنهان" و خود‌همبستگی (correlogram) از سری‌های پایین.

خودهمبستگی، همبستگیِ متقابل سیگنال (داده‌ها) با خودش است. به‌طور غیررسمی، خودهمبستگی، همسانیِ (شباهت) سیگنال (داده‌ها) با نسخۀ شیفت‌یافتۀ خود است.

خودهمبستگی، ابزاری ریاضی برای یافتن الگوهای تکراری (مانند حضور یک سیگنال متناوب در نویز)، یا شناسایی یک فرکانس مشخص در سیگنالی دارای فرکانس‌های هارمونیک است. از خودهمبستگی، اغلب در پردازش سیگنال برای تحلیل توابع یا داده‌ها از جمله تحلیل حوزه زمان سیگنال‌ها استفاده می‌شود.

آمار[ویرایش]

در آمار، خودهمبستگی یک فرایند تصادفی، همبستگیِ مقادیر فرایند در زمان‌های مختلف را به عنوان تابعی دو-متغیّره (زمان و شیفت زمانی)، یا تابعی تک‌متغیّره (شیفت زمانی) توصیف می‌کند. اگر X فرایندی تکرارپذیر باشد و i نقطه‌ای از زمان بعد از آغاز فرایند (i عددی صحیح برای فرایند زمان‌گسسته یا عددی حقیقی برای فرایند زمان‌پیوسته) است. بنابراین Xi مقدار (یا تحقق) فرایند در زمان i است.

فرض کنیم فرایند، با میانگین μi و واریانس σ۲i برای همه زمان‌های i تعریف شده‌است. خودهمبستگی فرایند در دو زمان s و t عبارت است از:

که "E" عملگر امید ریاضی (Expectation) است. این بیان برای همه فرایندها یا سری‌های زمانی، خوش‌تعریف نیست، چون ممکن است واریانس برابر صفر (برای یک فرایند ثابت) یا بینهایت باشد. اگر تابع R خوش‌تعریف باشد، مقدار آن باید در محدوده [۱،۱-] قرار گیرد، که ۱ نشان دهنده همبستگی کامل و ۱- نشان دهنده ضدهمبستگی کامل است. اگر Xt یک فرایند ایستا (Stationary) باشد، میانگین μ و واریانس σ۲ مستقل از زمان هستند و خودهمبستگی فقط به تفاضل t و s بستگی دارد نه به مقدار مطلق آن‌ها. این موضوع بیان می‌کند که خودهمبستگی یک فرایند ایستا می‌تواند به عنوان تابعی از تأخیر (شیفت) زمانی بیان شود، و همچنین باید یک تابع زوج از τ = s − t باشد.

و با توجه به زوج بودن این تابع، می‌توانیم بگوییم:

این عمل مشترک در برخی رشته‌ها به غیر از آمار و تحلیل سری‌های زمانی، برای نرمال کردن به وسیله σ۲ و استفاده از "خود‌همبستگی" مترادف با "اتو کوواریانس" است. به هر حال، نرمال کردن به دو دلیل اهمیت دارد: به علت تفسیر خود‌همبستگی به عنوان یک همبستگی که مقدار بدون مقیاس "قدرت وابستگی آماری" را فراهم می‌کند و چون نرمال کردن روی خصوصیات آماری خود‌همبستگی‌های برآورد شده مؤثر است.

پردازش سیگنال[ویرایش]

در پردازش سیگنال، تعریف بالا اغلب بدون نرمال کردن استفاده می‌شود. یعنی بدون کسر میانگین و تقسیم بر واریانس. وقتی تابع خود‌همبستگی به وسیله میانگین و واریانس نرمال شده‌است، گاهی اوقات به ضریب خودهمبستگی مربوط می‌شود.[۱]

برای سیگنال معین (deterministic) ، خودهمبستگی پیوسته غالباً به صورت انتگرال همبستگی متقابل با نسخه تأخیریافته خودش به مقدار تعریف می‌شود:

که مزدوج مختلط و عمل کانوُلوشن است. برای یک تابع حقیقی،.

خود‌همبستگی گسسته R با تاخیر j برای یک سیگنال گسسته به صورت زیر است:

تعریف‌های بالا برای سیگنالهایی کاربرد دارند که دو بار انتگرال پذیرند یا دو بار جمع پذیرند.

برای فرایندهای ایستا، خود‌همبستگی بر اساس مقادیر مورد انتظار تعریف می‌شوند:

برای فرایندهایی که ایستا نیستند این روابط، توابعی از t و n نیز خواهند بود. برای فرایندهایی که ارگودیک نیز هستند، امید می‌تواند توسط حد یک میانگین زمانی جایگزین شود. خود‌همبستگی یک فرایند ارگودیک گاهی به صورت زیر تعریف می‌شود[۱]:

این تعاریف، برای فرایندهای متناوب، نتایج تک پارامتری خوش‌تعریف معقولی می‌دهند، حتی وقتی فرایند ارگودیک ایستا نیست.

سیگنالهایی که همیشه میتوانند به وسیله تحلیل یک تابع خود‌همبستگی کوتاه مدت اجرا شوند (برای یک فرایند وابسته، به تبدیل فوریه کوتاه مدت نگاه کنید) خود‌همبستگی چند بعدی بطور مشابه تعریف شده‌است. برای مثال، در سه بعد، خود‌همبستگی یک سیگنال گسسته دو بار جمع پذیر عبارت است از:

وقتی مقدارهای میانگین از سیگنالها کسر می‌شوند قبل از محاسبه یک تابع خود‌همبستگی، تابع نتیجه معمولاً یک تابع کوواریانس نامیده می‌شود.

خصوصیات[ویرایش]

در ادامه، تنها خصوصیات خود‌همبستگی‌های تک بعدی شرح داده می‌شود، چون بیشتر خصوصیات به آسانی از یک مورد تک بعدی به موارد چند بعدی قابل تبدیل است.

  • ویژگی اساسی خود‌همبستگی، تقارن است، ، که اثبات آن از تعریف به سادگی به دست می‌آید. در موارد پیوسته، خود‌همبستگی یک تابع زوج است.
وقتی f یک تابع حقیقی و خود‌همبستگی یک تابع هرمیتی است.
وقتی f یک تابع مختلط است.
  • تابع خود‌همبستگی پیوسته در مبدأ به قله خود می‌رسد، که در آن یک مقدار حقیقی را می‌دهد. برای مثال برای هر تاخیر ، . این، یک نتیجه نامساوی کوشی-شوارتز است. همین نتیجه در مورد گسسته نیز بدست می‌آید.
  • خود‌همبستگی یک تابع متناوب، متناوب است با همان دوره تناوب.
  • خود‌همبستگی مجموع دو تابع کاملاً غیر همبسته (همبستگی متقابل برای همه ها صفر است)، برابر مجموع خود‌همبستگی‌های هر تابع به‌طور جداگانه است.
  • چون خود‌همبستگی نوع خاصی از همبستگی متقابل است، همه خصوصیات همبستگی متقابل را حفظ می‌کند.
  • خود‌همبستگی یک سیگنال نویز سفید با پیوستگی زمانی، یک پیک شدید خواهد داشت (بوسیله یک تابع دلتای دیراک نشان داده شده) در و برای همه های دیگر مطلقاً صفر خواهد بود.
  • قضیه کینچین-وینر، تابع خود‌همبستگی را به چگالی طیفی توان به وسیله تبدیل فوریه مرتبط می‌سازد:
  • برای توابع با مقدار حقیقی، تابع خود‌همبستگی متقارن یک تبدیل متقارن حقیقی دارد. بنابراین قضیه وینر-کینچین می‌تواند تنها بر حسب کسینوس حقیقی دوباره بیان شود:

محاسبه کارایی[ویرایش]

برای داده‌های زمان‌گسسته لازم است خود‌همبستگی با کارایی بالا محاسبه کنیم. هنگامی‌که الگوریتم brute force مرتبه است، چندین الگوریتم کارا وجود دارد که می‌تواند خود‌همبستگی را در مرتبه محاسبه کند. برای مثال، قضیه وینر-کیچین، محاسبه خود‌همبستگی از داده‌های خام با دو تبدیل سریع فوریه (FFT)را ممکن می‌سازد.[۲]

که IFFT، معکوس FFT را نشان می‌دهد، * نشان دهنده مزدوج مختلط است. یک همبستگی چندگانه می‌تواند با استفاده از محاسبه brute force برای مقدارهای پایین اجرا شود، و سپس تدریجاً استخراج داده‌های با یک چگالی لگاریتمی برای محاسبه مقدارهای بزرگتر، با همان کارایی اما با حافظه مورد نیاز کمتر.

برآورد[ویرایش]

برای یک فرایند گسسته به طول n که به صورت با میانگین و واریانس معلوم، تخمین خود‌همبستگی به صورت زیر بدست می‌آید:

برای هر عدد صحیح مثبت . وقتی میانگین صحیح و واریانس معلومند، این برآورد، بدون تورش است. اگر میانگین و واریانس فرایند نامعلوم باشند چند احتمال وجود دارد:

  • اگر و به وسیله فرمول استاندارد برای میانگین نمونه و واریانس نمونه جایگزین شده باشد، این برآورد تورش دار است.
  • یک برآورد بر اساس periodogram، در فرمول بالا را با جایگزین می‌کند. این برآورد همیشه تورش دار است، به هر حال معمولاً میانگین مربعات خطای کمتری دارد[۳][۴]
  • احتمال دیگر از رفتار دو بخش از داده‌های و به‌طور جداگانه و محاسبه میانگین‌های نمونه و/یا واریانس‌های نمونه برای استفاده در تعریف برآورد، مشتق می‌شود.

مزیت این برآوردها این است که مجموعه خود‌همبستگی‌های برآوردشده، به عنوان تابعی از k، به صورت تابعی است که دارای خود‌همبستگی معتبر است به این معنی که می‌توان فرایند تئوریکی تعریف کرد که دقیقاً همان خود‌همبستگی را داشته باشد. برآوردهای دیگر می‌توانند از این مسئله رنج ببرند که اگر برای محاسبه واریانس یک ترکیب خطی از Xها استفاده شوند، واریانس محاسبه شده ممکن است منفی بدست آید.

تحلیل رگرسیون[ویرایش]

در تحلیل رگرسیون داده‌های سری زمانی، خود‌همبستگی خطاها، یک مشکل است. خود‌همبستگی خطاهایی که غیرقابل مشاهده اند، می‌تواند به‌طور کلی بخاطر تولید خود‌همبستگی در مانده‌های قابل مشاهده نمایان شود. (خطاها در اقتصاد سنجی، "عناصر خطا" نامیده می‌شوند.) خود‌همبستگی، فرض حداقل مربعات معمولی (OLS) که عناصر خطا ناهمبسته‌اند را نقض می‌کند. زمانی که برآورد ضرایب OLS بدون تورش است، خطاهای استاندارد وقتی خود‌همبستگی خطاها در lagهای پایین مثبت است، کمتر از مقدار واقعی تخمین زده می‌شود (و t-مقدار بیشتر از مقدار واقعی). آزمون مرسوم برای وجود خود‌همبستگی مرتبه اول، آماره دوربین-واتسون است، یا اگر متغیرهای توضیح دهنده شامل متغیر وابسته لنگی باشد، آزمون انعطاف‌پذیرتر برای پوشش خود‌همبستگی مراتب بالاتر و برای اینکه آیا رگرسورهای شامل متغیر وابسته لنگی قابل اجراست یا نه، تست براش-گادفری است. این شامل یک رگرسیون کمکی است، در جایی که residualهای به دست آمده از برآورد مدل مورد علاقه روی (الف) رگرسور اصلی و (ب) k باقی‌مانده لنگی، رگرس شده اند، که k مرتبه آزمون می‌باشد. ساده‌ترین تفسیر آماره آزمون از این رگرسیون کمکی، TR۲ است که T اندازه نمونه و R۲ ضریب تعیین هستند. تحت فرضیه صفر (عدم وجود خود‌همبستگی) این آماره به‌طور مجانبی، توزیع با k درجه آزادی دارد. پاسخ به خود‌همبستگی غیر صفر شامل حداقل مربعات تعمیم یافته و تخمین زن Newey-West HAC (واریانس ناهمسانی و خود‌همبستگی سازگار) می‌باشد.[۵]

کاربردها[ویرایش]

بعضی از کاربردهای خود‌همبستگی به شرح زیر است:

  • اندازه‌گیری طیف نوری و اندازه‌گیری پالس‌های نوری خیلی کوتاه مدت تولید شده به وسیله لیزرها است. هردو با استفاده از autocorrelator اپتیکال انجام می‌شوند.
  • برای اندازه‌گیری توزیع اندازه ذرات micelles یا ذرات بسیار ریز معلق در مایع. یک لیزر به مخلوط می تابانند که با حرکت ذرات در ارتباط است.
  • در پردازش سیگنال، خود‌همبستگی می‌تواند در رویدادهای تکرار شونده مانند ضربان موسیقی (برای مثال، برای تعیین گام)یا فرکانس پولسار باشد، اگرچه نمی‌تواند موقعیت را در زمان ضربه بگوید. همچنین می‌تواند برای برآورد گام تن موسیقی استفاده شود.
  • در اپتیک، خود‌همبستگی نرمال شده و همبستگی متقابل، درجه انسجام یک فیلد الکترومغناطیس را می‌دهد.
  • در ضبط موسیقی، خود‌همبستگی به عنوان یک الگوریتم تعیین گام قبل از پردازش صوتی، به عنوان یک اثر اعوجاج، یا برای حذف اشتباهات و خطاهای نامطلوب به کار می‌رود.[۶]
  • خود‌همبستگی در فضا نسبت به زمان، از طریق تابع Patterson، به وسیله انکسار X-ray برای کمک به بهبود "اطلاعات فاز فوریه" روی موقعیت‌های غیرقابل دسترس اتم تنها از طریق پراش به کار می‌رود.
  • در آمار، خود‌همبستگی فضایی بین موقعیت‌های نمونه به برآورد مقدار میانگین عدم قطعیت وقتی نمونه‌گیری از یک جامعه نا متجانس باشد، کمک می‌کند.
  • در داده‌های پانل، خود‌همبستگی فضایی به همبستگی یک متغیر با خودش در تمام فضا اشاره دارد.

پیوست به بیرون[ویرایش]

منابع[ویرایش]

  1. ۱٫۰ ۱٫۱ Patrick F. Dunn, ISBN 0-07-282538-3
  2. Box, G. E. P., G. M. Jenkins, and G. C. Reinsel
  3. M.B. Priestley
  4. Percival,Donald B.,Andrew T. 0-521-43541-2 pp190--195
  5. Christopher F. Baum
  6. Tyrangiel, Josh

|}