تحلیل تناظر

از ویکی‌پدیا، دانشنامهٔ آزاد

تحلیل تناظر (انگلیسی: Correspondence analysis)یا میانگین متقابل یک تکنیک آماری چند متغیری است که توسط هرمان اوتو هارتلی پیشنهاد شد و بعدها توسط ژان‌پل بانژرسی توسعه داده شد. این موضوع به لحاظ مفهومی شبیه به آنالیز مولفه‌های اصلی است، اما به جای داده‌های پیوسته، با مطلق بکار می‌رود. در یک روش مشابه برای آنالیز مولفه‌های اصلی، ابزاری برای نمایش یاخلاصه کردن مجموعه‌ای از داده‌ها در شکل گرافیکی دو بعدی ارایه می‌شود. همه داده‌ها در همان مقیاس برای مرجع صدور CA در نظر گرفته می‌شوند، و در این روش به‌طور معادل ردیف‌ها و ستون‌ها را به‌طور معادل با هم مورد بررسی قرار می‌دهند. این مسئله به‌طور سنتی به جدول پیشایندی اعمال می‌شود - CA آزمون خی‌دوی پیرسون مربوط به این جدول را به عوامل متعامد تجزیه می‌کند. چون CA یک تکنیک توصیفی است، می‌تواند برای جداول به کار رود و مناسب بودن یا نبودن آمار را توصیف کند.

جزئیات[ویرایش]

مانند تحلیل مؤلفه‌های اصلی، آنالیز مولفه‌های متعامد برای هر مورد در یک جدول، مجموعه‌ای از امتیازها را ایجاد می‌کند. تحلیل تناظر در جدول احتمال، C، با اندازه انجام می‌شود که در آن m تعداد سطرها و n تعداد ستون‌ها است.

پیش پردازش[ویرایش]

از جدول C، یک مجموعه از وزن‌ها را برای ستون‌ها و ردیف‌ها (گاهی به نام توده‌ها) محاسبه می‌کنیم، که در آن وزن‌های ردیف به صورت زیر هستند:

و وزن‌های ستون به صورت زیرند:

که در آن تعداد کل مشاهدات است و بردار ستونی است که بعد مناسب دارند. سپس، یک جدول "S" را محاسبه کنید، که در آن 'C' با مجموع 'C' تقسیم می‌شود:

در نهایت، یک جدول 'M' از '' S '' و وزن‌ها به صورت زیر است:

تفسیر پیش پردازش[ویرایش]

بردارهای و به ترتیب احتمالات حاشیه‌ای ردیف و ستون را می‌دهند در حالی که توزیع احتمال مشترک ردیف‌ها وستون‌ها را بیان می‌کند و انحراف از استقلال را می‌دهد. این انحراف‌ها، به صورت توان دو یعنی مربع و به‌طور مناسب مقیاس بندی می‌شوند تا آزمون خی را روی C نشان دهند.

اجزاء متعارف[ویرایش]

سپس جدول M با تجزیه ارزش واحد منفرد تجزیه می‌شود که در آن بردارهای منحصر به فرد چپ و راست با وزن‌ها محدود می‌شوند. وزن‌ها، جداول مورب هستند:

و

که در آن اجزای قطری ، است و عناصر خارج از قطر همه ۰ هستند. سپس M از طریق تقسیم ارزش منحصربفرد عمومی تجزیه می‌شود:

جایی که

نمرات فاکتور[ویرایش]

نمرات فاکتور برای آیتم‌های ردیف جدول C به صورت زیر هستند:

و آیتم‌های ستونی به شکل زیرند:

.

برنامه‌های افزودنی و برنامه‌های کاربردی[ویرایش]

انواع مختلفی از CA مانند تجزیه و تحلیل مکاتبات تعیین شده (انگلیسی: Detrended correspondence analysis) و تجزیه و تحلیل مکاتبات کاننیکال (انگلیسی: Canonical correspondence analysis) در دسترس هستند. گسترش تحلیل مکاتبه به بسیاری از متغیرهای مطلق، تحلیل مکاتبات چندگانه نامیده می‌شود. انطباق تجزیه و تحلیل مکاتبات به مسئله تبعیض بر مبنای متغیرهای کیفی (یعنی، معادل آنالیز افتراقی برای داده‌های کیفی) تحلیل همخوانی مبین یا آنالیز تشخیصی خطی نامیده می‌شود. در علوم اجتماعی، تجزیه و تحلیل مکاتبات، و به ویژه بسط چندگانه، از طریق یک جامعه‌شناس فرانسوی به نام پیر بوردیو در خارج از فرانسه شناخته شد.

پیاده‌سازی[ویرایش]

  • سیستم تجسم داده اورنج شامل ماژول orngCA است.
  • سیستم آماری R شامل بسته‌های: MASS, ade4، ca, vegan, ExPosition و FactoMineR است که تجزیه و تحلیل مکاتبات و تجزیه و تحلیل مکاتبات متعدد را انجام می‌دهند.

جستارهای وابسته[ویرایش]

منابع[ویرایش]

https://en.wikipedia.org/wiki/Correspondence_analysis