آمار توصیفی

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به ناوبری پرش به جستجو

موضوع آمار توصیفی (Descriptive statistics) تنظیم و طبقه‌بندی داده‌ها، نمایش ترسیمی، و محاسبهٔ مقادیری از قبیل نما، میانگین، میانه و ... می‌باشد که حاکی از مشخصات

یکایک اعضای جامعهٔ مورد بحث است. در آمار توصیفی اطلاعات حاصل از یک گروه، همان گروه را توصیف می‌کند و اطلاعات به دست آمده به دسته‌جات مشابه تعمیم داده

نمی‌شود. به‌طور کلی از سه روش در آمار توصیفی برای خلاصه‌سازی داده‌ها استفاده می‌شود:

  • استفاده از جداول
  • ااستفاده از نمودار
  • محاسبه مقادیری خاص که نشان‌دهنده خصوصیات مهمی از داده‌ها باشند.

از نظر تاریخی می‌توان گفت از لحظه ای که شمارش اختراع شد علم آمار نیزگسترش پیدا کرد.[۱] آمار توصیفی فقط مختص نمونه است و نمیتوان از آن برای کل جامعه آماری استفاده کرد

روش های امار توصیفی[۲][ویرایش]

تشکیل جدول توزیع فراوانی[ویرایش]

توزیع فراوانی عبارت است از سازمان دادن داده‌ها یا مشاهدات به صورت طبقات همراه با فراوانی هر طبقه. برای تشکیل یک جدول توزیع فراوانی باید دامنه تغییرات ، تعداد طبقات و حجم طبقات توسط فرمولهای مربوطه محاسبه شده و سپس اقدام به نوشتن جدول توزیع در دو ستون X (ستون طبقات) و F (فراوانی طبقات) شود. پس از این مرحله در صورت تمایل یا لزوم پژوهشگر می‌تواند شاخص‌های دیگری نظیر فراوانی تراکمی‌ ، فراوانی تراکمی‌ درصدی را محاسبه نماید. تشکیل جدول توزیع فراوانی یک روش اقتصادی و در عین حال آسان برای نمایش انبوهی از داده‌های نامنظم است. اما در طبقه بندی کردن ، برخی از اطلاعات به علت خطای گروه بندی از دست می‌روند که در محاسبه شاخص های آماری نیز منعکس می‌شود. ولی مقدار آن ناچیز بوده و اشکال عمده‌ای ایفا نمی‌کند.

ترسیم نمودار[ویرایش]

یکی از نقاط ضعف نمایش داده‌ها به صورت جدول فراوانی عدم درک سریع اطلاعات جدول است. نمودارها ابزار مناسبی برای نمایش تصویری اطلاعات هستند. انواع مختلفی از نمودار وجود دارد که از جمله می‌توان به نمودار هیستوگرام ، نمودار ستونی ، نمودار چند ضلعی تراکمی ‌، نمودار دایره‌ای ، نمودار سریهای زمانی و …اشاره کرد.

محاسبه شاخصهای مرکزی[ویرایش]

در محاسبات آماری لازم است که ویژگیها و موقعیت کلی داده‌ها تعیین شود. برای این منظور شاخص‌های مرکزی محاسبه می‌شوند. شاخص‌های مرکزی در سه نوع نما (Mode) ، میانه (Median) و میانگین (Mean) هستند که هر یک کاربرد خاص خود را دارا می‌باشند. در تحقیقاتی که مقیاس اندازه گیری داده‌ها حداقل فاصله‌ای است میانگین بهترین شاخص است. ولی در تحقیقاتی که مقیاس اندازه گیری داده‌ها رتبه‌ای یا اسمی‌ است، میانه یا نما مورد استفاده قرار می‌گیرند.

محاسبه همبستگی[ویرایش]

همبستگي يعني تغيير در y چقدر بر روي تغيير بر x تاثير مي گذارد. به عبارت ديگر تغيير در يک متغير چقدر با تغيير در متغير ديگر هماهنگ است. مثلا تغيير در قد چقدر با تغيير در وزن هماهنگي دارد. در اين مثال بديهي است که همبستگي مثبت است. زيرا معمولا افراد قد بلندتر داراي وزن بيشتري مي باشند.

همبستگي را با ضريبي به نام ضريب همبستگي پيرسون اندازه گيري مي کنند که عددي بين صفر و يک است. هر چه مقدار همبستگي به عدد يک نزديک تر باشد، همبستگي بين دو متغير بيشتر است و هر چه به صفر نزديک تر باشد، همبستگي بالاتر خواهد بود. همبستگي برابر يک يعني رابطه خطي و صد درصدي. همبستگي مي تواند مثبت و يا منفي باشد.

تحقیقاتی وجود دارد که پژوهشگر می‌خواهد رابطه بین دو متغیر را تعیین کند و به همین منظور از روشهای همبستگی (Correlation) استفاده می‌کند. در محاسبه همبستگی ، نوع مقیاس اندازه گیری دخالت دارد و بطور کلی به دو دسته پارامتری و ناپارامتری تقسیم می‌شوند.

محاسبه همبستگی برای تحقیقات پارامتری : چنانچه دو متغیر در مقیاسهای فاصله یا نسبی اندازه گیری شده باشند، می‌توان برای تعیین رابطه بین آنها از ضریب همبستگی گشتاوری پیرسون استفاده کرد. ولی اگر در تمام مفروضات ضریب همبستگی پیرسون صادق نباشد، نمی‌توان از آنها استفاده کرد و به جای آن می‌توان از روشهای دیگری مانند ضریب همبستگی دو رشته‌ای ، دورشته‌ای و یا ضریب تتراکوریک استفاده کرد.
محاسبه همبستگی برای تحقیقات ناپارامتری : در تحقیقاتی که در سطح مقیاس‌های اسمی ‌و رتبه‌ای انجام می‌گیرد، باید از روش‌های دیگری برای محاسبه همبستگی بین دو متغیر استفاده کرد. برخی از این روشها عبارتند از : ضریب همبستگی فی (φ) ضریب کریمر (C) ، ضریب کپا (K) و ضریب لامبدا ، در تحقیقات اسمی ‌و ضریب همبستگی اسپرمن ، ضریب کندال و آماده گاما (G) برای تحقیقات ترتیبی.

رگراسیون و پیش بینی[ویرایش]

رگراسیون (Regression) روشی برای مطالعه سهم یک یا چند متغیر مستقل در پیش بینی متغیر وابسته است. از تحلیل رگراسیون هم در تحقیقات توصیفی (غیر آزمایشی) و هم در تحقیقات آزمایشی می‌توان استفاده کرد. با توجه به نوع تحقیق و متغیرهای آن روش متنوعی برای تحلیل رگراسیون وجود دارد که برخی از آنها عبارتند از : رگراسیون خطی (با سه راهبرد همزمان ، گام به گام ، سلسله مراتبی) ، رگراسیون انحنایی ، رگراسیون لوجیستیک و تحلیل کواریانس.

رگرسيون يعني بازگشت. يعني پيش بيني و بيان تغييرات يک متغير بر اساس اطلاعات متغير ديگر.

مثال: رابطه بين قد و وزن انسانها را در نظر بگيريد. همه مي دانيم که اين رابطه يک رابطه مستقيم رياضي و صد درصدي نيست که لزوما هر که قد بلندتري داشته باشد وزن بيشتري داشته باشد، اما مي توان گفت که با احتمال قابل قبولي افراد با قد بلندتر، وزن بيشتري نيز دارند. در اينجا پيش بيني وزن از روي قد و بيان ارتباط بين اين متغير با روش آماري رگرسيون خطي صورت مي پذيرد که اين رابطه را به صورت کمي به ما نشان مي دهد.

رگرسيون را با معادله رگرسيون بيان مي کنند. در مثال فوق معادله رگرسيون خطي مي تواند به صورت زير باشد:

متغير وزن = متغير قد * b + a

ترسيم اين خط پس از محاسبه ضرايب a و b ما را به خط رگرسيون مي رساند.

تحلیل داده‌های ماتریس کواریانس[ویرایش]

از جمله تحلیل‌های همبستگی ، تحلیل ماتریس کواریانس یا ماتریس همبستگی است. دو نوع از معروفترین این تحلیل‌ها عبارتند از : مدل تحلیل عاملی برای پی بردن به متغیرهای زیر بنایی یک پدیده در دو دسته اکتشافی و تاییدی و مدل معادلات ساختاری برای بررسی روابط علی بین متغیرها.

منابع[ویرایش]

مرکز پزوهشی آمارکده

  1. مرکز پزوهشی آمارکده
  2. «: آمار توصیفی». daneshnameh.roshd.ir. بازبینی‌شده در 2018-12-28.