آمار توصیفی چیست؟

آمار توصیفی چیست؟

در سالهای نه چندان دور، کانون توجه اصلی آمار، همانا خلاصه کردن یا توصیف داده های عددی بوده است. این عرصه، که امروزه فقط یکی از بخش‌های رشته آمار نوین است، آمار توصیفی Descriptive statisticsنامیده می‌شود.در واقع اگر بخواهیم تعریف ساده ای بیان کنیم میتوان گفت: به مجموعه روش‌هایی که برای سازماندهی و خلاصه کردن و توصیف اطلاعات به کار می‌رود،آمار توصیفی گفته میشود.
نرم افزار Spss به گونه ای طراحی شده است که می تواند طیف وسیعی از تحلیل های آماری را به سادگی و به سرعت انجام دهد.(جهت یادگیری با این نرم افزارلطفا مقاله آموزش تحلیل آماری باSpss را مطالعه نمایید. ).
قبل از آنالیز داده ها باید قدم های مقدماتی مشخصی برداشته شود. یک محقق وقتی با حجمی از اطلاعات کمی گرد آوری شده برای تحقیق روبه رو میشود.
ضروری است به سازماندهی و خلاصه کردن آنها به صورت معنی دار و قابل درک اقدام کند تا نکات پنهان داده ها آشکار شود و قبل از آنکه مستقیما به سراغ ازمون های آماری برود، ابتدا به بررسی اکتشافی داده ها می پردازد.توصیه میشود قبل از این که سراغ آزمون های آماری بروید مقاله انتخاب صحیح آزمون های آماری را مطالعه فرمایید. موضوع آمار توصیفی تنظیم و طبقه‌بندی داده‌ها، نمایش ترسیمی، و محاسبه مقادیری از قبیل نما، میانگین، میانه و … می‌باشد که حاکی از مشخصات یکایک اعضای جامعه مورد بحث است .
پس روشهای آمار توصیفی به همین منظور استفاده می شود.به‌طور کلی از سه روش در آمار توصیفی برای خلاصه‌سازی داده‌ها استفاده می‌شود: استفاده از جداول، استفاده از نمودار و محاسبه مقادیری خاص که نشان‌دهنده خصوصیات مهمی از داده‌ها باشند.

در آمار توصیفی از دو ابزار برای ترسیم یا گزارش ویژگی های موجود در داده ها استفاده می شود.

  1. جداول آمار: متشکل از شاخص های آماری است.
  • شاخص های پراکندگی
  • شاخص های مرکزی
  1. نمودار های آماری : انواع مختلفی دارد و بنا به نوع داده ها و اهداف محقق مورد استفاده قرار میگیرد.

مراحل اساسی توصیف داده ها عبارت است از:​

  • خلاصه کردن داده ها و توصیف الگوی کلی
الف) فشرده کردن داده ها در قالب جدول های آماری

ب) نمایش آن ها به وسیله ی نمودار

  • محاسبه شاخص های آماری

محاسبه شاخص های پراکندگیvariability:

شاخص های پراکندگی میزان پراکندگی مقادیر هر متغیر را در اطراف میانگین نشان می دهند.به وسیله این شاخص ها، می خواهیم بدانیم تا چه اندازه داده ها در اطراف نقطه تمرکز پراکنده اند.که مهمترین شاخص های پراکندگی عبارتند از:انحراف استاندارد، واریانس، ضریت تغییرات و دامنه تغییرات اشاره کرد.

دامنه تغییرات –(Range):

فاصله میان بزرگترین و کوچکترین مقادیر در مجموعه دادها را اندازه گیری می کند. هر چه دامنه طولانی تر باشد، مجموعه داده ها گسترده تر است. دامنه نیز همانند میانگین تحت تأثیر داده های پرت قرار می گیرد و در چنین حالاتی یک معیار مناسب پراکندگی نیست. به علاوه، چون برای محاسبه دامنه فقط از دو اندازه بزرگترین مشاهده و کوچکترین مشاهده استفاده می شود معمولاً معیار رضایت بخشی برای پراکندگی به حساب نمی آید.

وارﯾﺎﻧﺲ- (Variance):

میانگین ﻣﺠﺬور ﺗﻔﺎوت( اﻧﺤﺮاف)ﻣﯿﺎن ﻫﺮ ﯾﮏ از ﻣﻘﺎدﯾﺮ داده ﻫﺎ ﺑﺎ ﻣﯿﺎﻧﮕﯿﻦ آﻧﻬﺎ ﻣﯽ ﺑﺎﺷﺪ.چون تفسیر واریانس دشوار است در گزارش ها و پژوهش ها از انحراف استاندارد به جای واریانس استفاده می شود.انحراف استاندارد تفسیر میزان پراکندگی را آسان تر قابل فهم تر می سازد.

انحراف استاندارد(انحراف معیار)standard deviation:

انحراف استاندارد مفیدترین ومتداول ترین شاخص پراکندگی است.مفیدبودن این شاخص به این دلیل است که با این شاخص می توان میزان پراکندگی هرتوزیع پیوسته رابرحسب واحد اندازه گیری نشان داد.این شاخص پایاترین ودقیق ترین شاخص پراکندگی است،که درمحاسبه ی آن ازکلیه ی اعداداستفاده می شود.واعمال ریاضی رامی توان درمورد آن انجام داد.این شاخص به منظورتعیین تغییرات یا پراکندگی توزیع نمره ها به کار برده می شود.ازاین شاخص می توان برای محاسبات آماری استفاده کرد.و به صورت گسترده ای درآماراستنباطی به کاربرده می شود.

چارکها

چارکها نقاطی بر روی مقیاس اندازه گیری هستند که کلیه مشاهدات یا نمره ها را به چهار قسمت مساوی تقسیم می کند

انواع چارکها

-چارک اول(Q1)

-چارک (Q2)

-چارک (Q3)

محاسبه شاخص های مرکزی Measures of Central Tendency:

کمیت هایی وجود دارند که می توانند به‌صورت کمی جامعه را معرفی نمایند بعضی از آنها محل تمرکز داده‌ها را معرفی می کنند که به آنها شاخص های مرکزی می گویند.همانطور که می دانید در محاسبات آماری لازم است که ویژگیها و موقعیت کلی داده‌ها تعیین شود. برای این منظور شاخصهای مرکزی محاسبه می‌شوند. مهم ترین شاخص های مرکزی عبارتند از : مد، میانه و میانگین که هر یک کاربرد خاص خود را دارا می‌باشند. یک شاخص مرکزی وقتی با ارزش است که دارای خواص زیر باشد:

-در محاسبه آن از تمام داده‌ها استفاده شود.

-دارای خصوصیات ساده قابل محاسبه باشد.

-به فرم ریاضی قابل محاسبه باشد.

نما:​

عبارت از عددی یا نمره ای که در توزیع فراوانی دارای بیشترین فراوانی است و از طریق مشاهده توزیع فراوانی و تعیین عددی که دارای بیشترین فراوانی است تعیین می شود.

موارد استفاده نما

۱- وقتی که مقیاس اندازه گیری اسمی است.

۲- پژوهشگر علاقمند است عددی را که بیشتر تکرار شده است پیدا کند.

۳- پژوهشگر علاقمند است اطلاعاتی کلی و سریع درباره گرایشهای مرکزی بدست آورد.

میانه:​

میانه نقطه ای است که نیمی از توزیع نمره ها در بالای آن و نیم دیگر در پایین آن قرار دارد . در تحقیقاتی که مقیاس اندازه گیری داده‌ها رتبه‌ای یا اسمی‌ است، میانه یا نما مورد استفاده قرار می‌گیرند.

میانگین :​

میانگین شناخته شده ترین و وسیع ترین مقدار متوسطی است که مورد استفاده قرار می گیرد و توصیف کننده مرکز توزیع فراوانی می باشد. در تحقیقاتی که مقیاس اندازه گیری داده‌ها حداقل فاصله‌ای است میانگین بهترین شاخص است.

تشکیل جدول توزیع فراوانی:

توزیع فراوانی عبارت است از سازمان دادن داده‌ها یا مشاهدات به صورت طبقات همراه با فراوانی هر طبقه. برای تشکیل یک جدول توزیع فراوانی باید دامنه تغییرات ، تعداد طبقات و حجم طبقات توسط فرمولهای مربوطه محاسبه شده و سپس اقدام به نوشتن جدول توزیع شود.

عناصر دیگر جدول توزیع فراوانی:

  • فراوانی مطلق: به تعداد داده‌ها در هر طبقه فراوانی مطلق آن طبقه می‌گویند و آن را با fi نشان می‌دهند.
  • فراوانی نسبی: در صورتی که فراوانی‌های مطلق را بر کل فراوانی‌ها تقسیم کنیم، فراوانی نسبی ri به دست می‌آید.
  • فراوانی تجمعی: به مجموع فراوانی‌های مطلق طبقه‌های قبل و همان طبقه، فراوانی تجمعی آن طبقه می‌گویند و آن را با Fi نمایش می‌دهند.
  • فراوانی تجمعی نسبی: می‌توان از تقسیم فراوانی های تجمعی بر تعداد داده‌ها، این فراوانی را به دست آورد. (Ri)

تهیه ﺟﺪول ﺗﻮزﻳﻊ ﻓﺮاواﻧﯽ و ﺗﺮﺳﯿﻢ :

این جداول و نمودارها ابزار مفیدی برای تنظیم و نمایش اطلاعات هستند(البته محقق قبل از تهیه جداول باید تعیین کند که ایا توزیع روش مناسبی برای توصیف اطلاعات و برقراری ارتباط هست یا نه).

مهمترین انواع نمودار ها:

  • نمودار هیستوگرام
  • نمودار چند ضلعی
  • نمودار میله‌ای
  • منحنی فراوانی تجمعی (اوجایو)
  • نمودار دایره‌ای یا کلوچه‌ای
  • نمودار شاخه و برگ
  • نمودار پراکنش


هر ویژگی مربوط به یک عضو جامعه را که عملاً مورد پرسش یا اندازه‌گیری قرار می‌گیرد، یک صفت متغیر یا به اختصار یک متغیر (Variable) می‌گویند. بنابراین داده‌ها (Data) مقادیر اندازه‌گیری شده متغیرها هستند.

متغیرها و داده‌ها:

  • متغیرهای کمّی: متغیرهایی هستند که قابل شمارش و اندازه گیری‌اند و حاصل سنجش آنها یک مقدار کمّی است.شامل:
-فاصله ای

-نسبتی

  1. کمی پیوسته: کمیتی که بتواند بین دو مقدار خود تمامی اعداد حقیقی ممکن را بگیرد.
  2. کمی گسسته: کمیتی که مقادیر آن شامل مجموعه شمارش پذیری از اعداد و یا زیر مجموعه ای از آن را اختیار کند
  • متغیرهای کیفی: متغیرهایی هستند که غیر قابل شمارش و اندازه گیری‌اند و حاصل سنجش آنها یک حالت و وضعیت است. شامل :
– اسمی

-رتبه ای

پس از شناسایی متغیرها باید به سراغ اندازه گیری آن ها برویم. در حقیقت زمانی که متغیرهای تحقیق، شناسایی شدند، مشخص می‌گردد که اندازه‌گیری همه آن ها (مقیاس اندازه‌گیری) به یک صورت ممکن نیست. از نظر میزان دقت اندازه گیری مقیاس ها به چهار دسته تقسیم می شوند.

مقیاس اسمی:​

افراد همانند از نظر صفت ویژه، در یک دسته قرار می‌گیرند. ملاک طبقه‌بندی در این نوع مقیاس، بر ویژگی‌های مشترک افراد یا رویدادها مبتنی است.

مقیاس ترتیبی:​

مقیاسی است که افراد یا اشیا را از لحاظ صفت ویژه، رتبه‌بندی می‌کند. بین گروهها از نظر متغیر مورد نظر برتری وجود دارد

مقیاس فاصله ای:​

این نوع مقیاس نه تنها ترتیب اشیا را نمایان می‌کند، بلکه فاصله بین آنها را نیز مشخص می‌سازد.

مقیاس نسبتی:​

دقیق‌ترین مقیاس اندازه‌گیری است. این مقیاس، دارای صفر حقیقی می‌باشد؛ یعنی نقطه ای در مقیاس که نمایان‌گر فقدان کامل ویژگی مورد اندازه‌گیری است. نسبت‌ها در نقاط مختلف این نوع مقیاس، قابل مقایسه‌اند.

محاسبه همبستگی

ضریب همبستگی (Correlation Coefficient) ابزاری آماری برای تعیین نوع و درجه رابطهٔ یک متغیر کمی با متغیر کمی دیگر است. ضریب همبستگی، یکی از معیارهای مورد استفاده در تعیین همبستگی دو متغیر است.محاسبه ضرایب همبستگی تا حدود زیادی متاثر از مقیاس اندازه گیری متغیر ها است.

با توجه به نوع متغیر ها ضریب همبستگی میتواند یکی از حالتهای زیر را داشته باشد.

۱- دو متغیر اسمی

۲- دو متغیر رتبهای

۳- دو متغیر فاصلهای- نسبی

۴- متغیر اسمی و متغیر رتبه ای

۵- متغیر اسمی و متغیر فاصلهای – نسبی

۶- متغیر رتبهای و متغیر فاصلهای – نسبی

برای هر کدام از حالتهای بالا ضرایب همبستگی متفاوتی وجود دارند و محاسبه آنها در نرم افزار های spss ، lisrel و R امکان پذیراست.شما عزیزان می توانید انجام تحلیل آماری پروژه های مختلف خود،انجام پایان نامه ارشد و انجام پایان نامه دکتری،مقاله و …را از هر جای ایران به کارشناسان ما بسپارید تا در سریعترین زمان ممکن آن را تحویل شما دهند. در واقع بخش های مربوط به « روش تحقیق » و « فصول سوم تا پنجم پایان نامه ها » نیازمند بکارگیری نرم افزارهای آماری همچون SPSS و LISREL و AMOS و EVIEWS و STATA هستند که همکاران ما با داشتن دانش لازم قادرند آن را برای شما انجام دهند.

محاسبۀ همبستگی برای تحقیقات پارامتری

چنانچه دو متغیر در مقیاس های فاصله یا نسبی اندازه گیری شده باشند، می توان برای تعیین رابطه بین آنها از ضریب همبستگی گشتاوری پیرسون استفاده کرد.ولی اگر در تمام مفروضات ضریب همبستگی پیرسون صادق نباشد، نمی توان از آنها استفاده کرد و به جای آن می توان از روش های دیگری مانند ضریب همبستگی دو رشته ای، و یا ضریب تتراکوریک استفاده کرد.

رگراسیون و پیش بینی

رگراسیون (Regression) روشی برای مطالعه سهم یک یا چند متغیر مستقل در پیش بینی متغیر وابسته است. از تحلیل رگراسیون هم در تحقیقات توصیفی (غیر آزمایشی) و هم در تحقیقات آزمایشی می‌توان استفاده کرد. در حقیقت تحلیل رگرسیونی فن و تکنیکی آماری برای بررسی و مدل سازی ارتباط بین متغیرها است.
رگرسیون تقریباً در هر زمینه ای از جمله مهندسی، فیزیک، اقتصاد، مدیریت، علوم زیستی، بیولوژی و علوم اجتماعی برای برآورد و پیشبینی مورد نیاز است .می توان گفت تحلیل رگرسیونی، پرکاربردترین روش در بین تکنیک های آماری است. با توجه به نوع تحقیق و متغیرهای آن روش متنوعی برای تحلیل رگراسیون وجود دارد که برخی از آنها عبارتند از : رگراسیون خطی (با سه راهبرد همزمان ، گام به گام ، سلسله مراتبی) ، رگراسیون انحنایی ، رگراسیون لوجیستیک و تحلیل کواریانس.

تحلیل داده‌های ماتریس کواریانس

از جمله تحلیل‌های همبستگی ، تحلیل ماتریس کواریانس یا ماتریس همبستگی است. دو نوع از معروفترین این تحلیل‌ها عبارتند از : مدل تحلیل عاملی برای پی بردن به متغیرهای زیر بنایی یک پدیده در دو دسته اکتشافی و تاییدی و مدل معادلات ساختاری برای بررسی روابط علی بین متغیرها.

محاسبۀ همبستگی برای تحقیقات ناپارامتری

در تحقیقاتی که در سطح مقیاس های اسمی و رتبه ای انجام می گیرد، باید از روش های دیگری برای محاسبۀ همبستگی بین دو متغیر استفاده کرد. برخی از این روش ها عبارتند از: ضریب همبستگی فی، ضریب کریمر ، ضریب کاپا و ضریب لامبادا جهت تحقیقات اسمی و ضریب همبستگی اسپیرمن، ضریب کندال و آماره گاما برای تحقیقات ترتیبی.

 

ستاره_قطبی

عضو فعال
ماتریس کواریانس و ماتریس همبستگی چیست

تحلیل عاملی

تحلیل عاملی یک روش آماری چند متغیری است که در تحلیل جداول یا ماتریس های همبستگی به کار می رود. این ضرایب معمولا ضرایب همبستگی گشتاوری هستند، اگرچه در تحلیل مورد بحث از سایر شاخص های همبستگی مانند کوواریانس نیز می توان استفاده کرد.

در بسیاری از کاربردهای تحلیل عاملی، متغیرها نمره های حاصل از آزمون های تربیتی یا روان شناختی هستند. با وجود این، روش های تحلیل عاملی بسیار کلی هستند، به طوری که می توان آن ها را برای همبستگی های بین متغیرهایی از هر نوع، مانند متغیرهای اقتصادی، مردم شناسی، فیزیولوژیکی، هواشناسی یا فیزیکی مورد استفاده قرار داد.

بازبینی مستقیم ماتریس های مربوط به ضرایب همبستگی، به وضوح نشان می دهد که تفسیر شهودی ساده ای از الگوی روابط بین متغیرها امکان پذیر نیست. در چنین موقعیتی،محقق به روشی از تحلیل نیاز دارد که تفسیر معنادار متغیرهایی که با هم ارتباط دارند، کمک کند. تحلیل عاملی، روشی برای دستیابی به چنین منظوری است.

در رگرسیون چند متغیری توجه پژوهشگر معطوف به پیش بینی است و بین متغیر وابسته و مجموعه ای ازمتغیرهای مستقل تمایزبه عمل می آید. تحلیل عاملی معمولا برای داده هایی به کار برده می شود که در آن ها، بین متغیرهای وابسته و مستقل تمایز معناداری وجود ندارد و هدف، توصیف و تفسیر همبستگی های درونی مجموعه واحدی از متغیرهاست.

روش تحلیل عاملی معمولا در تحلیل داده های پرسشنامه ای برای تشخیص متغیرهای پنهان استفاده می شود.

ماتریس کواریانس (Covariance) و ماتریس همبستگی (Correlation) چیست؟

حالا می‌خواهیم یک ماتریس به اسم ماتریسِ همبستگی یا همان Correlation Matrix را نمایش دهیم. در این ماتریس متغیرهای ما همان ویژگی‌های مجموعه‌ی داده هستند. برای مثال یک سری پستاندار را می‌خواهیم مورد بررسی قرار دهیم. در این بررسی برای هر پستاندار ۳ویژگی در نظر می‌گیریم. وزن، ساعت خواب و طول عمر. حالا شکل زیر را ببینید:

این یک ماتریس است که ۳سطر و ۳ستون دارد و متقارن است. توجه کنید که تعدادِ سطر و ستون‌ها برابرِ تعداد ویژگی‌های مجموعه‌ی داده (در این‌جا ۳) است. سطرها و ستون‌های این ماتریس برابرند. هر کدام از خانه‌ها با عددی مشخص شده‌اند که در بازه‌ی منفی ۱ تا مثبت ۱ قرار دارند. هر چه این عدد کمتر باشد به این معنی است که دو ویژگی (در محل تقاطع آن عدد) به همدیگر ارتباط معکوس دارند و هر چه قدر این عدد بزرگتر باشد یعنی دو ویژگی به همدیگر وابستگیِ مثبت دارند.
برای درک بهتر، عددی که در شکلِ بالا سبز رنگ کردیم را مشاهده کنید. عدد منفی ۰/۳۰۷ به این معنی است که در بین این گونه پستانداران با زیاد شدن وزن آن‌ها، ساعات خوابشان کمتر می‌شود. یعنی دو ویژگیِ وزن و ساعت خواب به همدیگر به اندازه ۰/۳۰۷ وابستگی منفی دارند.
حالا عددی که با رنگ قرمز مشخص شده را مشاهده کنید. همان‌طور که می‌بینید، این عدد در نقطه‌ی تقاطعِ دو ویژگیِ طول عمر و وزن قرار دارد و به خاطر مثبت بودنْ نشان می‌دهد که هر چه وزنِ یک پستاندار بیشتر باشد، طولِ عمر او نیز بیشتر می‌شود. در واقع این دو متغیر به اندازه‌ی ۰/۳۰۲ به همدیگر وابستگیِ مثبت دارند. قطعاً توجه دارید که قُطرِ اصلیِ این ماتریس برابرِ ۱ هست زیرا هر ویژگی با خودش طبیعتاً همبستگی حداکثری دارد.

این اعداد و ویژگی‌هایی که در موردِ آن‌ها بحث کردیم مقدارِ همبستگیِ دو ویژگی (دو متغیر) را نشان می‌داد. در بعضی از مراجع از کواریانس (Covariance) نیز برای این رابطه نام برده می‌شود. کواریانس در واقع یک حالتِ غیرنرمال (غیر استاندارد) از همبستگی (Correlation) است.
زیرا برای محاسبه‌ی همبستگی باید مقدارِ کواریانسِ بین دو ویژگی را تقسیم بر انحرافِ استانداردِ (انحراف معیار) دو متغیر کرد (درسِ انحرافِ استاندارد را خوانده باشید). این کار (تقسیم بر انحراف استاندارد) باعث می‌شود مقدارِ اعداد در بازه‌ی منفیِ ۱ تا مثبتِ ۱ قرار بگیرند و بتوان آن‌ها را با هم مقایسه کرد. زیرا مقدار کواریانس در بازه‌ی منفی ۱ و مثبت ۱ نیست و باتوجه به دامنه تغییرات یک ویژگی می‌تواند خیلی زیاد یا خیلی کم شود.
در مثالِ بالا، مقدارِ سن ممکن است بین ۵ تا ۱۰۰متغیر باشد ولی مقدار وزن می‌تواند بین ۰/۵کیلوگرم تا ۵۰۰کیلوگرم در بین پستانداران باشد و این دامنه‌ی تغییرات بر روی مقادیرِ کواریانس اثر می‌گذارد و مانع از مقایسه درست اعداد داخل ماتریس نسبت به هم می‌شود. حال برای فهم ماتریس کواریانس به شکل زیر نگاه کنید:

واریانس دامنه‌ی تغییرات یک متغیر نسبت به خودش است. در حالی که کواریانس دامنه‌ی تغییرات دو متغیر نسبت به همدیگر است. یعنی به نوعی، پاسخ به این سوال است که مثلا با کم شدن مقدار یک ویژگی (مانند سن پستانداران)، ویژگی دیگر (مانند وزن پستاندار) چه تغییری پیدا می‌کند؟ و کواریانس هر ویژگی با خودش همان واریانس (Variance) آن ویژگی است.
 


🔴 لینک های مفید: شبیه ساز منظومه شمسی ,
میزبانی شده توسط سرورهای قدرتمند افیکس هاست

بالا