راهنمای مقدماتی تحلیل آماری | 5 مرحله همراه با مثال

توسط منتشر شده در : اکتبر 12, 2022دسته بندی: مقالات تحلیل آماریLast Updated: می 10, 2023بدون دیدگاه on راهنمای مقدماتی تحلیل آماری | 5 مرحله همراه با مثالنمایش: 2064

چکیده مقاله :
تحلیل آماری به معنای بررسی روندها، الگوها و روابط با استفاده از داده های کمی است. این یک ابزار تحقیقاتی مهم است که توسط دانشمندان، دولت ها، مشاغل و سایر سازمان ها استفاده می شود. برای نتیجه گیری معتبر، تجزیه و تحلیل آماری نیاز به برنامه ریزی دقیق از همان آغاز فرآیند تحقیق دارد. شما باید فرضیه های خود را مشخص کنید و در مورد طرح تحقیق، حجم نمونه و روش نمونه گیری تصمیم گیری کنید. پس از جمع آوری داده ها از نمونه خود، می توانید داده ها را با استفاده از آمار توصیفی سازماندهی و خلاصه کنید. سپس، می‌توانید از آمار استنباطی برای آزمایش رسمی فرضیه‌ها و تخمین‌هایی درباره جمعیت استفاده کنید. در نهایت، می توانید یافته های خود را تفسیر و تعمیم دهید. این مقاله راهنمای مقدماتی تحلیل آماری یا به بیان دیگر مقدمه ای کاربردی برای تحلیل های آماری برای دانشجویان و محققین است. ما با استفاده از دو مثال تحقیقاتی شما را از طریق مراحل راهنمایی می کنیم. اولی یک رابطه علت و معلولی بالقوه را بررسی می کند، در حالی که دومی یک همبستگی بالقوه بین متغیرها را بررسی می کند. مثال: سوال تحقیق علّی آیا مدیتیشن می تواند عملکرد امتحان را در نوجوانان بهبود بخشد؟ مثال: سوال پژوهشی همبستگی آیا بین درآمد والدین و معدل دانشگاهی (GPA) رابطه وجود دارد؟

1- مرحله 1: فرضیه های خود را بنویسید و طرح تحقیق خود را برنامه ریزی کنید

برای جمع آوری داده های معتبر برای تجزیه و تحلیل آماری، ابتدا باید فرضیه های خود را مشخص کنید و طرح تحقیق خود را برنامه ریزی کنید.

1-1- نوشتن فرضیه های آماری

هدف پژوهش اغلب بررسی رابطه بین متغیرها در یک جامعه است. شما با یک پیش بینی شروع می کنید و از تحلیل آماری برای آزمایش آن پیش بینی استفاده می کنید. فرضیه آماری روشی رسمی برای نوشتن پیش‌بینی در مورد یک جمعیت است. هر پیش‌بینی تحقیق به فرضیه‌های صفر و جایگزین تبدیل می‌شود که می‌توانند با استفاده از داده‌های نمونه آزمایش شوند. در حالی که فرضیه صفر همیشه تاثیری یا رابطه بین متغیرها را پیش‌بینی نمی‌کند، فرضیه جایگزین پیش‌بینی تحقیق شما از یک اثر یا رابطه را بیان می‌کند.

  • مثال: فرضیه های آماری برای آزمایش یک اثر
    • فرضیه صفر: یک تمرین مراقبه 5 دقیقه ای هیچ تاثیری بر نمرات آزمون ریاضی نوجوانان نخواهد داشت.
    • فرضیه جایگزین: یک تمرین مراقبه 5 دقیقه ای نمرات آزمون ریاضی را در نوجوانان بهبود می بخشد.
  • مثال: فرضیه های آماری برای آزمون همبستگی
    • فرضیه صفر: درآمد والدین و معدل در دانشجویان ارتباطی با یکدیگر ندارند.
    • فرضیه جایگزین: درآمد والدین و معدل در دانشجویان همبستگی مثبت دارند.

2-1- طرح تحقیق خود را برنامه ریزی کنید

طرح تحقیق استراتژی کلی شما برای جمع آوری و تجزیه و تحلیل داده ها است. این امر آزمون های آماری را تعیین می کند که می توانید بعداً برای آزمایش فرضیه خود از آنها استفاده کنید. ابتدا تصمیم بگیرید که آیا تحقیق شما از طرح توصیفی، همبستگی یا آزمایشی استفاده خواهد کرد. آزمایش‌ها مستقیماً بر متغیرها تأثیر می‌گذارند، در حالی که مطالعات توصیفی و همبستگی فقط متغیرها را اندازه‌گیری می‌کنند.

1- در یک طرح آزمایشی، می توانید با استفاده از آزمون های آماری مقایسه یا رگرسیون، یک رابطه علت و معلولی (به عنوان مثال، تأثیر مراقبه بر نمرات آزمون) را ارزیابی کنید.

2- در یک طرح همبستگی، می توانید روابط بین متغیرها (به عنوان مثال، درآمد والدین و معدل) را بدون هیچ گونه فرض علیت با استفاده از ضرایب همبستگی و آزمون های معناداری بررسی کنید.

3- در یک طرح توصیفی، می توانید ویژگی های یک جمعیت یا پدیده (به عنوان مثال، شیوع اضطراب در دانشجویان کالج ایالات متحده) را با استفاده از آزمون های آماری برای استنتاج از داده های نمونه مطالعه کنید.

طرح تحقیق شما همچنین به این موضوع مربوط می شود که آیا شرکت کنندگان را در سطح گروهی یا فردی یا هر دو مقایسه خواهید کرد.

1- در طراحی بین آزمودنی‌ها (between-subjects design)، نتایج در سطح گروه شرکت‌کنندگانی که در معرض درمان‌های مختلف قرار گرفته‌اند را مقایسه می‌کنید (به عنوان مثال، کسانی که تمرین مدیتیشن را انجام داده‌اند در مقابل کسانی که انجام نداده‌اند).

2- در طراحی درون آزمودنی (within-subjects design)، اقدامات مکرر شرکت‌کنندگانی را که در تمام رفتارهای یک مطالعه شرکت کرده‌اند مقایسه می‌کنید (مثلاً نمرات قبل و بعد از انجام تمرین مدیتیشن).

3- در طرح ترکیبی (mixed design) (فاکتوری)، یک متغیر بین آزمودنی‌ها تغییر می‌کند و متغیری دیگر در درون آزمودنی‌ها تغییر می‌کند (مثلاً نمرات پیش‌آزمون و پس‌آزمون از شرکت‌کنندگانی که تمرین مدیتیشن را انجام داده‌اند یا انجام نداده‌اند).

  • مثال: طرح تحقیق تجربی
    شما یک آزمایش درون آزمودنی طراحی می کنید تا بررسی کنید که آیا یک تمرین مراقبه 5 دقیقه ای می تواند نمرات آزمون ریاضی را بهبود بخشد یا خیر. مطالعه شما اقدامات مکرری را از یک گروه از شرکت کنندگان انجام می دهد.
    ابتدا، نمرات آزمون پایه را از شرکت کنندگان می گیرید. سپس، شرکت کنندگان شما یک تمرین مدیتیشن 5 دقیقه ای را انجام خواهند داد. در نهایت، نمرات شرکت‌کنندگان را از آزمون دوم ریاضی ثبت می‌کنید. در این آزمایش متغیر مستقل تمرین مدیتیشن 5 دقیقه ای و متغیر وابسته نمره آزمون ریاضی قبل و بعد از مداخله است.
  • مثال: طرح تحقیق همبستگی
    در یک مطالعه همبستگی، شما بررسی می کنید که آیا رابطه ای بین درآمد والدین و معدل در دانشجویان فارغ التحصیل وجود دارد یا خیر. برای جمع‌آوری داده‌های خود، از شرکت‌کنندگان می‌خواهید که یک نظرسنجی را پر کنند و درآمد والدین و معدل خودشان را گزارش دهند.
    در این مطالعه هیچ متغیر وابسته یا مستقلی وجود ندارد، زیرا شما فقط می خواهید متغیرها را بدون تأثیرگذاری بر آنها اندازه گیری کنید.

3-1- متغیرهای اندازه گیری

هنگام برنامه ریزی یک طرح تحقیق، باید متغیرهای خود را عملیاتی کنید و دقیقاً تصمیم بگیرید که چگونه آنها را اندازه گیری کنید. برای تجزیه و تحلیل آماری، مهم است که سطح اندازه‌گیری متغیرهای خود را در نظر بگیرید، که به شما می‌گوید چه نوع داده‌هایی دارند:

> داده های طبقه بندی نشان دهنده گروه بندی است. اینها ممکن است اسمی یا nominal (به عنوان مثال، جنسیت) یا ترتیبی یا ordinal (مثلاً سطح توانایی زبان) باشند.
> داده های کمی نشان دهنده مقادیر هستند. اینها ممکن است در مقیاس فاصله ای یا interval scale (مثلاً نمره آزمون) یا مقیاس نسبت یا  ratio scale (مثلاً سن) باشند.

بسیاری از متغیرها را می توان در سطوح مختلف دقت اندازه گیری کرد. به عنوان مثال، داده های سنی می تواند کمی (8 ساله) یا دسته بندی (جوان) باشد. اگر متغیری به صورت عددی کدگذاری شود (مثلاً سطح توافق از 1 تا 5)، به طور خودکار به این معنی نیست که به جای طبقه بندی، کمی است.

شناسایی سطح اندازه گیری برای انتخاب آمار مناسب و آزمون های فرضیه مهم است. به عنوان مثال، شما می توانید میانگین امتیاز را با داده های کمی محاسبه کنید، اما نه با داده های طبقه بندی.

در یک مطالعه تحقیقاتی، همراه با اندازه گیری متغیرهای مورد علاقه خود، اغلب داده هایی را در مورد ویژگی های شرکت کننده مرتبط جمع آوری می کنید.

  • مثال: متغیرها (مطالعه تحقیقی)
    شما می‌توانید محاسبات زیادی را با داده‌های کمی سن یا نمره آزمون انجام دهید، در حالی که متغیرهای طبقه‌بندی می‌توانند برای تصمیم‌گیری گروه‌بندی برای آزمون‌های مقایسه استفاده شوند.

    نوع داده متغیر
    کمی (نسبت) سن
    طبقه بندی (اسمی) جنسیت
    طبقه بندی (اسمی) نژاد یا قومیت
    کمی (فاصله) نمرات آزمون پایه
    کمی (فاصله) Column 2 Value 5
  • مثال: متغیرها (مطالعه همبستگی)
    انواع متغیرها در یک مطالعه همبستگی آزمونی را که برای ضریب همبستگی استفاده می کنید تعیین می کند. برای داده های کمی می توان از آزمون همبستگی پارامتریک استفاده کرد، در حالی که اگر یکی از متغیرها ترتیبی باشد باید از آزمون همبستگی ناپارامتریک استفاده کرد.

    نوع داده متغیر
    کمی (نسبت) درآمد والدین
    کمی (فاصله) معدل

2- مرحله 2: جمع آوری داده ها از نمونه

در بیشتر موارد، جمع‌آوری داده‌ها از هر عضوی از جمعیتی که علاقه‌مند به مطالعه آن هستید، بسیار دشوار یا پرهزینه است. در عوض، داده ها را از یک نمونه جمع آوری خواهید کرد. تحلیل آماری به شما امکان می دهد تا زمانی که از روش های نمونه گیری مناسب استفاده می کنید، یافته های خود را فراتر از نمونه خود اعمال کنید. شما باید نمونه ای را هدف بگیرید که نماینده جامعه باشد.

نمونه در برابر جمعیت

نمونه در برابر جمعیت

1-2- نمونه گیری برای تجزیه و تحلیل آماری

دو رویکرد اصلی برای انتخاب نمونه وجود دارد.

  • نمونه گیری احتمالی: هر یک از اعضای جامعه از طریق انتخاب تصادفی شانس انتخاب برای مطالعه را دارند.
  • نمونه گیری غیراحتمالی: برخی از اعضای جامعه به دلیل معیارهایی مانند سهولت یا انتخاب داوطلبانه، بیشتر از سایرین برای مطالعه انتخاب می شوند.

در تئوری، برای یافته های بسیار قابل تعمیم، باید از روش نمونه گیری احتمالی استفاده کنید. انتخاب تصادفی سوگیری نمونه‌گیری را کاهش می‌دهد و تضمین می‌کند که داده‌های نمونه شما در واقع نمونه‌ای از جامعه است. هنگامی که داده ها با استفاده از نمونه گیری احتمالی جمع آوری می شوند، می توان از آزمون های پارامتریک برای استنتاج های آماری قوی استفاده کرد.

اما در عمل، به ندرت امکان جمع آوری نمونه ایده آل وجود دارد. در حالی که نمونه‌های غیر احتمالی بیشتر احتمال دارد که سوگیری داشته باشند، جذب و جمع‌آوری داده‌ها از آنها بسیار آسان‌تر است. آزمون‌های ناپارامتریک برای نمونه‌های غیراحتمالی مناسب‌تر هستند، اما استنباط‌های ضعیف‌تری در مورد جامعه ایجاد می‌کنند.

اگر می‌خواهید از آزمون‌های پارامتریک برای نمونه‌های غیر احتمالی استفاده کنید، باید موارد زیر را بیان کنید:

  • نمونه شما نماینده جمعیتی است که یافته های خود را به آن تعمیم می دهید.
  • نمونه شما فاقد سوگیری سیستماتیک است.

به خاطر داشته باشید که اعتبار خارجی به این معنی است که شما فقط می توانید نتیجه گیری خود را به دیگرانی که ویژگی های نمونه شما را به اشتراک می گذارند تعمیم دهید. به عنوان مثال، نتایج حاصل از نمونه‌های غربی، تحصیل کرده، صنعتی، ثروتمند و دموکرات (مثلاً دانشجویان کالج در ایالات متحده) به طور خودکار برای همه جمعیت‌های non-weird قابل استفاده نیست.

اگر آزمون‌های پارامتریک را برای داده‌های نمونه‌های غیر احتمالی اعمال می‌کنید، حتماً در بخش بحث خود (discussion section) در مورد محدودیت‌های تا چه حد می‌توان نتایج را تعمیم داد توضیح دهید.

2-2- یک روش نمونه گیری مناسب ایجاد کنید

بر اساس منابع موجود برای تحقیق خود، در مورد نحوه جذب شرکت کنندگان تصمیم بگیرید.

آیا منابعی برای تبلیغ گسترده مطالعه خود، از جمله خارج از محیط دانشگاه خود خواهید داشت؟
آیا ابزاری برای بکارگیری یک نمونه متنوع خواهید داشت که نشان دهنده یک جمعیت گسترده باشد؟
آیا زمانی برای تماس و پیگیری با اعضای گروه های غیرقابل دسترسی دارید؟

  • مثال: نمونه برداری (تحقیقی یا آزمایشی)
    جمعیت مورد علاقه شما دانش آموزان دبیرستانی شهر شما هستند. شما با سه مدرسه خصوصی و هفت مدرسه دولتی در مناطق مختلف شهر تماس بگیرید تا ببینید آیا می توانید آزمایش خود را برای دانش آموزان کلاس یازدهم انجام دهید یا خیر.
    شرکت کنندگان شما توسط مدارس خود انتخاب می شوند. اگرچه شما از نمونه غیر احتمالی استفاده می کنید، اما هدف شما نمونه ای متنوع و نماینده است.
  • مثال: نمونه گیری (مطالعه همبستگی)
    جمعیت اصلی مورد علاقه شما دانشجویان پسر در ایالات متحده هستند. با استفاده از تبلیغات رسانه‌های اجتماعی، دانشجویان پسر سال آخر کالج را از یک زیرجمعیت کوچکتر جذب می‌کنید: هفت دانشگاه در منطقه ای از شهر.
    شرکت‌کنندگان شما برای نظرسنجی داوطلب می‌شوند و این یک نمونه غیراحتمالی است.

3-2- حجم کافی نمونه را محاسبه کنید

قبل از استخدام شرکت کنندگان، با بررسی سایر مطالعات در زمینه خود یا با استفاده از آمار، در مورد حجم نمونه خود تصمیم بگیرید. نمونه‌ای که خیلی کوچک است ممکن است نماینده نمونه نباشد، در حالی که نمونه‌ای که خیلی بزرگ است پرهزینه‌تر از آنچه لازم است خواهد بود.

تعداد زیادی ماشین حساب اندازه نمونه آنلاین وجود دارد. بسته به اینکه آیا زیر گروه دارید یا اینکه مطالعه شما چقدر باید دقیق باشد (به عنوان مثال، در تحقیقات بالینی) از فرمول های مختلفی استفاده می شود. به عنوان یک قاعده کلی، حداقل 30 واحد یا بیشتر در هر زیرگروه ضروری است.

برای استفاده از این ماشین حساب ها، باید این مولفه های کلیدی را درک کرده و وارد کنید:

  • سطح اهمیت (آلفا): خطر رد یک فرضیه صفر واقعی که مایل به پذیرش آن هستید، معمولاً 5٪ تعیین می شود.
  • قدرت آماری: احتمال اینکه مطالعه شما اثری با اندازه معین را تشخیص دهد، اگر وجود داشته باشد، معمولاً 80٪ یا بیشتر.
  • اندازه اثر مورد انتظار: یک نشانه استاندارد از اینکه نتیجه مورد انتظار مطالعه شما چقدر بزرگ خواهد بود، معمولا بر اساس سایر مطالعات مشابه.
  • انحراف استاندارد جمعیت: برآورد پارامتر جمعیت بر اساس مطالعه قبلی یا مطالعه آزمایشی خودتان.

3- مرحله 3: داده های خود را با آمار توصیفی خلاصه کنید

هنگامی که تمام داده های خود را جمع آوری کردید، می توانید آنها را بررسی کرده و آمار توصیفی را محاسبه کنید که آنها را خلاصه می کند.

1-3- داده های خود را بررسی کنید

روش های مختلفی برای بررسی داده های شما وجود دارد، از جمله موارد زیر:

  • سازماندهی داده ها از هر متغیر در جداول توزیع فرکانس.
  • نمایش داده ها از یک متغیر کلیدی در نمودار میله ای برای مشاهده توزیع پاسخ ها.
  • تجسم رابطه بین دو متغیر با استفاده از نمودار پراکندگی.

با تجسم داده‌های خود در جداول و نمودارها، می‌توانید ارزیابی کنید که آیا داده‌های شما از توزیع اریب یا نرمال پیروی می‌کنند و آیا داده‌های پرت یا گمشده وجود دارد یا خیر. توزیع نرمال به این معنی است که داده‌های شما به طور متقارن در اطراف مرکزی توزیع می‌شوند که بیشتر مقادیر در آن قرار دارند و مقادیر در انتهای  آن کاهش می‌یابد.

نمودار توزیع نرمال

نمودار توزیع نرمال

در مقابل، یک توزیع نامتقارن است و مقادیر بیشتری در یک طرف نسبت به طرف دیگر دارد. شکل توزیع مهم است که به خاطر داشته باشید زیرا فقط برخی از آمار توصیفی باید با توزیع های نامتقارن استفاده شوند.

نقاط دورافتاده شدید نیز می‌توانند آمارهای گمراه‌کننده ایجاد کنند، بنابراین ممکن است به یک رویکرد سیستماتیک برای مقابله با این مقادیر نیاز داشته باشید.

2-3- معیارهای گرایش مرکزی را محاسبه کنید

معیارهای گرایش مرکزی توصیف می کنند که بیشتر مقادیر در یک مجموعه داده کجا قرار دارند. سه معیار اصلی گرایش مرکزی اغلب گزارش می شود:

  • مد mode: محبوب ترین پاسخ یا مقدار در مجموعه داده ها.
  • میانه median: مقدار دقیقاً در وسط مجموعه داده در هنگام سفارش از کم به زیاد.
  • میانگین mean: مجموع همه مقادیر تقسیم بر تعداد مقادیر.

هرچند بسته به شکل توزیع و سطح اندازه گیری، تنها یک یا دو مورد از این معیارها ممکن است مناسب باشد. به عنوان مثال، بسیاری از ویژگی های جمعیت شناختی را فقط می توان با استفاده از حالت یا نسبت ها توصیف کرد، در حالی که متغیری مانند زمان واکنش ممکن است اصلاً حالت نداشته باشد.

3-3- اندازه تغییرپذیری را محاسبه کنید

اندازه‌ تغییرپذیری به شما می‌گویند که مقادیر در یک مجموعه داده چقدر پراکنده هستند. چهار معیار اصلی تغییرپذیری اغلب گزارش شده است:

  • محدوده: بالاترین مقدار منهای کمترین مقدار مجموعه داده.
  • محدوده اینترکورتایل: محدوده نیمه میانی مجموعه داده.
  • انحراف استاندارد: فاصله متوسط بین هر مقدار در مجموعه داده شما و میانگین.
  • واریانس: مربع انحراف معیار.

یک بار دیگر، شکل توزیع و سطح اندازه‌گیری باید راهنمای انتخاب آمار تنوع شما باشد. محدوده اینترکورتایل بهترین معیار برای توزیع های نامتقارن است، در حالی که انحراف استاندارد و واریانس بهترین اطلاعات را برای توزیع های نرمال ارائه می دهد.

  • مثال: آمار توصیفی (آزمایشی یا تحقیقی)
    پس از جمع آوری داده های پیش آزمون و پس آزمون از 30 دانش آموز در سطح شهر، آمار توصیفی را محاسبه می کنید. از آنجایی که شما داده های توزیع شده نرمال در مقیاس فاصله ای دارید، میانگین، انحراف استاندارد، واریانس و محدوده را جدول بندی می کنید.
    با استفاده از جدول خود، باید بررسی کنید که آیا واحدهای آمار توصیفی برای نمرات پیش آزمون و پس آزمون قابل مقایسه هستند یا خیر. به عنوان مثال، آیا سطوح واریانس در بین گروه ها مشابه است؟ آیا مقادیر افراطی وجود دارد؟ در صورت وجود، ممکن است لازم باشد قبل از انجام یک آزمون آماری، نقاط پرت شدید را در مجموعه داده های خود شناسایی و حذف کنید یا داده های خود را تغییر دهید.

    نمرات پس آزمون نمرات پیش آزمون
    75.25 68.44 میانگین
    9.88 9.43 انحراف استاندارد
    97.96 88.96 واریانس
    45.12 36.25 رنج
    30 N

    از این جدول می بینیم که میانگین امتیاز بعد از تمرین مدیتیشن افزایش یافته و واریانس دو نمره قابل مقایسه است. در مرحله بعد، می‌توانیم یک آزمون آماری انجام دهیم تا بفهمیم آیا این بهبود در نمرات آزمون از نظر آماری در جامعه معنادار است یا خیر.

  • مثال: آمار توصیفی (مطالعه همبستگی)
    پس از جمع آوری داده ها از 653 دانش آموز، آمار توصیفی برای درآمد سالانه والدین و معدل جدول بندی می کنید.
    مهم است که بررسی کنید آیا طیف وسیعی از نقاط داده دارید یا خیر. اگر این کار را نکنید، ممکن است داده‌های شما به سمت برخی گروه‌ها بیشتر از گروه‌های دیگر (مثلاً افراد با پیشرفت تحصیلی بالا) منحرف شود و فقط می‌توان استنباط‌های محدودی درباره یک رابطه انجام داد.

    معدل درآمد والدین (دلار آمریکا)
    3.12 62100 میانگین
    0.45 15000 انحراف استاندارد
    0.16 225000000 واریانس
    2.64-4.00 8000-378000 رنج
    653 N

    در مرحله بعد، می‌توانیم یک ضریب همبستگی را محاسبه کرده و یک آزمون آماری برای درک اهمیت رابطه بین متغیرها در جامعه انجام دهیم.

4- مرحله 4: فرضیه ها را آزمایش کنید یا با آمار استنباطی تخمین بزنید

عددی که یک نمونه را توصیف می کند، آمار نامیده می شود، در حالی که عددی که یک جامعه را توصیف می کند، پارامتر نامیده می شود. با استفاده از آمار استنباطی، می توانید بر اساس آمار نمونه در مورد پارامترهای جمعیت نتیجه گیری کنید.

محققان اغلب از دو روش اصلی (به طور همزمان) برای استنتاج در آمار استفاده می کنند.

  • برآورد: محاسبه پارامترهای جمعیت بر اساس آمار نمونه.
  • آزمون فرضیه: فرآیندی رسمی برای آزمایش پیش‌بینی‌های پژوهشی در مورد جامعه با استفاده از نمونه‌ها.

1-4- برآورد کردن

شما می توانید دو نوع تخمین از پارامترهای جمعیت را از آمار نمونه انجام دهید:

  • تخمین نقطه ای: مقداری که بهترین حدس شما را از پارامتر دقیق نشان می دهد.
  • تخمین بازه ای: محدوده ای از مقادیر که بهترین حدس شما را از جایی که پارامتر قرار می گیرد نشان می دهد.

اگر هدف شما استنباط و گزارش ویژگی های جمعیت از داده های نمونه است، بهتر است از هر دو تخمین نقطه ای و فاصله ای در مقاله خود استفاده کنید.

زمانی که نمونه ای نماینده دارید، می توانید یک آمار نمونه را تخمین نقطه ای برای پارامتر جمعیت در نظر بگیرید (به عنوان مثال، در یک نظرسنجی گسترده عمومی، نسبت نمونه ای که از دولت فعلی حمایت می کند به عنوان نسبت جمعیت حامیان دولت در نظر گرفته می شود).

همیشه خطا در برآورد وجود دارد، بنابراین باید یک فاصله اطمینان را نیز به عنوان تخمین فاصله ارائه کنید تا تغییرپذیری حول یک تخمین نقطه را نشان دهید. یک فاصله اطمینان از خطای استاندارد و نمره z از توزیع نرمال استاندارد استفاده می کند تا جایی که معمولاً انتظار دارید پارامتر جمعیت را در بیشتر مواقع پیدا کنید.

2-4- تست فرضیه

با استفاده از داده های یک نمونه، می توانید فرضیه هایی را در مورد روابط بین متغیرها در جامعه آزمایش کنید. آزمون فرضیه با این فرض شروع می شود که فرضیه صفر در جامعه صادق است و شما از آزمون های آماری برای ارزیابی اینکه آیا فرضیه صفر قابل رد است یا خیر، استفاده می کنید.

آزمون‌های آماری تعیین می‌کنند که اگر فرضیه صفر درست باشد، داده‌های نمونه شما در توزیع مورد انتظار داده‌های نمونه کجا قرار می‌گیرند. این تست ها دو خروجی اصلی را ارائه می دهند:

  • یک آمار آزمون به شما می گوید که چقدر داده های شما با فرضیه صفر آزمون تفاوت دارد.
  • اگر فرضیه صفر واقعاً در جامعه صادق باشد، یک مقدار p احتمال به دست آوردن نتایج را به شما می گوید.

آزمون های آماری در سه نوع اصلی ارائه می شوند:

  • آزمون‌های مقایسه تفاوت‌های گروهی را در نتایج ارزیابی می‌کنند.
  • آزمون های رگرسیون روابط علت و معلولی بین متغیرها را ارزیابی می کنند.
  • آزمون های همبستگی روابط بین متغیرها را بدون فرض علیت ارزیابی می کنند.

انتخاب آزمون آماری شما به سؤالات تحقیق، طرح تحقیق، روش نمونه گیری و ویژگی های داده بستگی دارد.

3-4- تست های پارامتریک

آزمون‌های پارامتریک استنباط‌های قدرتمندی در مورد جامعه براساس داده‌های نمونه ایجاد می‌کنند. اما برای استفاده از آنها باید برخی از مفروضات را رعایت کرد و فقط می توان از برخی از انواع متغیرها استفاده کرد. اگر داده‌های شما این مفروضات را نقض می‌کنند، می‌توانید تبدیل داده‌های مناسب را انجام دهید یا به جای آن از آزمون‌های ناپارامتریک جایگزین استفاده کنید.

رگرسیون میزان تغییرات یک متغیر پیش‌بینی‌کننده را به تغییر در متغیر(های) پیامد مدل می‌کند.

  • یک رگرسیون خطی ساده شامل یک متغیر پیش‌بینی‌کننده و یک متغیر نتیجه است.
  • رگرسیون خطی چندگانه شامل دو یا چند متغیر پیش‌بینی‌کننده و یک متغیر نتیجه است.

آزمون های مقایسه معمولاً میانگین گروه ها را با هم مقایسه می کنند. اینها ممکن است میانگین گروه های مختلف در یک نمونه (به عنوان مثال، گروه درمان و کنترل)، میانگین یک گروه نمونه گرفته شده در زمان های مختلف (به عنوان مثال، نمرات پیش آزمون و پس آزمون)، یا میانگین نمونه و میانگین جامعه باشد.

  • آزمون t دقیقاً برای 1 یا 2 گروه است زمانی که نمونه کوچک است (30 یا کمتر).
  • یک آزمون z دقیقاً برای 1 یا 2 گروه است زمانی که نمونه بزرگ است.
  • ANOVA برای 3 گروه یا بیشتر است.

آزمون‌های z و t بر اساس تعداد و نوع نمونه‌ها و فرضیه‌ها دارای زیرگروه‌هایی هستند:

  • اگر فقط یک نمونه دارید که می خواهید آن را با میانگین جامعه مقایسه کنید، از آزمون تک نمونه ای one-sample test استفاده کنید.
  • اگر اندازه‌گیری‌های زوجی (طراحی درون آزمودنی‌ها) دارید، از آزمون نمونه‌های وابسته (جفتی) dependent (paired) samples test استفاده کنید.
  • اگر اندازه گیری های کاملاً مجزا از دو گروه بی همتا (طراحی بین آزمودنی ها) دارید، از آزمون نمونه های مستقل (جفت نشده) independent (unpaired) samples test استفاده کنید.
  • اگر انتظار دارید بین گروه ها در جهت خاصی تفاوت وجود داشته باشد، از تست یک دم one-tailed test استفاده کنید.
  • اگر هیچ انتظاری برای جهت تفاوت بین گروه ها ندارید، از آزمون دو طرفه two-tailed test استفاده کنید.

تنها آزمون همبستگی پارامتریک، r پیرسون Pearson’s r است. ضریب همبستگی (r) قدرت رابطه خطی بین دو متغیر کمی را به شما می گوید.

با این حال، برای آزمایش اینکه آیا همبستگی در نمونه به اندازه کافی قوی است که در جامعه مهم باشد، باید یک آزمون معناداری ضریب همبستگی، معمولاً آزمون t، برای به دست آوردن مقدار p انجام دهید. این آزمون از حجم نمونه شما برای محاسبه میزان تفاوت ضریب همبستگی با صفر در جامعه استفاده می کند.

  • مثال: آزمون t زوجی برای تحقیقات آزمایشی یا تحقیقی
    از آنجایی که طرح تحقیق شما یک آزمایش درون آزمودنی است، هر دو اندازه‌گیری پیش‌آزمون و پس‌آزمون از یک گروه می‌آیند، بنابراین به آزمون t وابسته (جفتی) نیاز دارید. از آنجایی که شما تغییری را در یک جهت خاص (بهبود نمرات آزمون) پیش بینی می کنید، به یک آزمون یک طرفه نیاز دارید.
    برای ارزیابی اینکه آیا تمرین مدیتیشن به طور قابل توجهی نمرات آزمون ریاضی را بهبود می بخشد یا خیر، از یک آزمون t با نمونه های وابسته و یک دنباله استفاده می کنید. تست به شما مقادیر زیر را می دهد:
    مقدار t (آمار آزمون) 3.00
    مقدار p از 0.0028
  • مثال: آزمون ضریب همبستگی و معناداری
    شما از r پیرسون برای محاسبه قدرت رابطه خطی بین درآمد والدین و معدل در نمونه خود استفاده می کنید. مقدار r پیرسون 0.12 است که نشان دهنده یک همبستگی کوچک در نمونه است.
    اگرچه r پیرسون یک آماره آزمایشی است، اما چیزی در مورد میزان معنادار بودن همبستگی در جامعه به شما نمی گوید. همچنین باید آزمایش کنید که آیا این ضریب همبستگی نمونه به اندازه کافی بزرگ است تا یک همبستگی را در جامعه نشان دهد.آزمون t همچنین می تواند تعیین کند که ضریب همبستگی چقدر با صفر بر اساس حجم نمونه متفاوت است. از آنجایی که انتظار دارید بین درآمد والدین و معدل همبستگی مثبت وجود داشته باشد، از آزمون t تک نمونه ای و یک دنباله استفاده می کنید. تست t به شما می دهد:مقدار t از  3.08
    مقدار p از 0.001

5- مرحله 5: نتایج خود را تفسیر کنید

مرحله نهایی تحلیل آماری، تفسیر نتایج شما است.

1-5- اهمیت آماری

در آزمون فرضیه ها، اهمیت آماری معیار اصلی برای نتیجه گیری است. شما مقدار p خود را با سطح معنی داری (معمولاً 0.05) مقایسه می کنید تا تصمیم بگیرید که آیا نتایج شما از نظر آماری معنی دار هستند یا غیر معنی دار.

نتایج از لحاظ آماری معنی دار بعید به نظر می رسد که صرفاً به دلیل شانس به دست آمده باشند. تنها در صورتی که فرضیه صفر در جامعه صادق باشد، احتمال وقوع چنین نتیجه ای بسیار کم است.

  • مثال: نتایج خود را تفسیر کنید (آزمایشی یا تحقیقی)
    شما مقدار p خود را 0.0027 با آستانه معنی داری 0.05 مقایسه می کنید. از آنجایی که مقدار p شما کمتر است، تصمیم می گیرید که فرضیه صفر را رد کنید و نتایج خود را از نظر آماری معنی دار می دانید.
    این به این معنی است که شما معتقدید مداخله مدیتیشن، به جای عوامل تصادفی، مستقیما باعث افزایش نمرات آزمون شده است.
  • مثال: نتایج خود را تفسیر کنید (مطالعه همبستگی)
    شما مقدار p خود را 0.001 با آستانه معنی داری 0.05 مقایسه می کنید. با مقدار p زیر این آستانه، می توانید فرضیه صفر را رد کنید. این نشان دهنده ارتباط معنی دار آماری بین درآمد والدین و معدل در دانشجویان پسر است.
    توجه داشته باشید که همبستگی همیشه به معنای علیت نیست، زیرا اغلب عوامل زمینه‌ای زیادی در ایجاد متغیر پیچیده‌ای مانند GPA وجود دارد. حتی اگر یک متغیر با متغیر دیگری مرتبط باشد، ممکن است دلیل آن متغیر سومی باشد که بر هر دوی آنها تأثیر می گذارد، یا پیوندهای غیرمستقیم بین دو متغیر.حجم نمونه بزرگ همچنین می‌تواند به شدت بر اهمیت آماری یک ضریب همبستگی تأثیر بگذارد، زیرا ضرایب همبستگی بسیار کوچک را معنی‌دار نشان می‌دهد.

2-5- اندازه اثر

یک نتیجه آماری معنی دار لزوماً به این معنی نیست که برنامه های کاربردی زندگی واقعی یا نتایج بالینی مهمی برای یک یافته وجود دارد.

در مقابل، اندازه اثر نشان دهنده اهمیت عملی نتایج شما است. مهم است که اندازه افکت ها را همراه با آمار استنباطی خود برای تصویر کاملی از نتایج خود گزارش دهید. همچنین اگر در حال نوشتن مقاله ای به سبک APA هستید، باید تخمین فاصله اندازه افکت ها را گزارش کنید.

  • مثال: اندازه اثر (آزمایشی یا تحقیقی)
    شما d کوهن (Cohen’s d) را محاسبه می کنید تا اندازه تفاوت بین نمرات پیش آزمون و پس آزمون را بیابید.
    با d کوهن 0.72، اهمیت عملی متوسط تا بالا در یافته شما وجود دارد که تمرین مدیتیشن نمرات آزمون را بهبود می بخشد.
  • مثال: اندازه اثر (مطالعه همبستگی)
    برای تعیین اندازه اثر ضریب همبستگی، مقدار r پیرسون خود را با معیار اندازه اثر کوهن مقایسه می‌کنید.
    از آنجایی که مقدار شما بین 0.1 و 0.3 است، یافته شما از رابطه بین درآمد والدین و معدل نشان دهنده تأثیر بسیار کمی است و اهمیت عملی محدودی دارد.

3-5- اشتباهات تصمیم گیری

خطاهای نوع اول و دوم اشتباهاتی هستند که در نتیجه گیری تحقیق انجام می شود. خطای نوع I به معنای رد فرضیه صفر زمانی است که واقعاً درست است، در حالی که خطای نوع II به معنای عدم موفقیت در رد فرضیه صفر در صورت نادرست است.

شما می توانید با انتخاب سطح اهمیت بهینه و اطمینان از قدرت بالا، خطر این خطاها را به حداقل برسانید. با این حال، یک معاوضه بین این دو خطا وجود دارد، بنابراین یک تعادل خوب ضروری است.

4-5- آمار Frequentist در مقابل Bayesian

به طور سنتی، آمارهای Frequentist بر آزمون اهمیت فرضیه صفر تأکید می‌کنند و همیشه با فرض یک فرضیه صفر واقعی شروع می‌شوند.

با این حال، آمار Bayesian به عنوان یک رویکرد جایگزین در چند دهه اخیر محبوبیت یافته است. در این رویکرد، شما از تحقیقات قبلی برای به روز رسانی مداوم فرضیه های خود بر اساس انتظارات و مشاهدات خود استفاده می کنید.

عامل Bayes قدرت نسبی شواهد را برای فرضیه صفر در مقابل فرضیه جایگزین مقایسه می کند تا اینکه در مورد رد فرضیه صفر نتیجه گیری کند یا خیر.

6- سوالات متداول در مورد تحلیل آماری

  • 1- تحلیل آماری چیست؟

تجزیه و تحلیل آماری روش اصلی برای تجزیه و تحلیل داده های کمی پژوهش است. از احتمالات و مدل‌ها برای آزمایش پیش‌بینی‌های یک جمعیت از داده‌های نمونه استفاده می‌کند.

جهت آشنایی بیشتر می توانید مقاله زیر را با عنوان تحلیل آماری چیست مطالعه نمایید.

  • 2- تفاوت آمار توصیفی و استنباطی چیست؟

آمار توصیفی ویژگی های یک مجموعه داده را خلاصه می کند. آمار استنباطی به شما امکان می دهد یک فرضیه را آزمایش کنید یا ارزیابی کنید که آیا داده های شما قابل تعمیم به جمعیت گسترده تر هستند یا خیر.

  • 3- آزمون فرضیه چیست؟

آزمون فرضیه یک روش رسمی برای بررسی ایده های ما در مورد جهان با استفاده از آمار است. دانشمندان از آن برای آزمایش پیش‌بینی‌های خاص، به نام فرضیه، استفاده می‌کنند و محاسبه می‌کنند که چقدر احتمال دارد که یک الگو یا رابطه بین متغیرها به طور تصادفی به وجود آمده باشد.

  • 4- فرضیه های صفر و جایگزین کدامند؟

در آزمون فرضیه های آماری از فرضیه های صفر و جایگزین استفاده می شود. فرضیه صفر یک آزمون همیشه عدم تأثیر یا عدم رابطه بین متغیرها را پیش‌بینی می‌کند، در حالی که فرضیه جایگزین پیش‌بینی تحقیق شما از یک اثر یا رابطه را بیان می‌کند.

  • 5- معنی آماری چیست؟

اهمیت یا معنی آماری اصطلاحی است که توسط محققان برای بیان اینکه بعید است مشاهدات آنها تحت فرضیه صفر یک آزمون آماری رخ داده باشد، استفاده می‌کنند. اهمیت معمولاً با مقدار p یا مقدار احتمال مشخص می شود.

اهمیت آماری دلخواه است – به آستانه یا مقدار آلفای انتخاب شده توسط محقق بستگی دارد. رایج‌ترین آستانه p <0.05 است، به این معنی که داده‌ها احتمالاً کمتر از 5 درصد مواقع تحت فرضیه صفر رخ می‌دهند. هنگامی که مقدار p به زیر مقدار آلفای انتخابی می‌رسد، می‌گوییم که نتیجه آزمون از نظر آماری معنی‌دار است.

اشتراک گذاری این محتوا، پلتفرم خود را انتخاب کنید!
مطالب مرتبط دیگر :

  • رگرسیون لجستیک (logistic regression) چیست؟
رگرسیون لجستیک (logistic regression) چیست؟

اکتبر 4, 2024|بدون دیدگاه

چکیده مقاله:رگرسیون لجستیک احتمال وقوع یک رویداد، مانند رای دادن یا رای ندادن، را بر اساس یک مجموعه داده از متغیرهای مستقل تخمین می‌زند. این نوع مدل آماری (که به آن مدل لاجیت نیز گفته [...]

  • الگوریتم خفاش (Bat Algorithm) چیست؟
الگوریتم خفاش (Bat Algorithm) چیست؟

اکتبر 3, 2024|بدون دیدگاه

چکیده مقاله: الگوریتم خفاش (Bat Algorithm) یک الگوریتم فراابتکاری مبتنی بر جمعیت است که برای حل مسائل بهینه سازی پیوسته استفاده می شود. این الگوریتم برای بهینه سازی راه حل ها در رایانش ابری، [...]

  • الگوریتم کرم شب تاب چیست؟
الگوریتم کرم شب تاب چیست؟

اکتبر 3, 2024|بدون دیدگاه

چکیده مقاله: الگوریتم کرم شب تاب چیست؟ الگوریتم های الهام گرفته از زیست، که به عنوان الگوریتم های الهام گرفته از طبیعت یا الگوریتم های تکاملی نیز شناخته می شوند، تکنیک های محاسباتی هستند [...]

  • آزمون فریدمن: تعریف، فرضیات، زمان استفاده و مثال
آزمون فریدمن: تعریف، فرضیات، زمان استفاده و مثال

سپتامبر 30, 2024|بدون دیدگاه

چکیده مقاله: آزمون فریدمن ابزاری آماری برای مقایسه نمونه‌ها یا اندازه‌گیری‌های مکرر است زمانی که مفروضات پارامتریک برآورده نمی‌شوند. در واقع آزمون فریدمن توسعه‌ای از آزمون Wilcoxon signed-rank test و آنالوگ ناپارامتری از اندازه‌گیری [...]

  • برنامه نویسی فرانت اند: راهنمای جامع توسعه فرانت اند
برنامه نویسی فرانت اند: راهنمای جامع توسعه فرانت اند

سپتامبر 27, 2024|بدون دیدگاه

چکیده مقاله: اگر بخواهیم فرانت اند (Front-end) یا با اسم های دیگر سمت مشتری یا سمت کاربر را توضیح دهیم بهتر است بدانید که توسعه دهنده فرانت اند (Front-End Developer) به کمک زبان های برنامه [...]

  • برنامه نویسی تحت وب چیست؟ انواع، کاربرد و عملکرد
برنامه نویسی تحت وب چیست؟ انواع، کاربرد و عملکرد

سپتامبر 24, 2024|بدون دیدگاه

چکیده مقاله: امروزه تصور جهانی بدون اینترنت و وب سایت‌ها تقریباً غیرممکن است. در سال‌های اخیر، تقاضا برای برنامه نویسان وب حرفه‌ای به طور چشمگیری افزایش یافته است، بنابراین می توانید انواع کارشناسان این [...]