تحليل التباين (ANOVA) هو أسلوب إحصائي يستخدم لمقارنة وسائل ثلاث مجموعات أو أكثر . يتم استخدامه لتحديد ما إذا كانت هناك اختلافات كبيرة بين المجموعات وأي منها مختلفة.
في ANOVA، تتم مقارنة الفروق بين المجموعات لتحديد ما إذا كانت هناك فروق ذات دلالة إحصائية في الوسائل . يتم استخدام اختبار إحصائي يسمى F لتحديد ما إذا كانت الاختلافات المرصودة ذات دلالة إحصائية.
وتستخدم هذه الصيغة في العديد من المجالات، مثل البحث العلمي والطب وعلم النفس والاقتصاد والصناعة. عادةً ما يتم استخدامه لتحليل البيانات من مجموعات متعددة واستخلاص استنتاجات حول الاختلافات بينها .
على سبيل المثال، لتقييم مدى فعالية دواء السكري، يستخدم العلماء تحليل التباين لدراسة العلاقة بين الدواء ووجود السكر في الدم.
في هذه الحالة، السكان المحتفظ بهم للعينة يتوافق مع مجموعة من المرضى. وبعد ذلك يتم تقسيم العينة إلى مجموعات مختلفة ويتم إعطاء كل مجموعة دواء محدد خلال فترة زمنية. وفي نهاية هذه العملية، يتم قياس كمية السكر في دم كل شخص.
وبناء على النتيجة يتم تحديد متوسط مستوى السكر في الدم لكل مجموعة. في هذه المرحلة، ANOVA يسمح لك بمقارنة جميع وسائل المجموعة لمعرفة ما إذا كانت متشابهة أم لا .
ماذا يعني مصطلح أنوفا؟
لفهم تحليل التباين بشكل أفضل، من المهم التحدث قليلاً عن مصطلحاته. دعونا نرى إذن ما يمثله هذا.
- المتغير التابع : هو العنصر الذي يتم قياسه وتأثره بالمتغيرات المستقلة.
- المتغير المستقل : يمكن أن يكون متغيرًا تابعًا واحدًا أو أكثر. ومثل المتغير التابع، يتم قياس هذا الأخير أيضا، لكنه لا يتأثر، بل كما ذكرنا من قبل، هو ما يؤثر على المتغير التابع.
- فرضية العدم (HO): تحدث في الحالات التي لا يوجد فيها تمييز بين الوسائل. وبناء على نتيجة تحليل التباين يتم قبول الفرضية أو رفضها.
- الفرضية البديلة (H1): تحدث قبل الفرق المفترض بين الوسائل والمجموعات.
- العوامل والمستويات : تمثل المتغيرات المستقلة العوامل التي تؤثر على المتغير التابع. يحدد المستوى القيم المختلفة للمتغير المستقل المستخدم في الاستطلاع.
- نموذج العامل الثابت – تستخدم بعض الأبحاث مجموعة واحدة بسيطة من المستويات للعوامل. وللفهم بشكل أفضل، يقوم اختبار العامل الثابت بتحليل ثلاث جرعات مختلفة من الدواء ولا يتطلب مشاركة جرعات إضافية، على سبيل المثال.
- نموذج العامل العشوائي – يقوم هذا النموذج بإنشاء قيمة مستوى عشوائي من جميع القيم الموجودة في المتغير المستقل.
ما هو تحليل التباين المستخدمة ل؟
هل سبق لك أن تساءلت عن الغرض من تحليل التباين؟ في الواقع، إنها أداة أساسية للإحصاءات. وبعد ذلك، سنشرح فائدته بطريقة بسيطة.
تخيل أن لديك عدة مجموعات وتريد معرفة ما إذا كانت هناك اختلافات كبيرة بينها. تحليل التباين يسمح لك بالقيام بذلك. بعبارات بسيطة، يتضمن الأمر مقارنة عدة كعكات لمعرفة أي منها هو ألذ .
يقوم تحليل التباين بفحص الاختلافات بين المجموعات ويحدد ما إذا كانت هذه الاختلافات كبيرة بما يكفي لاعتبارها ذات أهمية أم أنها مجرد نتيجة للصدفة .
بمعنى آخر، الأمر أشبه بوزن الكعك لمعرفة أيهما أثقل. إذا كان الفرق كبيرًا، فيمكنك القول بثقة أن هناك فرقًا كبيرًا بين المجموعتين. إذا كان الفرق صغيرًا، فلا يوجد دليل كافٍ لاستنتاج أن هناك فرقًا حقيقيًا.
ماذا يعني F في اختبار ANOVA؟
يمثل “F” في اختبار ANOVA إحصائية F، وهي النتيجة عن طريق حساب نسبة التباين بين المجموعات والتباين داخل المجموعات .
في تحليل التباين (ANOVA)، يتم استخدام إحصائية F لمقارنة وسائل ثلاث مجموعات أو أكثر وتحديد ما إذا كانت هناك فروق ذات دلالة إحصائية بينها . تشير قيمة F العالية إلى تباين أكبر بين المجموعة مقارنة بالتباين داخل المجموعة، مما يشير إلى أن اثنين على الأقل من الوسائل مختلفان وأن هناك اختلافات كبيرة.
كيف يتم تحليل التباين؟
لإجراء تحليل التباين، تتكون العملية بشكل أساسي من التحليل – مقارنة القياسات – تحليل التباين للعامل . دعونا نلقي نظرة فاحصة خطوة بخطوة لفهم أفضل.
الخطوة الأولى : صياغة الفرضيات
قم بإنشاء فرضية صفرية (H0) مفادها أنه لا توجد فروق ذات دلالة إحصائية بين وسائل المجموعة وفرضية بديلة (H1) تشير إلى وجود وسيلتين مختلفتين على الأقل.
الخطوة 2 : جمع البيانات
احصل على بيانات من مجموعات مختلفة تريد مقارنتها. تأكد من أن لديك ثلاث مجموعات على الأقل لتتمكن من تطبيق تحليل التباين.
الخطوة 3 : حساب مجموع المربعات
لحساب مجموع المربعات بين المجموعات (SSG)، وهو التباين بين متوسطات المجموعة، ومجموع المربعات داخل المجموعة (SSD)، وهو تباين البيانات داخل كل مجموعة.
الخطوة 4 : حساب درجات الحرية
يحدد درجات الحرية لـ SSG وSSD. تُستخدم درجات الحرية لتحديد القيم الحرجة في جداول التوزيع F.
الخطوة 5 : حساب إحصائية F
تطبيق معادلة تحليل التباين: F = SSG ÷ SSD. قسمة مجموع المربعات بين المجموعات على مجموع المربعات داخل المجموعات.
الخطوة 6 : المقارنة مع القيمة الحرجة
قارن القيمة المحسوبة لـ F بالقيمة الحرجة لجدول توزيع F لمستوى الأهمية الخاص بك (عادةً 0.05 أو 0.01). إذا كانت القيمة المحسوبة لـ F أكبر من القيمة الحرجة، فسيتم رفض فرضية العدم، مما يشير إلى وجود اختلافات كبيرة بين وسطين على الأقل من متوسطات المجموعة.
الخطوة 7 : تفسير النتائج
تفسير النتائج وفقا للفرضيات المختلفة المطروحة. إذا تم رفض فرضية العدم، فيمكنك استنتاج أن هناك وسيلتين مختلفتين على الأقل في المجموعات التي تقارنها.
ما هي صيغة أنوفا؟
كما ذكرنا سابقًا، ANOVA هي تقنية إحصائية تستخدم لمقارنة وسائل ثلاث مجموعات أو أكثر وتحديد ما إذا كانت هناك فروق ذات دلالة إحصائية بينها.
صيغة أنوفا هي:
F = (SSG ÷ k-1) ÷ (SSD ÷ Nk)
ذهب:
F : هذه هي إحصائية F، والتي يتم الحصول عليها عن طريق قسمة التباين بين المجموعات (SSG) على التباين داخل المجموعة (SSD).
SSG : هذا هو مجموع المربعات بين المجموعات، والذي يقيس التباين بين وسائل المجموعة.
k : هذا هو عدد المجموعات التي تمت مقارنتها.
SSD : هذا هو مجموع المربعات داخل المجموعات، والذي يقيس التباين داخل كل مجموعة.
N : هذا هو العدد الإجمالي للملاحظات في جميع المجموعات.
k-1 : هذا هو عدد درجات الحرية بين المجموعات، ويتم الحصول عليها بطرح 1 من عدد المجموعات.
Nk : هذا هو عدد درجات الحرية داخل المجموعات، والتي يتم الحصول عليها عن طريق طرح عدد المجموعات من إجمالي عدد الملاحظات.
باختصار، تقارن صيغة ANOVA التباين بين المجموعات مع التباين داخل المجموعة، ويتم الحصول على إحصائية F بتقسيم هذين المتغيرين. تشير القيمة العالية لـ F إلى اختلافات كبيرة بين وسائل المجموعة.
ما هي حدود تحليل التباين؟
على الرغم من أن هذا المورد ذو أهمية كبيرة، إلا أنه تجدر الإشارة إلى أن لديه بعض القيود التي يجب وضعها في الاعتبار. دعونا نلقي نظرة على بعض منهم، الآن.
- فهو يدرس فقط الاختلافات في المتوسط بين المجموعات . ولا يأخذ في الاعتبار المقاييس الإحصائية الأخرى، مثل التشتت أو شكل توزيع البيانات.
- ويستند إلى افتراضات إحصائية ، مثل طبيعية البيانات وتجانس التباينات. إذا لم يتم استيفاء هذه الافتراضات، فقد لا تكون النتائج موثوقة.
- تحليل التباين يحدد فقط الاختلافات الإحصائية بين المجموعات، لكنه لا يقيم علاقات سببية . قد تكون هناك عوامل أخرى أو متغيرات مربكة تؤثر على النتائج.
- ينطبق تحليل التباين على البيانات العددية ولا يتناسب مع البيانات الفئوية أو النوعية .
- إنه يحدد فقط ما إذا كانت هناك اختلافات كبيرة بين مجموعتين على الأقل، لكنه لا يحدد على وجه التحديد المجموعات التي تختلف عن بعضها البعض .
مثال لتحليل التباين
في هذه المرحلة، حان الوقت لشرح مثال بسيط ولكنه واضح لفهم تحليل التباين بشكل أفضل. أذهب خلفها !
لنتخيل أننا نريد مقارنة متوسط درجات ثلاث مواد: الرياضيات والتاريخ والعلوم. لدينا المؤهلات التالية لـ 10 طلاب في كل مادة:
الرياضيات: 80، 85، 90، 95، 100، 105، 110، 115، 120، 125
التاريخ: 75، 80، 85، 90، 95، 100، 105، 110، 115، 120
العلوم: 78، 83، 88، 93، 98، 103، 108، 113، 118، 123
الخطوة الأولى : تحديد هدف البحث ووضع الفرضيات
نريد أن نعرف إذا كانت هناك اختلافات في متوسط درجات المواد الثلاثة. ستكون فرضيتنا الصفرية (H0) هي أنه لا توجد فروق ذات دلالة إحصائية، وستكون فرضيتنا البديلة (H1) هي أن موضوعًا واحدًا على الأقل لديه اختلافات كبيرة في الدرجات.
الخطوة الثانية : جمع البيانات وتنظيمها
لقد قمنا بتجميع الدرجات في كل مادة ونظمناها في جدول كما هو موضح أعلاه.
الخطوة 3 : حساب الإحصائيات الوصفية
نحسب المتوسط والتباين للدرجات في كل مادة:
الرياضيات المعدل التراكمي: 100
الانحراف الرياضي: 625
متوسط التاريخ: 95
الفجوة التاريخية: 625
متوسط العلوم: 100
الفجوة العلمية: 625
الخطوة 4 : إجراء تحليل التباين
نستخدم البرامج الإحصائية أو الآلة الحاسبة لإجراء تحليل التباين. لنفترض أننا حصلنا على النتائج التالية:
إحصائية F: 1.5
القيمة p: 0.25
الخطوة 5 : تفسير النتائج:
وبما أن القيمة p (0.25) أكبر من مستوى الأهمية المحدد مسبقًا (على سبيل المثال، 0.05)، فليس لدينا أدلة إحصائية كافية لرفض فرضية العدم. ونستنتج أنه لا توجد فروق ذات دلالة إحصائية في متوسط الدرجات بين المواد الثلاثة.
يرجى تذكر أن هذا مجرد مثال وقد تختلف النتائج حسب البيانات ومستوى الأهمية المستخدم.