ما هو التباين؟

التباين هو مقياس إحصائي يخبرنا بمدى جودة توزيع البيانات حول المتوسط . إنه مثل قياس مدى “انتشار” البيانات من القيمة المتوسطة.

تخيل أن لديك قائمة من الأرقام، مثل درجات الاختبار. يساعدك التباين على فهم مدى اختلاف هذه الدرجات عن بعضها البعض . إذا كانت الدرجات قريبة جدًا من بعضها البعض، فسيكون التباين منخفضًا. ولكن إذا كان هناك الكثير من الاختلافات بين الدرجات، فإن التباين سيكون مرتفعا.

بشكل عام، يعد التباين أداة مفيدة لفهم تشتت البيانات في مجموعة من القيم. إذا كان التباين مرتفعًا، فهذا يعني أن البيانات أكثر انتشارًا، بينما إذا كان منخفضًا، فهذا يعني أن البيانات أقرب إلى بعضها البعض.

كيف يتم حساب الفجوة؟

لحساب التباين، عليك اتخاذ بعض الخطوات الرياضية، لكن لا تقلق، فالأمر أسهل مما يبدو. أولا، تحتاج إلى حساب متوسط أو متوسط البيانات. ثم اطرح كل جزء من البيانات من المتوسط وقم بتربيع كل فرق. ثم تقوم بجمع كل هذه المربعات وتقسيمها على كمية البيانات. إنه التباين.

لفهم هذا بشكل أفضل، دعونا نرى مثالاً لحساب التباين، أدناه:

الخطوة 1: الحصول على البيانات

لنفترض أن لديك البيانات التالية: 5، 7، 9، 11، 13. هذه هي القيم من عينة البيانات التي تريد حساب التباين لها.

الخطوة الثانية: حساب المتوسط

أضف كل القيم واقسمها على إجمالي كمية البيانات للحصول على المتوسط:

المتوسط = (5 + 7 + 9 + 11 + 13) ÷ 5 = 45 ÷ 5 = 9

متوسط البيانات هو 9.

الخطوة 3: طرح المتوسط من كل نقطة بيانات

اطرح المتوسط الذي تم الحصول عليه في الخطوة السابقة من كل عنصر بيانات في القائمة:

5 – 9 = -4

7 – 9 = -2

9 – 9 = 0

11 – 9 = 2

13 – 9 = 4

الخطوة 4: مربع كل الفرق

قم بتربيع كل الاختلافات التي تم الحصول عليها في الخطوة السابقة:

(-4) 2 = 16

(-2) 2 = 4

0 2 = 0

2 2 = 4

4 2 = 16

الخطوة 5: أضف مربعات الاختلافات

أضف جميع النتائج التي تم الحصول عليها في الخطوة السابقة:

16 + 4 + 0 + 4 + 16 = 40

الخطوة 6: القسمة على كمية البيانات

اقسم مجموع مربعات الاختلافات على إجمالي كمية البيانات (في هذه الحالة، 5):

الانحراف = 40 ÷ 5 = 8

تباين البيانات هو 8 .

ما هي صيغة التباين؟

قبل تحليل هذه النقطة، من المهم الإشارة إلى أن التباين له أهمية كبيرة في الإحصاء. وعلى الرغم من كونه مقياسًا بسيطًا إلى حد ما، إلا أنه يوفر معلومات مثيرة للاهتمام بناءً على متغير محدد.

ستكون وحدة القياس دائمًا هي التي تتوافق مع البيانات، ولكن مربعة. بالإضافة إلى ذلك، تجدر الإشارة إلى أن التباين يساوي دائمًا الصفر أو أكبر منه. وذلك لأن البقايا تكون مربعة دائمًا، لذلك، من الناحية الرياضية، من المستحيل أن يكون هناك تباين سلبي.

مع أخذ ذلك في الاعتبار، نعرض لك أدناه صيغة التباين:

صيغة الانحراف

S2 = الفجوة

x i = مصطلح مجموعة البيانات

X̄ = قياس العينة

∑ = المجموع

ن = حجم العينة

ما هو التباين العالي والمنخفض؟

ويعتبر التباين مرتفعا عندما تكون البيانات في العينة الإحصائية أو المجتمع نادرة وبعيدة عن المتوسط . وهذا يعني أن القيم الفردية في البيانات موزعة على نطاق واسع وهناك تباين كبير في البيانات.

في المقابل، يعتبر التباين منخفضًا عندما تكون البيانات الموجودة في العينة أو المجتمع أقرب إلى المتوسط ويكون هناك تشتت قليل بين القيم الفردية. وهذا يعني أن البيانات أكثر اتساقًا وأقل تنوعًا.

ما هي الاستخدامات الرئيسية للتباين؟

التباين هو مقياس إحصائي يستخدم على نطاق واسع في مختلف المجالات بسبب قدرته على تقييم تشتت أو تباين البيانات في العينة. بعض الاستخدامات الرئيسية للتباين هي:

في الإحصاء الوصفي – لوصف تشتت البيانات في العينة، مما يساعد على فهم كيفية انحراف القيم الفردية عن المتوسط وكيفية توزيعها داخل العينة.

في الإحصائيات الاستدلالية – لتقدير تباين البيانات في مجتمع ما من عينة، مما يسمح بإجراء استنتاجات حول السكان ككل.

في التمويل : في تحليل مخاطر الاستثمار والعائد، حيث يشير التباين الأعلى إلى مخاطر أعلى ويشير التباين الأقل إلى انخفاض المخاطر في المحفظة الاستثمارية.

في البحث العلمي – تحليل تباين البيانات في الدراسات العلمية، مثل البحوث الطبية وعلم الأحياء وعلم النفس وغيرها من التخصصات، لفهم تباين النتائج واتساق البيانات.

في مراقبة جودة العملية : في مراقبة جودة العمليات الصناعية لقياس تباين المنتجات أو الخدمات المصنعة، مما يجعل من الممكن تحديد مشاكل الاتساق وجودة العملية.

في الاقتصاد القياسي : في نمذجة وتحليل البيانات الاقتصادية لفهم تباين المتغيرات الاقتصادية وتقييم موثوقية نماذج الاقتصاد القياسي.

ما هو معنى التباين ؟

يعد التباين مهمًا لأنه يسمح لك بفهم تباين البيانات في العينة . إذا كان التباين مرتفعا، فهذا يعني أن البيانات متفرقة وهناك الكثير من التباين. وهذا مهم لاتخاذ قرارات مستنيرة في مجالات مثل الاستثمار وإدارة المخاطر وتحليل البيانات.

بالإضافة إلى ذلك، يساعدك التباين على فهم تناسق البيانات في العينة أو المحتوى. يشير التباين المنخفض إلى أن البيانات متسقة وبها قدر قليل من التباين، بينما يشير التباين العالي إلى أن البيانات أقل اتساقًا وبها قدر أكبر من التباين.

هل الانحراف المعياري والتباين متساويان؟

الانحراف المعياري والتباين هما مقياسان إحصائيان مرتبطان يصفان انتشار أو تباين البيانات في العينة أو المجتمع. والفرق الرئيسي بينهما هو وحدة القياس وتفسير النتائج.

التباين هو مقياس يمثل تشتت البيانات من وسطها، ويتم حسابه على أنه مجموع مربعات انحرافات القيم الفردية عن الوسط، مقسومًا على إجمالي عدد البيانات.

ويتم حسابه عن طريق تربيع الاختلافات بين كل قيمة والمتوسط، ثم جمعها وتقسيمها على العينة أو حجم السكان. يتم التعبير عن التباين بوحدات مربعة وقد يكون من الصعب تفسيره مباشرة لأنه على مقياس مختلف عن البيانات الأصلية.

ومن ناحية أخرى، فإن الانحراف المعياري ليس أكثر من الجذر التربيعي للتباين . ويتم حسابه على أنه الجذر التربيعي الموجب للتباين. يتم التعبير عن الانحراف المعياري بنفس وحدات البيانات الأصلية وهو مقياس أكثر سهولة لتشتت البيانات.

ويشير الانحراف المعياري الأعلى إلى انتشار أو تقلب أكبر في البيانات، في حين يشير الانحراف المعياري الأقل إلى انتشار أو تقلب أقل.

الفجوة للبيانات المجمعة

يشير تباين البيانات المجمعة إلى حساب تباين أو تشتت البيانات المجمعة في فترات أو فئات . بدلاً من الحصول على بيانات فردية، كما هو الحال في حالة التباين للبيانات غير المجمعة، لديك نطاقات أو فواصل زمنية تقع فيها البيانات.

يتم حساب التباين للبيانات المجمعة باستخدام صيغة مختلفة قليلاً. أولاً، يتم حساب نقطة المنتصف لكل فترة، وهي متوسط الحدين الأدنى والأعلى لكل فترة. ثم يتم حساب المتوسط المرجح لنقاط المنتصف باستخدام التكرارات النسبية أو المطلقة للفترات كأوزان.

ومن هذا المتوسط المرجح يتم حساب التباين وفقا لنفس الصيغة المستخدمة في البيانات غير المجمعة ، أي متوسط مربعات الفروق بين القيم الفردية والمتوسط المرجح.

يكون تباين البيانات المجمعة مفيدًا عند العمل مع مجموعات البيانات المقدمة على شكل فواصل أو فئات، مثل البيانات الديموغرافية أو البيانات الاقتصادية أو أي نوع آخر من البيانات المجمعة في فئات أو نطاقات.

خصائص التباين

التباين هو مقياس إحصائي له العديد من الخصائص المهمة. بعض الخصائص الرئيسية للتباين هي:

  • إنها دائمًا قيمة غير سالبة ، حيث يتم تعريفها على أنها متوسط مربعات الاختلافات بين البيانات الفردية والمتوسط.
  • وهو حساس للقيم المتطرفة أو الخارجية في البيانات ، لأنه مربع الاختلافات.
  • تحتوي على وحدات مربعة ، مما يعني أنها موجودة في نفس الوحدة المربعة مثل البيانات الأصلية.
  • ويمكن أن تتأثر بالقيم المتطرفة أو البيانات المتطرفة، مما قد يجعلها مقياسًا غير قوي لتقلب البيانات.
  • إذا كانت البيانات مستقلة وغير مترابطة مع بعضها البعض، فإن التباين في مجموع مجموعتين من البيانات يساوي مجموع التباين في مجموعتي البيانات .

أمثلة على الانحراف

الآن بعد أن فهمنا مفهوم التباين وأهميته، دعونا نلقي نظرة على مثال عملي لفهم كيفية عمله بشكل أفضل.

لنفترض أن لدينا البيانات التالية عن النتيجة الاقتصادية لشركة ما بملايين الدولارات خلال السنوات الخمس الماضية: 8، 12، 6، -4، 10. نريد حساب تباين مجموعة البيانات هذه باستخدام الصيغة المذكورة سابقًا.

الخطوة الأولى: حساب الوسط الحسابي

أولاً، نقوم بحساب الوسط الحسابي للبيانات عن طريق جمعه وتقسيمه على إجمالي عدد البيانات (5 في هذه الحالة):

المتوسط الحسابي (X̄) = (8 + 12 + 6 – 4 + 10) ÷ 5 = 6.4 مليون دولار

الخطوة 2: استخدم صيغة التباين

بعد ذلك، نستخدم صيغة التباين لحساب مربع الفروق بين كل نقطة بيانات والوسط الحسابي، ثم نجمعهما معًا:

صيغة الانحراف

حيث x i هو كل عنصر من عناصر البيانات، وX̄ هو الوسط الحسابي، وn هو العدد الإجمالي لعناصر البيانات.

نستبدل البيانات والوسط الحسابي في صيغة التباين:

الانحراف (Var(X)) = [(8 – 6.4) 2 + (12 – 6.4) 2 + (6 – 6.4) 2 + (-4 – 6.4) 2 + (10 – 6,4) 2 ] ÷ (5) – 1)

الخطوة 3: حل العمليات

الآن دعونا نحل العمليات للحصول على قيمة التباين:

الانحراف (Var(X)) = [1.6 2 + 5.6 2 + 0.16 2 + (-10.4) 2 + 3.6 2 ] ÷ 4

الانحراف (فار(X)) = [2.56 + 31.36 + 0.0256 + 108.16 + 12.96] ÷ 4

الانحراف (Var(X)) = 155.072 ÷ 4

التباين (Var(X)) = 38.768 مليون مربع

يبلغ تباين مجموعة البيانات هذه 38.768 مليون مربع، وهو ما يمنحنا مقياسًا لتشتت أو تباين البيانات بالنسبة إلى الوسط الحسابي.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

Scroll to Top