Стандарт или стандартное отклонение — это статистическая мера, которая показывает, насколько далеки отдельные точки данных от среднего или среднего значения набора данных. Это мера дисперсии, которая используется, чтобы понять, насколько данные отличаются от среднего значения по ансамблю.
Говоря более сложным языком, стандартное или стандартное отклонение — это квадратный корень из дисперсии . Дисперсия рассчитывается как среднее значение квадратов разностей между каждым элементом данных и общим средним значением. Извлечение квадратного корня из дисперсии дает стандартное отклонение, которое выражается в тех же единицах, что и исходные данные.
Стоит отметить, что это важный показатель в статистике. Благодаря этому можно количественно оценить разброс данных и понять, как они распределяются по сравнению со средним значением. Низкое стандартное отклонение указывает на то, что данные имеют тенденцию быть близкими к среднему значению. С другой стороны, высокое стандартное отклонение указывает на то, что данные более разбросаны или далеки от среднего значения.
Обычно стандартное отклонение используется для понимания изменчивости данных в наборе и для сравнения.
Для чего используется стандартное отклонение?
Стандартное отклонение — это статистический инструмент, который имеет несколько применений при анализе данных. Некоторые из наиболее известных утилит:
- Мера дисперсии : определяет, насколько отдельные данные далеки от среднего или среднего значения в целом. Высокое стандартное отклонение указывает на большую дисперсию или изменчивость данных, а низкое стандартное отклонение указывает на меньшую дисперсию.
- Сравнение наборов данных . Может использоваться для сравнения изменчивости между различными наборами данных. Набор с большим стандартным отклонением будет содержать более разбросанные данные, чем набор с меньшим стандартным отклонением.
- Идентификация выбросов . Это также может помочь выявить выбросы или экстремумы в наборе данных. Если точка данных отличается от среднего значения на несколько стандартных отклонений, это может указывать на то, что это необычное или выпадающее значение.
- Оценка точности модели . В некоторых случаях стандартное отклонение используется как мера точности модели или оценки. Например, в статистическом выводе стандартное отклонение можно использовать для расчета доверительных интервалов или проверки гипотез.
Свойства стандартного отклонения
Стандартное отклонение имеет несколько важных свойств, о которых стоит упомянуть:
- Стандартное отклонение — это мера расстояния, поэтому оно всегда является неотрицательным значением .
- Если все данные в наборе имеют одинаковое значение, стандартное отклонение будет равно нулю .
- На него влияют выбросы , и на него можно существенно повлиять в наборе данных.
- Он чувствителен к масштабу данных . Если данные крупномасштабные, стандартное отклонение также будет большим, и наоборот.
- Это мера относительной дисперсии , поскольку она выражается в тех же единицах, что и исходные данные.
Какова формула стандартного отклонения?
Математическая формула стандартного отклонения:
Золото:
σ: представляет стандартное отклонение.
Σ: указывает сумму.
xi: Это отдельные значения набора данных.
Среднее: это среднее или среднее значение набора данных.
n — общее количество данных в наборе.
Стандартное отклонение — это мера дисперсии, которая позволяет нам понять, насколько данные в наборе отличаются от их среднего или среднего значения. Его получают путем вычисления квадратного корня из суммы квадратов разностей между каждым значением в наборе и средним значением набора, деленной на общее количество данных в наборе.
Как рассчитывается стандартное отклонение?
Стандартное отклонение рассчитывается с помощью следующих шагов:
1. Рассчитайте среднее или среднее значение набора данных.
Среднее значение получается путем сложения всех значений в наборе данных и деления результата на общее значение данных. Математически это выражается:
Где xi — каждое из значений в наборе данных, n — количество элементов данных в наборе, а Σ представляет собой сумму.
2. Вычтите среднее значение из каждого значения в наборе данных.
Чтобы получить разницу между каждым значением в наборе данных и средним значением, среднее значение (рассчитанное на предыдущем шаге) вычитается из каждого значения в наборе данных. Это позволяет нам определить, насколько данные далеки от среднего.
3. Возведите в квадрат каждую из разностей, полученных на предыдущем шаге.
Разности, полученные на предыдущем шаге, возводятся в квадрат. Этот шаг выполняется для того, чтобы положительные и отрицательные различия не компенсировали друг друга, а также чтобы подчеркнуть значения, наиболее далекие от среднего.
4. Рассчитаем среднее значение полученных на предыдущем шаге значений.
Вычисляется среднее значение полученных на предыдущем шаге значений. Это среднее значение представляет собой сумму квадратов различий, деленную на общее количество данных. Математически это выражается:
Среднеквадратичная разность = Σ((xi – среднее)²) ÷ n
5. Получите квадратный корень из значения, полученного на предыдущем шаге.
Последний шаг — получить квадратный корень из значения, полученного на предыдущем шаге. Это обеспечивает стандартное отклонение, которое является мерой отклонения данных от среднего значения.
Как интерпретируется стандартное отклонение?
Важно отметить, что интерпретация стандартного отклонения зависит от контекста и характера изучаемых данных .
Поэтому важно полностью понимать значение стандартного отклонения и использовать его в сочетании с другими статистическими показателями, чтобы получить полное и точное понимание изменчивости данных. Давайте посмотрим на некоторые примеры ниже.
Анализ изменчивости
Стандартное отклонение используется для оценки изменчивости или дисперсии данных в наборе . Если стандартное отклонение низкое, это указывает на то, что данные близки к среднему значению и имеют небольшую изменчивость. С другой стороны, если стандартное отклонение велико, это указывает на то, что данные более разбросаны и имеют большую изменчивость.
сравнение данных
Это полезно для сравнения изменчивости между различными наборами данных . Например, если сравнить стандартное отклонение дохода двух стран, можно сделать вывод, какая из стран имеет большую изменчивость доходов населения.
Выявление выбросов
Помогает выявить выбросы или необычные данные в наборе . Данные, которые превышают 1 или 2 стандартных отклонения от среднего значения, можно считать выбросами.
Оценка точности измерений
Он также используется в качестве меры точности или надежности измерения или оценки . Например, если вы проводите исследование и получаете измерения с высоким стандартным отклонением, это может указывать на то, что измерения менее точны и необходимо проявлять больше осторожности при сборе данных.
Оценка нормальности данных
Стандартное отклонение используется в сочетании с другими показателями для оценки того, соответствуют ли данные нормальному распределению . Если данные имеют небольшое стандартное отклонение от среднего значения, это может указывать на то, что данные распределены примерно в соответствии с нормальным распределением.
Численные примеры стандартного отклонения
Хотя это правда, что, вообще говоря, оно может быть сложным, стандартное отклонение понимается просто. Чтобы прояснить сомнения, ниже мы приведем несколько примеров, используя два разных метода.
квадратный корень из дисперсии
Предположим, у нас есть следующие данные: 9, 3, 8, 9 и 16.
Шаг 1: Рассчитайте среднее арифметическое:
Среднее арифметическое = (9 + 3 + 8 + 9 + 16) ÷ 5 = 9.
Шаг 2: Примените формулу отклонения:
Отклонение = [(9 – 9) 2 + (3 – 9) 2 + (8 – 9) 2 + (9 – 9) 2 + (16 – 9) 2 ] ÷ 5 = 86 ÷ 5 = 17,2.
Шаг 3: Извлеките квадратный корень из дисперсии:
Стандартное отклонение = √(17,2) ≈ 4,14.
Сумма отклонений и деление на общее количество наблюдений
Предположим, у нас есть следующие данные: 2, 4, 2, 4, 2 и 4.
Шаг 1: Рассчитайте среднее арифметическое:
Среднее арифметическое = (2 + 4 + 2 + 4 + 2 + 4) ÷ 6 = 3.
Шаг 2: Рассчитайте стандартное отклонение, сложив отклонения и разделив их на общее количество наблюдений:
Стандартное отклонение = [(2 – 3) + (4 – 3) + (2 – 3) + (4 – 3) + (2 – 3) + (4 – 3)] ÷ 6 = (1 + 1 + 1 + 1 + 1 + 1) ÷ 6 = 1.
В обоих случаях мы получаем стандартное отклонение примерно 4,14 и 1 соответственно, используя разные методы расчета. Это иллюстрирует, как можно получить стандартное отклонение, используя квадратный корень дисперсии или складывая отклонения и разделив их на общее количество наблюдений.