İstatistiksel parametreler, bir veri kümesinin önemli özelliklerini özetleyen ve içinde bulunan bilgileri anlamamıza ve açıklamamıza yardımcı olan sayısal değerlerdir. Basit bir ifadeyle verileri daha iyi anlamamızı ve ona göre kararlar almamızı sağlayan “etiketler” diyebiliriz.
Başka bir deyişle istatistiksel parametreler, matematikçiler ve bilim adamlarının verileri basit bir şekilde tanımlamak için kullandıkları özel ölçümlerdir. Temel olarak sayıları daha kolay ve net anlamamıza yardımcı olan araçlardır.
Örneğin, diyelim ki bir çanta dolusu şekeriniz var ve toplamda kaç şeker olduğunu bilmek istiyorsunuz. İstatistiksel parametrelerin devreye girdiği yer burasıdır. Ortalama, tüm şekerlerin toplanıp toplam miktara bölünmesiyle elde edilen ortalama şeker sayısıdır . Bu size bulmayı bekleyebileceğiniz ortalama şeker sayısı hakkında bir fikir verir.
Ancak dahası da var, bir diğer önemli parametre de standart sapmadır , bu da şekerlerin ortalamadan ne kadar uzakta olduğunu anlamanıza yardımcı olur. Şekerlerin ortalama sayıya göre ne kadar farklı olduğunu gösterir.
İlginç olan istatistiksel parametrelerin tahmin yapmak için de kullanılabilmesidir. Örneğin bir hafta sonra çantada kaç şeker olacağını bilmek istiyorsanız bunu tahmin etmek için istatistiksel parametreleri kullanabilirsiniz. Şu anda sahip olduğunuz ortalama şeker sayısını hesaplıyorsunuz ve bu ortalamanın bir hafta içinde nasıl değiştiğine dair bir fikir edinmek için standart sapmayı kullanıyorsunuz.
Ne tür istatistiksel parametreler vardır?
İstatistikte iki ana parametre türü vardır: merkezi eğilim parametreleri ve dağılım parametreleri.
Merkezi Eğilim Parametreleri
Merkezi eğilim parametreleri bize bir veri setinde hangi değerin tipik veya temsili olduğunu söyler. Merkezi eğilim parametreleri arasında üç önemli ölçümümüz var:
- Ortalama : Ortalama, popülasyonun (örneklem) oran değeridir.
- Medyan : Öte yandan, işlevi numuneyi üst ve alt olmak üzere iki parçaya bölmek olan medyanımız var. Basit bir ifadeyle verileri ikiye böler.
- Mod : Son olarak mod, örnekteki en sık görülen değerden başka bir şey değildir.
Ortalama, medyan ve modu kullanarak merkezi eğilim parametrelerini açıklamak için sayısal bir örnek kullanacağız.
Bir grup insanın yaşlarının şu şekilde olduğunu varsayalım: 25, 30, 32, 35, 40, 40, 42, 45, 50.
Ortalama yaş ortalamasıdır . Hesaplamak için tüm yaşları toplayıp toplam yaş sayısına bölüyoruz. Bu durumda 25 + 30 + 32 + 35 + 40 + 40 + 42 + 45 + 50 = 339’u toplayıp 9’a bölüyoruz (toplam yaş sayısı kaç). Bu durumda ortalama 339 ÷ 9 = 37,67 yıldır.
Yaşlar küçükten büyüğe doğru sıralandığında ortadaki değer medyandır . Bu durumda sıralanan yaşlar şu şekilde olacaktır: 25, 30, 32, 35, 40, 40, 42, 45, 50. Yaşların sayısı tek olduğu için medyan orta konumdaki değer olacaktır; 40 yıl.
Mod, veri kümesinde en sık görülen değerdir . Bu durumda mod 40 yıldır, iki kez göründüğünden, diğer yaşlar yalnızca bir kez göründüğünden.
Yani özetle ortalama 37,67 yıl, ortanca 40 yıl ve mod da 40 yıldır.
Dağılım parametreleri
Öte yandan dağılım parametreleri bize verilerin bir kümede ne kadar dağınık veya değişken olduğunu anlatır. En yaygın olanları varyans ve standart sapmadır.
Varyans
Varyans , verinin kareden ne kadar sapabileceğini ölçer . Bu durumda öncelikle karesini alıp ardından söz konusu ortalamayı hesaplamanız gerekir. Açıklamayı daha iyi anlamak için aşağıdaki örneğe bakalım:
Beş öğrenci için aşağıdaki test puanlarına sahip olduğunuzu varsayalım: 80, 85, 90, 95, 100. Öncelikle tüm puanları toplayıp toplam öğrenci sayısına bölerek ortalamayı buluyoruz: ( 80 + 85 + 90 + 95 + 100) ÷ 5 = 90.
Daha sonra varyansı hesaplamak için her derecelendirmeden ortalamayı çıkarırız ve sonuçların karesini alırız. Daha sonra kareli sonuçların ortalamasını alırız. Bu durumda hesaplamalar şöyle olacaktır:
(80 – 90) 2 = 100
(85 – 90) 2 = 25
(90 – 90) 2 = 0
(95 – 90) 2 = 25
(100 – 90) 2 = 100
Sonuçları topluyoruz: 100 + 25 + 0 + 25 + 100 = 250. Daha sonra ortalamayı elde etmek için toplam veri noktası sayısına (5) bölüyoruz: 250 ÷ 5 = 50.
Dolayısıyla bu durumda varyans 50’dir . Bu bize ortalama olarak puanların ortalamadan ortalama 50 kare birim saptığını gösterir; bu da verilerin ortalamadan dağılımını veya değişkenliğini temsil eder.
Standart sapma
Daha önce incelediğimiz gibi standart sapma basitçe varyansın karekökünün sonucu olarak tanımlanır. Bu tür dağılım parametresinin, normal dağılım durumunda ortalama sapmaya kıyasla tahmin yapmak için çok daha verimli olduğunu belirtmekte fayda var.
Önceki test puanları örneğini ele alalım: 80, 85, 90, 95, 100. Varyansı zaten hesapladık ve 50’dir. Standart sapmayı bulmak için sadece varyansın karekökünü alırız.
√50 ≈ 7,07
Bu durumda standart sapma bu nedenle yaklaşık 7,07’dir . Bu bize ortalama olarak puanların ortalamadan yaklaşık 7,07 birim uzakta olduğunu ancak orijinal puanlarla aynı ölçüm biriminde olduğunu söyler. Bu, aynı ölçekte olduğundan yorumlanması ve orijinal verilerle karşılaştırılması daha kolay bir ölçümdür.
yüzdelik dilimler
Yukarıdaki ölçümlere ek olarak dağılım parametrelerini de dikkate alıyoruz. Nicelik işlevi, örnek n’nin eşdeğer bölümlere bölünmesidir . Bu sayede değerlerin daha yoğun olduğu aralıkları tahmin etmek mümkündür. N’nin değerine bağlı olarak, nicelikler farklı şekillerde tanımlanır.
- Ondalıklar : Veri setini on eşit parçaya ayırmakla sorumludur.
- Çeyrekler : On rakamının dört bölüme ayrılması dışında önceki modelle aynı şekilde çalışır.
- Yüzdelikler – Son olarak yüzdelikler , bir kümedeki verileri 100 özdeş bölüme ayırmak için kullanılır.
İstatistiksel parametreler ne için kullanılır?
Daha önce de belirttiğimiz gibi istatistiksel parametreler çok önemlidir ve kullanım alanları oldukça geniştir. Daha sonra, en önemli uygulamalarından bazılarını sunuyoruz.
Ekonomi
İstatistiksel parametreler, diğerlerinin yanı sıra GSYİH, işsizlik oranı, enflasyon gibi ekonomik göstergeleri analiz etmek için kullanılır. Bu parametreler, bir ülkenin veya bölgenin ekonomik sağlığını ölçmeyi, eğilimleri belirlemeyi ve ekonomi politikası karar alma sürecine yönelik tahminler yapmayı mümkün kılar.
Sağlık Bilimleri
Bu durumda, diğerlerinin yanı sıra bir hastalığın yaygınlığı, bir tedavinin etkinliği, risk faktörlerinin etkisi gibi sağlık verilerini analiz etmek için klinik ve epidemiyolojik çalışmalarda kullanılırlar. Bu parametreler hastalıkların önlenmesi, tanısı ve tedavisinde karar vermede önemlidir.
sosyal Bilimler
Öte yandan istatistiksel parametreler, diğerlerinin yanı sıra psikoloji, sosyoloji, eğitim gibi disiplinlerde, diğerlerinin yanı sıra insan davranışı, tutumları, görüşleri hakkındaki verileri analiz etmek için faydalıdır. Bu parametreler incelenen popülasyon hakkında bilgi edinmeyi ve çıkarımlarda bulunmayı mümkün kılar.
Pazarlama ve Reklamcılık
Yukarıdakilere ek olarak reklam dünyasında da çok önemlidirler. Bu durumda, müşteri segmentasyonu, tüketici tercihleri ve davranışlarının analizi, reklam kampanyalarının değerlendirilmesi gibi pazar verilerini analiz etmek için kullanılırlar. Bu ölçümler, pazarlama ve reklam stratejilerini anlamanıza ve bilinçli kararlar almanıza yardımcı olur.
Bilimsel araştırma
Ek olarak, biyoloji, fizik, kimya gibi çeşitli bilimsel araştırma alanlarında deneysel verileri analiz etmek, çıkarımlar yapmak ve sonuçları doğrulamak için kullanılırlar. Bu parametreler bilimsel araştırmanın titizliği ve geçerliliği için gereklidir.
Finans
Ayrıca bir yatırımın karlılığı, bir varlığın oynaklığı, risk değerlendirmesi gibi finansal verileri analiz etmek için de kullanılırlar. Bu parametreler yatırım yönetimi, finansal planlama ve risk değerlendirmesinde karar vermede kullanılır.
Mühendislik
Son olarak, kalite mühendisliği, proses mühendisliği, sistem mühendisliği gibi çeşitli mühendislik alanlarında üretim, kalite, performans ve proses optimizasyonunu analiz etmek için idealdirler. Bu parametreler, proje yönetimi ve sistem optimizasyonunda sürekli iyileştirme ve karar verme amacıyla kullanılır.
İstatistiksel parametrelere örnek
Yukarıdaki bilgiler göz önüne alındığında, öğrenilenleri daha iyi pekiştirmek için bir örnek kullanmanın zamanı geldi. Görelim o zaman.
1. Örnek Ortalama (ortalama)
Diyelim ki bir matematik sınavında 5 öğrencinin puanlarından oluşan bir listeniz var: 7, 8, 9, 6 ve 10. Ortalamayı bulmak için tüm puanları toplayıp öğrenci sayısına bölüyoruz:
7 + 8 + 9 + 6 + 10 = 40
Ortalama = 40 ÷ 5 = 8
Dolayısıyla bu 5 öğrencinin not ortalaması veya ortalama notu 8’dir.
2. Medyan örneği
Diyelim ki 7 kişilik bir grup için yaş listeniz var: 12, 14, 15, 13, 12, 16 ve 18. Medyanı bulmak için önce yaşları artan sırada sıralıyoruz: 12, 12, 13, 14, 15, 16, 18
Daha sonra listenin medyan değerini buluyoruz ki bu durumda bu değer 14 yıldır. Bu nedenle bu grup insanın ortanca yaşı 14’tür.
3. Moda örneği
Diyelim ki 10 kişilik bir grubun giydiği gömlek renklerinin bir listesi var: kırmızı, mavi, yeşil, kırmızı, sarı, mavi, yeşil, yeşil, kırmızı, mavi. Mod, listede en sık görünen değerdir. Bu durumda yeşil renk 3 kez görünürken, diğer renkler yalnızca 2 kez veya daha az görünür. Bu nedenle tişört renklerinde moda yeşildir.
4. Yüzdelik dilimlere örnek
20 kişilik bir lise öğrencisi grubunun boylarını santimetre cinsinden temsil eden bir veri setiniz olduğunu varsayalım. Boyların %75’inin altına düştüğü değer olan 75. yüzdelik dilimi bulmak istiyorsunuz. Verileri sıraladıktan sonra 75. yüzdeliğe karşılık gelen değerin 168 cm olduğunu görüyorsunuz. Bu, öğrencilerin %75’inin 168 cm veya daha kısa olduğu anlamına gelir.
5. Sapma örneği
Diyelim ki 10 öğrenciden oluşan bir grubun her gün bir sınava çalıştığı saat sayısını temsil eden bir veri kümeniz var. Veriler: 2, 3, 4, 2, 5, 3, 4, 1, 2, 3. Varyansı bulmak için önce 2,7 saat olan ortalamayı bulmanız gerekir. Daha sonra her değerden ortalamayı çıkarırsınız, karesini alırsınız ve hepsini toplarsınız. Son olarak toplamı veri noktalarının sayısına bölersiniz:
((2-2,7) 2 + (3-2,7) 2 + (4-2,7) 2 + (2-2,7) 2 + (5-2,7) 2 + (3-2,7) 2 + (4-2,7) 2 + (1-2,7) 2 + (2-2,7) 2 + ( 3-2,7 ) 2 ) ÷ 10 = 1,61
Dolayısıyla bu gruptaki öğrencilerin ders çalışma saatlerinin varyansı 1,61’dir.
6. Örnek Standart sapma
Önceki örneğe devam edersek, standart sapmayı bulmak için varyansın karekökünü almanız yeterlidir:
√1,61 ≈ 1,27
Dolayısıyla bu öğrenci grubu için ders çalışma saatlerinin standart sapması yaklaşık 1,27 saattir.