Penyebaran statistik adalah konsep luas yang mengacu pada variabilitas atau perbedaan yang mungkin ada dalam kumpulan data . Dalam statistik, ini digunakan untuk mendeskripsikan jarak antara elemen data individual dan sekumpulan nilai pusat, seperti mean atau median.
Ada beberapa jenis ukuran penyebaran statistik. Pertama, kita memiliki deviasi standar dan jangkauan. Selain itu, varians, jangkauan antarkuartil dan koefisien variasi. Masing-masing metrik ini memberikan cara berbeda dalam mengukur variabilitas data .
Penyebaran statistik penting karena dapat memberikan informasi berharga tentang sebaran data dan membantu mendeteksi outlier atau anomali dalam data . Selain itu, penyebaran statistik berguna dalam pengambilan keputusan dan penilaian risiko di berbagai bidang, mulai dari penelitian ilmiah hingga manajemen bisnis.
Apa saja jenis ukuran penyebaran statistik?
Dispersi statistik digunakan untuk mengukur variabilitas atau jarak yang ada antar nilai dalam suatu kumpulan data. Ada beberapa cara untuk mempelajari dispersi statistik, namun berikut beberapa teknik umum:
- Rentang – Rentang adalah selisih antara nilai maksimum dan nilai minimum suatu kumpulan data. Ukuran ini mudah untuk dihitung, namun dapat dipengaruhi oleh nilai ekstrim atau outlier.
- Deviasi standar : Ini adalah ukuran dispersi yang dihitung sebagai akar kuadrat dari varians. Varians mengukur jarak rata-rata setiap titik data dari mean. Deviasi standar merupakan ukuran yang lebih tepat dibandingkan rentang, namun juga dipengaruhi oleh outlier.
- Koefisien variasi – Ukuran penyebaran relatif suatu kumpulan data. Ini dihitung dengan membagi standar deviasi dengan mean dan mengalikan hasilnya dengan 100%. Ukuran ini berguna untuk membandingkan variabilitas dua atau lebih kumpulan data yang mempunyai skala atau satuan pengukuran berbeda.
- Plot Kotak dan Kumis – Grafik yang menunjukkan distribusi dan penyebaran kumpulan data. Kotak mewakili rentang interkuartil (IQR) dan kumis menunjukkan rentang maksimum dan minimum data. Bagan ini berguna untuk mengidentifikasi outlier dan untuk membandingkan variabilitas dua atau lebih kumpulan data.
Untuk apa dispersi statistik digunakan?
Dengan mempelajari sebaran statistik suatu kumpulan data, ada beberapa keuntungan yang bisa diperoleh, antara lain:
- Identifikasi Outlier – Membantu mengidentifikasi outlier atau nilai yang tidak biasa dalam kumpulan data. Hal ini penting untuk menemukan kesalahan dalam pengukuran atau pengumpulan data , atau untuk mengidentifikasi pengamatan yang berbeda secara signifikan dari data lainnya.
- Menilai Konsistensi Data – Berguna untuk menilai konsistensi data. Jika suatu kumpulan data memiliki sebaran yang besar, hal ini mungkin merupakan tanda bahwa data tersebut tidak terlalu akurat atau terdapat banyak variasi dalam kondisi pengukuran.
- Bandingkan Kumpulan Data : Digunakan untuk membandingkan kumpulan data. Jika dua kumpulan data mempunyai mean yang sama, tetapi satu kumpulan data mempunyai dispersi yang lebih besar, maka dapat disimpulkan bahwa terdapat variabilitas yang lebih besar dalam data tersebut.
- Membuat keputusan berdasarkan informasi : Penyebaran statistik adalah alat mendasar untuk membuat keputusan berdasarkan informasi. Jika suatu kumpulan data diketahui memiliki distribusi yang luas, mungkin akan lebih sulit untuk membuat prediksi atau keputusan yang akurat berdasarkan data tersebut.
Bagaimana dispersi statistik diinterpretasikan?
Dispersi statistik diartikan sebagai ukuran jarak antara masing-masing elemen data dan nilai pusat atau nilai rata-ratanya (misalnya, nilai rata-rata). Secara umum, deviasi yang tinggi menunjukkan bahwa data tersebut jauh dari nilai sentralnya, sedangkan deviasi yang rendah menunjukkan bahwa data tersebut lebih mengelompok atau mendekati nilai sentralnya.
Misalnya, jika Anda menganalisis ukuran sekelompok orang, varians yang kecil akan menunjukkan bahwa sebagian besar orang memiliki ukuran yang sama . Di sisi lain, penyebaran yang tinggi menunjukkan bahwa jumlah penduduk sangat bervariasi.
Jika Anda menganalisis kinerja sekelompok siswa dalam suatu tes, dispersi yang rendah menunjukkan bahwa sebagian besar siswa mempunyai prestasi yang sama, sedangkan dispersi yang tinggi menunjukkan variasi skor yang besar.
Penting untuk dicatat bahwa penafsiran sebaran statistik juga bergantung pada konteks penggunaannya. Misalnya, dalam beberapa kasus, dispersi yang tinggi mungkin diinginkan atau diharapkan, sedangkan dalam kasus lain, dispersi yang rendah mungkin lebih diinginkan.
Kapankah terjadi penyebaran statistik yang lebih besar?
Dalam statistik, terdapat penyebaran yang lebih besar ketika data dalam suatu kumpulan berjauhan , yang menunjukkan variabilitas yang lebih besar dalam data. Misalnya, jika Anda menganalisis gaji sekelompok orang, penyebaran yang lebih besar menunjukkan bahwa gaji lebih bervariasi antar individu dalam kelompok tersebut.
Ukuran penyebaran statistik yang paling umum adalah deviasi standar . Standar deviasi yang tinggi menunjukkan bahwa data lebih tersebar, sedangkan standar deviasi yang rendah menunjukkan bahwa data tersebut mendekati mean.
Ukuran penyebaran statistik lainnya adalah rentang, yaitu selisih antara nilai maksimum dan nilai minimum suatu kumpulan data. Jika rentangnya besar, berarti terdapat banyak variabilitas antar data.
Bagaimana Anda tahu jika data tersebar?
Untuk menentukan apakah suatu data terdistribusi atau tidak, perlu dihitung beberapa ukuran distribusi statistik , seperti deviasi standar atau rentang.
Jika ukuran sebarannya tinggi, maka datanya akan lebih tersebar , artinya semakin banyak variabilitas dalam kumpulan data tersebut. Jika ukuran sebarannya rendah, maka datanya akan lebih sedikit tersebar dan variabilitas dalam kumpulan datanya akan berkurang.
Anda juga dapat memvisualisasikan distribusi data menggunakan bagan statistik , seperti bagan kotak dan kumis atau histogram . Dalam grafik ini Anda dapat melihat sebaran data dan apakah tersebar lebih atau kurang.
Selain itu, hubungan antara rata-rata dan sebaran data dapat dihitung dengan menggunakan koefisien variasi , yaitu simpangan baku dibagi rata-rata dikalikan 100. Koefisien variasi yang tinggi menunjukkan dispersi yang besar relatif terhadap rata-rata, sedangkan koefisien variasi yang rendah menunjukkan dispersi yang rendah dari mean.
Apa saja penerapan dispersi statistik?
Dispersi statistik memiliki berbagai penerapan di berbagai bidang dan disiplin ilmu, antara lain:
- Penelitian Ilmiah – Dispersi statistik merupakan alat penting untuk analisis data di berbagai bidang ilmu pengetahuan, seperti biologi, fisika, psikologi, dan sosiologi. Ini digunakan untuk menganalisis variabilitas hasil suatu penelitian atau eksperimen dan untuk menentukan apakah hasilnya signifikan.
- Industri : Digunakan untuk menganalisis variabilitas produksi barang dan jasa, dan untuk menentukan apakah proses produksi stabil dan konsisten.
- Ekonomi : digunakan untuk menganalisis variabilitas harga barang dan jasa, dan untuk menentukan apakah pasar efisien dan seimbang.
- Kedokteran – Digunakan untuk menganalisis variabilitas hasil pengobatan medis dan untuk menentukan apakah pengobatan efektif dan aman.
- Pendidikan : Penyebaran statistik digunakan untuk menganalisis variabilitas prestasi akademik siswa dan untuk menentukan apakah kebijakan dan program pendidikan efektif.
Singkatnya, dispersi statistik adalah alat yang berguna di berbagai bidang untuk menganalisis variabilitas data dan membuat keputusan berdasarkan informasi yang diperoleh.
Contoh dispersi statistik
Pada titik ini, mari kita lihat beberapa contoh dispersi statistik yang berguna di bawah ini.
Contoh 1: simpangan baku
Misalkan kita mempunyai data berikut untuk sampel umur 10 orang dalam beberapa tahun: 20, 22, 18, 24, 19, 25, 21, 20, 23, 22. Untuk menghitung simpangan baku, kita ikuti langkah-langkah berikut:
Hitung mean sampel: (20+22+18+24+19+25+21+20+23+22) /10 = 21,4.
Kurangi rata-rata tiap data dan kuadratkan: (20-21.4) 2 , (22-21.4) 2 , (18-21.4) 2 , (24-21.4) 2 , (19-21.4) 2, (25-21.4) 2 , (21-21.4) 2 , (20-21.4) 2 , (23-2 1, 4) 2 , (22-21.4) 2 .
Tambahkan hasil dari langkah 2: 138.16.
Bagilah jumlah dari langkah 3 dengan jumlah titik data dikurangi 1 (n-1): 138,16/9 = 15,35.
Hitung akar kuadrat hasil dari langkah 4: √ 15,35 = 3,92.
Oleh karena itu, simpangan baku sampel adalah 3,92 tahun.
Contoh 2: Pantai
Misalkan kita mempunyai data berikut untuk ukuran sampel 10 orang dalam sentimeter: 160, 170, 165, 180, 155, 185, 175, 170, 172, 168. Untuk menghitung rentang, kita ikuti langkah-langkah berikut:
Urutkan data dari terkecil ke terbesar: 155, 160, 165, 168, 170, 170, 172, 175, 180, 185.
Kurangi nilai minimum dari nilai maksimum: 185-155 = 30.
Jadi, bentang sampelnya adalah 30 cm.
Ini hanyalah dua contoh penghitungan ukuran dispersi statistik. Ada banyak ukuran lain, seperti koefisien variasi, jangkauan antarkuartil, dan lain-lain. Penting untuk memilih ukuran penyebaran yang tepat berdasarkan sifat data dan tujuan analisis.