Varians adalah ukuran statistik yang menunjukkan seberapa baik data didistribusikan di sekitar mean . Ini seperti mengukur seberapa “sebaran” data dari nilai rata-rata.
Bayangkan Anda memiliki daftar angka, seperti nilai ujian. Varians membantu Anda memahami betapa berbedanya skor ini satu sama lain . Jika skornya sangat dekat satu sama lain, maka variansinya akan rendah. Namun jika terdapat banyak perbedaan antar skor, maka variansinya akan tinggi.
Secara umum, varians adalah alat yang berguna untuk memahami sebaran data dalam sekumpulan nilai. Jika variansnya tinggi berarti datanya lebih tersebar, sedangkan jika rendah berarti datanya lebih berdekatan.
Bagaimana kesenjangan dihitung?
Untuk menghitung varians, Anda perlu melakukan beberapa langkah matematis, tapi jangan khawatir, ini lebih mudah dari yang terlihat. Pertama, Anda perlu menghitung mean atau rata-rata data. Kemudian kurangi setiap bagian data dari mean dan kuadratkan setiap selisihnya. Kemudian Anda menjumlahkan semua kotak ini dan membaginya dengan jumlah datanya. Ini adalah perbedaannya.
Untuk lebih memahaminya, mari kita lihat contoh penghitungan varians di bawah ini:
Langkah 1: Dapatkan datanya
Misalkan Anda memiliki data berikut: 5, 7, 9, 11, 13. Ini adalah nilai dari sampel data yang ingin Anda hitung variansnya.
Langkah 2: Hitung rata-ratanya
Jumlahkan semua nilai dan bagi dengan jumlah total data untuk mendapatkan rata-rata:
Rata-rata = (5 + 7 + 9 + 11 + 13) 5 = 45 5 = 9
Rata-rata datanya adalah 9.
Langkah 3: Kurangi mean dari setiap titik data
Kurangi rata-rata yang diperoleh pada langkah sebelumnya dari setiap item data dalam daftar:
5 – 9 = -4
7 – 9 = -2
9 – 9 = 0
11 – 9 = 2
13 – 9 = 4
Langkah 4: Kuadratkan Setiap Perbedaan
Kuadratkan setiap selisih yang diperoleh pada langkah sebelumnya:
(-4) 2 = 16
(-2) 2 = 4
0 2 = 0
2 2 = 4
4 2 = 16
Langkah 5: Tambahkan kuadrat selisihnya
Jumlahkan semua hasil yang diperoleh pada langkah sebelumnya:
16 + 4 + 0 + 4 + 16 = 40
Langkah 6: Bagi dengan jumlah data
Bagilah jumlah kuadrat selisihnya dengan jumlah total data (dalam hal ini, 5):
Deviasi = 40 5 = 8
Varians datanya adalah 8 .
Apa rumus varians?
Sebelum menganalisis poin ini, penting untuk menyebutkan bahwa varians sangat penting dalam statistik. Meskipun merupakan ukuran yang cukup sederhana, namun memberikan informasi menarik berdasarkan variabel tertentu.
Satuan pengukuran akan selalu sesuai dengan data, tetapi kuadrat. Selain itu, perlu diperhatikan bahwa variansnya selalu sama dengan atau lebih besar dari nol. Hal ini dikarenakan residunya selalu dikuadratkan, sehingga secara matematis tidak mungkin terdapat variansi negatif.
Mengingat hal ini, di bawah ini kami tunjukkan rumus variansnya:
S2 = kesenjangan
x i = istilah kumpulan data
X̄ = pengukuran sampel
∑ = jumlah
n = ukuran sampel
Apa yang dimaksud dengan varian tinggi dan rendah?
Varians dianggap tinggi bila data dalam sampel statistik atau populasi jarang dan jauh dari mean . Artinya nilai-nilai individu dalam data tersebar luas dan terdapat variabilitas yang besar dalam data.
Sebaliknya, varians dianggap rendah ketika data dalam sampel atau populasi mendekati mean dan terdapat sedikit dispersi antar nilai individu. Artinya, data lebih konsisten dan variabilitasnya lebih kecil.
Apa kegunaan utama varians?
Varians merupakan ukuran statistik yang banyak digunakan di berbagai bidang karena kemampuannya dalam menilai sebaran atau variabilitas data dalam suatu sampel. Beberapa kegunaan utama varians adalah:
Dalam statistik deskriptif – untuk mendeskripsikan sebaran data dalam suatu sampel, membantu memahami bagaimana nilai-nilai individu menyimpang dari mean dan bagaimana nilai-nilai tersebut didistribusikan dalam sampel.
Dalam statistik inferensial – untuk memperkirakan variabilitas data dalam suatu populasi dari suatu sampel, sehingga memungkinkan dibuatnya kesimpulan tentang populasi secara keseluruhan.
Di bidang keuangan : dalam analisis risiko dan keuntungan investasi, dimana varians yang lebih tinggi menunjukkan risiko yang lebih tinggi dan varians yang lebih rendah menunjukkan risiko yang lebih rendah dalam suatu portofolio investasi.
Dalam penelitian ilmiah – Menganalisis variabilitas data dalam penelitian ilmiah, seperti penelitian medis, biologi, psikologi, dan disiplin ilmu lainnya, untuk memahami variabilitas hasil dan konsistensi data.
Dalam pengendalian kualitas proses : dalam pengendalian kualitas proses industri untuk mengukur variabilitas produk atau jasa yang diproduksi, yang memungkinkan untuk mengidentifikasi masalah konsistensi dan kualitas proses.
Dalam ekonometrika : dalam pemodelan dan analisis data ekonomi untuk memahami variabilitas variabel ekonomi dan mengevaluasi keandalan model ekonometrik.
Apa yang dimaksud dengan varians?
Varians penting karena memungkinkan Anda memahami variabilitas data dalam suatu sampel . Jika variansnya tinggi berarti datanya jarang dan variabilitasnya banyak. Hal ini relevan untuk membuat keputusan yang tepat di berbagai bidang seperti investasi, manajemen risiko, dan analisis data.
Selain itu, varians membantu Anda memahami konsistensi data dalam sampel atau populasi. Varians yang rendah menunjukkan bahwa data tersebut konsisten dan mempunyai variabilitas yang kecil, sedangkan varians yang tinggi menunjukkan bahwa data tersebut kurang konsisten dan mempunyai variabilitas yang lebih besar.
Apakah standar deviasi dan variansnya sama?
Deviasi standar dan varians adalah dua ukuran statistik terkait yang menggambarkan penyebaran, atau variabilitas, data dalam suatu sampel atau populasi. Perbedaan utama di antara keduanya adalah unit pengukuran dan interpretasi hasil.
Varians adalah ukuran yang mewakili sebaran data dari meannya, dihitung sebagai jumlah kuadrat deviasi nilai individu dari mean, dibagi dengan jumlah total data.
Ini dihitung dengan mengkuadratkan perbedaan antara setiap nilai dan rata-rata, menjumlahkannya, dan membaginya dengan ukuran sampel atau populasi. Varians dinyatakan dalam satuan kuadrat dan sulit untuk ditafsirkan secara langsung karena skalanya berbeda dengan data asli.
Di sisi lain, deviasi standar tidak lebih dari akar kuadrat dari varians . Ini dihitung sebagai akar kuadrat positif dari varians. Deviasi standar dinyatakan dalam satuan yang sama dengan data asli dan merupakan ukuran sebaran data yang lebih intuitif.
Deviasi standar yang lebih tinggi menunjukkan penyebaran atau variabilitas data yang lebih besar, sedangkan deviasi standar yang lebih rendah menunjukkan penyebaran atau variabilitas yang lebih sedikit.
Kesenjangan untuk data yang dikelompokkan
Varians untuk data yang dikelompokkan mengacu pada perhitungan variabilitas atau sebaran data yang dikelompokkan ke dalam interval atau kelas . Daripada memiliki data individual, seperti dalam kasus varians untuk data yang tidak dikelompokkan, Anda memiliki rentang atau interval di mana data tersebut berada.
Menghitung varians untuk data yang dikelompokkan dilakukan dengan menggunakan rumus yang sedikit berbeda. Pertama, dihitung titik tengah setiap interval, yaitu rata-rata batas bawah dan batas atas setiap interval. Kemudian rata-rata tertimbang dari titik tengah dihitung, dengan menggunakan frekuensi relatif atau absolut dari interval sebagai bobot.
Dari rata-rata tertimbang ini, varians dihitung menggunakan rumus yang sama seperti untuk data tidak dikelompokkan , yaitu rata-rata kuadrat selisih antara nilai individu dan rata-rata tertimbang.
Varians data yang dikelompokkan berguna ketika bekerja dengan kumpulan data yang disajikan sebagai interval atau kelas, seperti data demografi, data ekonomi, atau jenis data lainnya yang dikelompokkan ke dalam kategori atau rentang.
Properti Varians
Varians merupakan ukuran statistik yang memiliki beberapa sifat penting. Beberapa sifat utama varians adalah:
- Nilai ini selalu merupakan nilai non-negatif , karena nilai tersebut didefinisikan sebagai rata-rata kuadrat selisih antara data individual dan rata-rata.
- Ini sensitif terhadap nilai ekstrem atau outlier dalam data , karena ini adalah kuadrat perbedaannya.
- Ia mempunyai satuan kuadrat , yang menyiratkan bahwa ia berada dalam satuan kuadrat yang sama dengan data aslinya.
- Hal ini dapat dipengaruhi oleh outlier atau data ekstrem, yang menjadikannya ukuran variabilitas data yang tidak kuat .
- Jika datanya independen dan tidak berkorelasi satu sama lain, maka varians dari jumlah dua kumpulan data sama dengan jumlah varians dari dua kumpulan data .
Contoh penyimpangan
Sekarang setelah kita memahami konsep varians dan pentingnya varians, mari kita lihat contoh praktis untuk lebih memahami cara kerjanya.
Misalkan kita memiliki data berikut mengenai hasil ekonomi suatu perusahaan dalam jutaan dolar selama lima tahun terakhir: 8, 12, 6, -4, 10. Kita ingin menghitung varians kumpulan data ini menggunakan rumus yang disebutkan sebelumnya.
Langkah 1: Hitung mean aritmatika
Pertama, kita menghitung mean aritmatika data dengan menjumlahkannya dan membaginya dengan jumlah total data (dalam hal ini, 5):
Rata-rata aritmatika (X̄) = (8 + 12 + 6 – 4 + 10) 5 = $6,4 juta
Langkah 2: Gunakan rumus varians
Selanjutnya, kita menggunakan rumus varians untuk menghitung kuadrat selisih setiap titik data dan mean aritmatika, lalu menjumlahkannya:
Dimana x i adalah setiap elemen data, X̄ adalah mean aritmatika, dan n adalah jumlah total elemen data.
Kami mengganti data dan mean aritmatika ke dalam rumus varians:
Deviasi (Var(X)) = [(8 – 6.4) 2 + (12 – 6.4) 2 + (6 – 6.4) 2 + (-4 – 6.4) 2 + (10 – 6,4) 2 ] (5 – 1)
Langkah 3: Selesaikan Operasi
Sekarang mari kita selesaikan operasi untuk mendapatkan nilai varians:
Deviasi (Var(X)) = [1.6 2 + 5.6 2 + 0.16 2 + (-10.4) 2 + 3.6 2 ] ÷ 4
Deviasi (Var(X)) = [2,56 + 31,36 + 0,0256 + 108,16 + 12,96] 4
Deviasi (Var(X)) = 155,072 4
Varians (Var(X)) = 38,768 juta kuadrat
Varians kumpulan data ini adalah 38,768 juta kuadrat, yang memberi kita ukuran sebaran atau variabilitas data relatif terhadap mean aritmatika.