Varians sebuah data, sumber foto: dokpri.
Varians merupakan salah satu ukuran penyebaran sebuah data. Dengan mengetahui varians, kita akan tahu seberapa besar tingkat penyebaran sekaligus sebesar apa penyimpangan unit atau amatan data terhadap rata-rata.
Kalau kita definisikan menurut rumusnya, varians yakni rata-rata kuadrat simpangan unit atau amatan satu set data terhadap rata-rata. Rata-rata apa? Rata-rata populasi atau sampel? Lebih jauh nanti akan kita ulas secara tersendiri pada bab selanjutnya. Yang jelas, rata-rata dalam hal ini baik rata-rata populasi (miu) maupun rata-rata sampel (x kafe atau miu topi).
Varians kita ketahui terbagi dalam dua jenis, yaitu varians populasi dan varians sampel. Untuk pengertian populasi dan sampel sendiri bisa dibaca kembali pada ulasan sebelumnya. Varians populasi yakni rata-rata kuadrat simpangan unit atau amatan satu set data terhadap rata-rata populasi (miu). Secara matematis bisa dituliskan sebagai berikut:
Rumus varians untuk populasi, sumber foto: dokpri.
Sedangkan varians sampel yakni rata-rata kuadrat simpangan unit atau amatan satu set data sampel terhadap rata-rata sampel itu sendiri. Secara matematis bisa dituliskan sebagai berikut:
Rumus varians untuk data sampel, sumber foto: dokpri.
Dari kedua bentuk rumus tersebut, kita bisa amati terdapat perbedaan di sisi penyebut (pembagi) antara varians untuk data populasi dan varians untuk data sampel. Varians data populasi penyebutnya yakni N sedangkan varians data sampel penyebutnya yakni (N - 1). Mengapa penyebut varians data sampel (N - 1)? Anda bisa cari tahu alasannya pada bab sebelumnya (Klik di sini ya).
Mengapa Varians Pakai Rata-rata Kuadratik?
Seperti yang telah kita pelajari pada bab sebelumnya, salah satu metode mencari rata-rata yakni dengan rata-rata kuadratik. Sebetulnya, rata-rata kuadratik ini yakni jenis rata-rata tertimbang, dia tertimbang dengan nilai setiap unit atau amatan satu set data. Mengapa pakai penimbang nilai unit atau amatan dalam data itu sendiri? Ya, alasannya yakni nilai penyimpangan mengandung nilai negatif dan positif yang saling menghilangkan.
Alasan lain mengapa harus dikuadratkan, bukan dimutlakkan atau dengan penimbang lainnya? Baik, kini kita coba simulasi sederhana untuk menjawab keingintahuan kita ini.
Ilustrasi perhitungan, sumber foto: dokpri.
Sekarang coba kita rata-ratakan simpangan amatan terhadap garis biru tersebut:
Rata-rata = (5 + 5 + (-5) + (-5))/4
Rata-rata = 0
Bagaimana jikalau kita mutlakkan nilai setiap simpangan amatan terhadap garis biru, kemudian kita rata-ratakan?
Rata-rata = (|5| + |5| + |-5| + |-5|)/4
Rata-rata = 5
Wah, ternyata kalau dimutlakkan nampakknya baik. Tapi, kita coba kasus lain berikut:
Ilustrasi perhitungan, sumber foto: dokpri.
Dari ilustrasi itu, kita rata-ratakan dengan terlebih dulu kita mutlakkan masing-masing simpangan amatan terhadap garis birunya.
Rata-rata = (|6| + |4| + |-8| + |-2|)/4
Rata-rata = 5
Ternyata, rata-rata dengan cara memutlakkan menghasilkan nilai yang sama dengan simpangan amatan yang berbeda. Ini menunjukkan rata-rata mutlak mempunyai kelemahan sekaligus tidak bisa menunjukkan varians itu sendiri. Padahal, datanya lebih menyebar (heterogen) dibandingkan data sebelumnya (homogen).
Coba kita lanjut dengan memakai rata-rata kuadrat data simpangan kedua ilustrasi di atas.
Rata-rata 1 = (5^2 + 5^2 + (-5)^2 + (-5)^2)/4
Rata-rata 1 = 25
Sedangkan:
Rata-rata 2 = (6^2 + 4^2 + (-8)^2 + (-2)^2)/4
Rata-rata 2 = 30
Nah, kita amati hasilnya, bahwa dengan memakai rata-rata kuadratik, kedua data simpangan menunjukkan hasil yang berbeda. Data yang lebih menyebar (lebih timpang) mempunyai rata-rata kuadratik relatif lebih besar dibandingkan data yang tidak menyebar (homogen).
Telah kita ketahui, bahwa terdapat dua jenis varians, yakni untuk data populasi dan data sampel. Terkait hal ini, kita juga perlu membedakan cara perhitungan varians lebih khusus apabila dalam kasus kita datanya merupakan data berkelompok, baik populasi ataupun sampel. Secara matematis, rumus yang bisa kita gunakan untuk menghitung varians data berkelompok yakni sebagai berikut:
Varians data populasi berkelompok, sumber foto: dokpri.
Varians data sampel berkelompok, sumber foto: dokpri.
Keterangan:
N yakni jumlah unit atau amatan populasi
n yakni jumlah unit atau amatan sampel
sigma yakni varians data populasi
s kuadrat yakni varians data sampel
fi yakni frekuensi kelas ke-i, i yakni banyaknya kelas data
miu-i yakni nilai tengah data kelas ke-i (bukan rata-rata populasi ke-i) data populasi
xi yakni nilai tengah kelas ke-i data sampel
Demikian dialog singkat kita mengenai varians, dan untuk lebih memahami perhitungan matematisnya, kita coba beberapa pola berikut.
Contoh 1
Diberikan data populasi sebagai berikut:
1 3 4 7 11
Tentukan besarnya variansnya!...
Pembahasan:
Rata - rata = (1 + 3 + 4 + 7 + 11)/5
Rata-rata = 5,2
(1 - 5,2)^2 = 17,64
(3 - 5,2)^2 = 8,44
(4 - 5,2)^2 = 2,24
(7 - 5,2)^2 = 2,36
(11 - 5,2)^2 = 19,16
Jumlah = 17,64 + 8,44 + 2,24 + 2,36 + 19,16 = 49,84
Varians = 49,84/5 = 9,968
Jadi, varians data populasi tersebut yakni 9,968.
Contoh 2
Data nilai ulangan Aljabar Linier sebanyak 10 (populasi) mahasiswa STIS diberikan dalam tabel berikut:
Nilai Jumlah (orang)
60 - 79 3
80 - 99 7
Jumlah 10
Berdasarkan data tersebut, variansnya yakni sebesar?...
Pembahasan:
Datanya yakni populasi sehingga kita gunakan jumlah N = 10.
Nilai tengah 60 - 79 = (60 + 79)/2 = 69,5
Nilai tngah 80 - 99 = (80 + 99)/2 = 89,5
Sehingga:
Rata-rata populasi (miu) = [(3 x 69,5) + (7 x 89,5)]/10
Rata-rata populasi (miu) = 83,5
Dengan perhitungan didapatkan hasil
Dan:
Dengan demikian:
Varians = 7.056,25 - 6.972,25
Varians = 84
Jadi, varians nilai ulangan Aljabar Linier 10 mahasiswa STIS yakni sebesar 84.