Pages

Minggu, 13 November 2011

ANOVA (Analisis of Variance)

LATAR BELAKANG ANOVA :
ANOVA adalah singkatan dari Analysis of Variance. Latar belakang dikembangkan metoda ini karena ingin dilakukan testing terhadap rata-rata populasi yg mengalami “perlakuan” yg berbeda-beda. Pertanyaannya : apakah perbedaan rata-rata antara berbagai grup yg mengalami perlakuan berbeda tersebut signifikan atau tidak.

Asumsi untuk ujian ANOVA adalah:
Populasi semuanya normal
Standard deviasi populasi sama
Populasi independen
MIsal ada 4 grup A,B,C dan D dengan rata-rata sampel xA, xB, xC dan xD. Ingin diketahui apakah rata-rata populasi yg terkait dengan sampel tsb sama? Tentu saja kita bisa melakukan uji statistik bagi tiap sepasang mean, misal μA=μB lalu μA=μC dst. Semuanya ada 6 pasangan yg mungkin, jadi ada 6 uji yg harus dilakukan. Untuk masing-masing dilakukan test-t

Apa kelemahan test-t sepasang-sepasang ini?
Banyak test harus dilakukan
Kesalahan tipe-1 yg besar

Misal tiap-tidap test-t diuji dengan tingkat signifikan 0.05, berarti probabilitas H0 diterima dan keputusan benar 0.95. Karena ada 6 pasangan test (dalam contoh sebelumnya) maka probabilitas telah dibuat keputusan benar karena menerima H0 yg benar adalah 0.95*0.95*0.95*0.95*0.95*0.95 = 0.735
Jadi probabilitas melakukan error tipe I, yaitu H0 benar tapi ditolak adalah 1-0.735 = 0.265!
Oleh karena diperlukan uji yg dapat sekaligus membandingkan kesamaan rata-rata berbagai grup tsb serempak.

Ide dasar test ANOVA adalah perbedaan rata-rata populasi ditentukan oleh dua faktor yaitu variasi data dalam 1 sampel dan variasi data antar sampel. Perbedaan rata-rata antar populasi nyata jika variasi data antar sampel besar sedangkan variasi data dalam 1 sampel kecil.

Beberapa definisi variasi.
1. Variasi Total
Jumlah total kuadrat selisih data dengan rata-rata total seluruh data (grand mean)
2. Variasi Antar Sampel (atau Variasi karena Perlakuan)
Jumlah total kuadrat selisih rata-rata tiap sampel thd rata-rata total (grand mean)
Beberapa definisi variasi.
3. Variasi Random
Jumlah total kuadrat selisih data dengan rata-rata sampel yg terkait
Dengan G adalah banyak group, ng adalah banyak sampel di group-g.
Dapat dibuktikan bahwa ketiga variasi tsb saling terkait:
SStotal = SST + SSE

TEST ANOVA
1. Hipotesa
H0: μ1= μ2= μ3 = ….
H1: tidak semua rata-rata populasi sama
2. Tentukan tingkat signifikan α
3. Daerah kritis
Test statistiknya adalah F-test dengan
dimana MST : Mean Squares of Treatments (between groups)
MSE : Mean Squares of Errors (within errors)
Dengan k : jumlah grup dan n adalah banyak total semua data. Derajat kebebasan F adalah (v1=k-1) untuk pembilang dan (v2=n-k) untuk penyebut. Tentukan nilai kritis Fα(v1,v2) = Fkritis.
Tolak H0 jika Fhitung > Fkritis
4. Perhitungan
5. Keputusan
Bandingkan Fhitung dengan Fkritis
6. Kesimpulan

Tidak ada komentar:

Posting Komentar