Analisis varians

Dari Wikipedia bahasa Indonesia, ensiklopedia bebas
Loncat ke navigasi Loncat ke pencarian

Analisis varians (analysis of variance, ANOVA) adalah suatu metode analisis statistika yang termasuk ke dalam cabang statistika inferensi. Dalam literatur Indonesia metode ini dikenal dengan berbagai nama lain, seperti analisis ragam, sidik ragam, dan analisis variansi. Ia merupakan pengembangan dari masalah Behrens-Fisher, sehingga uji-F juga dipakai dalam pengambilan keputusan. Analisis varians pertama kali diperkenalkan oleh Sir Ronald Fisher, bapak statistika modern. Dalam praktik, analisis varians dapat merupakan uji hipotesis (lebih sering dipakai) maupun pendugaan (estimation, khususnya di bidang genetika terapan).

Secara umum, analisis varians menguji dua varians (atau ragam) berdasarkan hipotesis nol bahwa kedua varians itu sama. Varians pertama adalah varians antarcontoh (among samples) dan varians kedua adalah varians di dalam masing-masing contoh (within samples). Dengan ide semacam ini, analisis varians dengan dua contoh akan memberikan hasil yang sama dengan uji-t untuk dua rerata (mean).

Supaya sahih (valid) dalam menafsirkan hasilnya, analisis varians menggantungkan diri pada empat asumsi yang harus dipenuhi dalam perancangan percobaan:

  1. Data berdistribusi normal, karena pengujiannya menggunakan uji F-Snedecor
  2. Varians atau ragamnya homogen, dikenal sebagai homoskedastisitas, karena hanya digunakan satu penduga (estimate) untuk varians dalam contoh
  3. Masing-masing contoh saling bebas, yang harus dapat diatur dengan perancangan percobaan yang tepat
  4. Komponen-komponen dalam modelnya bersifat aditif (saling menjumlah).

Analisis varians relatif mudah dimodifikasi dan dapat dikembangkan untuk berbagai bentuk percobaan yang lebih rumit. Selain itu, analisis ini juga masih memiliki keterkaitan dengan analisis regresi. Akibatnya, penggunaannya sangat luas di berbagai bidang, mulai dari eksperimen laboratorium hingga eksperimen periklanan, psikologi, dan kemasyarakatan.

Analisis Varians menggunakan RStudio[sunting | sunting sumber]

Fungsi dari ANOVA adalah untuk menguji apakah terdapat perbedaan signifikan antara rata-rata beberapa kelompok (lebih dari dua), melalui ukuran penyebaran (variansi) dari masing-masing kelompok populasi tersebut.

Analisis Variansi didasarkan atas beberapa anggapan mengenai sifat data sebagai berikut :

  • Populasi-populasi yang akan diuji berdistribusi normal
  • Variansi dari populasi-populasi tersebut adalah sama
  • Sampel tidak berhubungan satu dengan yang lainnya (saling bebas)

Hipotesis yang digunakan dalam metode ini adalah sebagai berikut, dari k populasi :

H0 :

H1 : paling sedikit dua diantara rataan tersebut tidak sama

Tabel ANOVA
Sumber Variansi Jumlah Kuadrat Derajat Kebebasan Rataan Kuadrat F (Hitung)
Perlakuan F (Hitung)
Galat
Total

Langkah-langkah Perhitungan ANOVA pada R (dengan ukuran sampel pada tiap pengamatan sama)[sunting | sunting sumber]

#ANOVA
#Input Data
x = read.table("namafile.txt", header=TRUE);

#Bentuk data menjadi sebuah vektor
r = c(t(as.matrix(x))) #vektor data

#Definisikan variabel baru untuk perakuan dan banyak pengamatan
f = c("Variabel 1",...,"Variabel n") #faktor variabel perlakuan
k #banyak jenis perlakuan
n #banyak pengamatan per perlakuan
N #banyak seluruh pengamatan

#Buat vektor faktor perlakuan sesuai dengan vektor r
tm = gl(k, l, n*k, factor(f)) #vektor perlakuan

#Function
av = aov(r ~ tm)
summary(av) #tabel ANOVA

#F critical atau tabel
df1 = k-1
df2 = N-k
alpha = 0.5
Ftabel = qf(1-alpha, df1, df2)

#hasil : bandingkan Pvalue dengan alpha atau
#bandingkan F hitung dengan F tabel