Jangkauan interkuartil

Dari Wikipedia bahasa Indonesia, ensiklopedia bebas
Loncat ke navigasi Loncat ke pencarian
Diagram kotak garis (dengan rentang interkuartil) dan fungsi kepadatan probabilitas (pdf) dari Populasi Normal N(0,σ2)

Dalam statistika deskriptif, jangkauan interkuartil (IQR), adalah selisih antara persentil ke-75 (kuartil atas) dan persentil ke-25 (kuartil bawah).[1][2] Dengan kata lain, IQR adalah kuartil pertama dikurangi kuartil ketiga. Kuartil dapat diketahui dengan jelas melalui diagram kotak garis.

IQR adalah ukuran variabilitas yang didasarkan pada pembagian kumpulan data menjadi kuartil. Kuartil membagi kumpulan data terurut menjadi empat bagian yang sama besar. Nilai yang memisahkan bagian-bagian ini disebut kuartil pertama, kedua (median), dan ketiga yang masing-masing dilambangkan dengan Q1, Q2, dan Q3.[3]

Sejarah[sunting | sunting sumber]

Foto Karl Pearson.

Istilah kuartil bawah dan kuartil atas pertama kali diperkenalkan oleh Sir Donald MacAlister pada tahun 1879 pada publikasi berjudul The Law of the Geometric Mean. Sementara itu, istilah jangkauan interdesil dan interkuartil pertama kali dicetuskan oleh Francis Galton pada tahun 1882 pada publikasi berjudul Report of the Anthropometric Committee, meskipun ide tentang jangkauan interkuartil sebenarnya pernah dicetuskan oleh Carl Friedrich Gauss dan Adolphe Quételet.

Penggunaan[sunting | sunting sumber]

IQR digunakan untuk membuat diagram kotak garis, sebuah representasi grafis sederhana yang menunjukkan distribusi probabilitas. Untuk sebuah distribusi simetris (median sama dengan rata-rata kuartil pertama dan ketiga), setengah IQR sama dengan deviasi absolut median (MAD). IQR juga dapat digunakan untuk mengidentifikasi pencilan (lihat di bawah).[4][5] Selain itu, terdapat pula jangkauan semi-interkuartil yang dapat ditentukan melalui persamaan: .[6]

Algoritma[sunting | sunting sumber]

IQR dari suatu kumpulan data merupakan selisih antara kuartil atas (Q3) dan bawah (Q1). Setiap kuartil adalah median[7] dari sebagian data, seperti yang ditunjukkan oleh contoh berikut.

Misal, terdapat kumpulan data berjumlah genap (2n) atau ganjil (2n + 1), maka

kuartil pertama Q1 = median dari n data terkecil
kuartil ketiga Q3 = median dari n data terbesar [7]

Kuartil kedua Q 2 sama dengan median kumpulan data yang sesungguhnya.[7]

Contoh[sunting | sunting sumber]

Kumpulan data dalam sebuah tabel[sunting | sunting sumber]

Tabel berikut memiliki 13 baris yang tiap barisnya berisi sebuah data.

i x[i] Median Kuartil
1 7 Q2 = 87
(median seluruh data pada tabel)
Q1 = 31
(median paruh atas, dari baris 1 hingga 6)
2 7
3 31
4 31
5 47
6 75
7 87
8 115 Q3 = 119
(median paruh bawah, dari baris 8 hingga 13)
9 116
10 119
11 119
12 155
13 177

Jangkauan interkuartil data di atas adalah:

.

Kumpulan data dalam diagram kotak polos[sunting | sunting sumber]

                    
                             +−−−−−+−+     
               * |−−−−−−−−−−−|     | |−−−−−−−−−−−|
                             +−−−−−+−+    
                    
 +−−−+−−−+−−−+−−−+−−−+−−−+−−−+−−−+−−−+−−−+−−−+−−−+   garis bilangan
 0   1   2   3   4   5   6   7   8   9   10  11  12
  

Kumpulan data pada diagram kotak ini memiliki:

  • kuartil bawah (pertama) Q1 = 7
  • median (kuartil kedua) Q2 = 8.5
  • kuartil atas (ketiga) Q3 = 9
  • jangkauan interkuartil, IQR = Q3 - Q1 = 2
  • lebih rendah 1,5 * kumis IQR = Q 1 - 1,5 * IQR = 7 - 3 = 4. (Jika tidak ada titik data di 4, maka titik terendah lebih besar dari 4. )
  • atas 1,5 * kumis IQR = Q 3 + 1,5 * IQR = 9 + 3 = 12. (Jika tidak ada titik data di 12, maka titik tertinggi kurang dari 12. )

Hal ini menunjukkan bahwa satu garis 1,5*IQR dengan garis 1,5*IQR lainnya bisa jadi memiliki panjang yang tidak sama.

Distribusi[sunting | sunting sumber]

Jangkauan interkuartil dari distribusi kontinu dapat dihitung dengan mengintegrasikan fungsi kepadatan probabilitas. Kuartil bawah (Q1) adalah bilangan sedemikian rupa sehingga integral PDF dari -∞ ke Q1 sama dengan 0,25, sedangkan kuartil atas (Q3) adalah bilangan sedemikian rupa sehingga integral dari -∞ ke Q3 sama dengan 0,75. Pada distribusi fungsi kumulatif (CDF), kuartil dapat didefinisikan sebagai:

dengan adalah fungsi kuantil.[8]

Jangkauan interkuartil dan median dari beberapa distribusi umum ditunjukkan pada tabel di bawah ini

Distribusi Median IQR
Normal μ 2 Φ − 1 (0,75) σ ≈ 1,349σ ≈ (27/20) σ
Laplace μ 2 b   ln (2) ≈ 1.386 b
Cauchy μ

Uji jangkauan interkuartil untuk normalitas distribusi[sunting | sunting sumber]

IQR, rata-rata, dan deviasi standar dari populasi P dapat digunakan dalam uji sederhana untuk menentukan apakah P terdistribusi normal atau tidak. Jika P terdistribusi normal, maka skor standar kuartil pertama, z1, adalah −0.67, dan skor standar kuartil ketiga, z3, adalah +0.67. Diberikan rata-rata = X dan standar deviasi = σ untuk P, jika P berdistribusi normal, maka kuartil pertama dapat dinyatakan sebagai

dan kuartil ketiga

Pencilan[sunting | sunting sumber]

Diagram kotak garis dengan empat pencilan ringan dan satu pencilan ekstrim. Dalam bagan ini, pencilan digolongkan sebagai ringan apabila pencilan berada Q3 + 1.5 IQR di atas kuartil atas dan pencilan ekstrim apabila pencilan berada lebih dari Q3 + 3 IQR di atas kuartil atas.

Jangkauan interkuartil sering digunakan untuk mencari pencilan dalam data. Pada contoh berikut, pencilan didefinisikan sebagai data yang ditemukan berada di bawah Q1 - 1.5 IQR atau di atas Q3 + 1.5 IQR. Dalam diagram kotak, nilai tertinggi dan terendah dalam batas ini ditandai oleh ujung dari garis (sering pula ditambahkan bilah tambahan di ujung garis) dan pencilan sebagai titik-titik individual.

Referensi[sunting | sunting sumber]

  1. ^ Upton, Graham; Cook, Ian (1996). Understanding Statistics. Oxford University Press. hlm. 55. ISBN 0-19-914391-9. 
  2. ^ Zwillinger, D., Kokoska, S. (2000) CRC Standard Probability and Statistics Tables and Formulae, CRC Press. ISBN 1-58488-059-7 page 18.
  3. ^ A modern introduction to probability and statistics : understanding why and howAkses gratis dibatasi (uji coba), biasanya perlu berlangganan. Dekking, Michel, 1946–. London: Springer. 2005. hlm. 234–238. ISBN 978-1-85233-896-1. OCLC 262680588. 
  4. ^ Yule, G. Udny (1911). An Introduction to the Theory of Statistics. Charles Griffin and Company. hlm. 147–148. 
  5. ^ (Inggris) Eric W. Weisstein, Quartile Deviation di MathWorld.
  6. ^ Spiegel, Murray R. (2006). Pearson, ed. Estatística. São Paulo. hlm. 643. 
  7. ^ a b c Bertil., Westergren (1988). Beta [beta] mathematics handbook : concepts, theorems, methods, algorithms, formulas, graphs, tables. Studentlitteratur. hlm. 348. ISBN 9144250517. OCLC 18454776. 
  8. ^ "Introdução à Estatística" (PDF). Universidade Federal do Pernambuco. hlm. 49. Diakses tanggal 25/04/2017. 

Pranala luar[sunting | sunting sumber]