Lompat ke isi

Uji t Student

Dari Wikipedia bahasa Indonesia, ensiklopedia bebas

Uji t Student adalah uji statistika yang digunakan untuk menentukan apakah perbedaan respons antara dua grup signifikan secara statistika atau tidak. Ini adalah uji hipotesis statistika yang menguji apakah data mengikuti distribusi t Student di bawah hipotesis nol. Pengujian ini biasanya digunakan jika uji statistika atau datanya mengikuti distribusi normal dan jika parameter skalanya diketahui (biasanya parameter skala tidak diketahui dan menjadi parameter pengembang). Ketika parameter skala diperkirakan dari data, pengujian statistika, dalam beberapa kondisi, mengikuti distribusi t Student. Dalam banyak kasus, uji Z akan menghasilkan hasil yang mirip dengan uji t, karena nilai t konvergen pada nilai Z pada jumlah sampel yang besar.

William Sealy Gosset, yang mengembangkan statistika t dan mempublikasikannya dengan nama samaran "Student".

Istilah "statistika t" merupakan singkatan dari "pengujian statistika hipotesis" (hypothesis test statistic).[1] Di statistika, distribusi t awalnya diturunkan sebagai probabilitas posterior pada 1876 oleh Helmert[2][3][4] dan Lüroth.[5][6][7] Distribusi t juga muncul pada bentuk lebih umum dari distribusi Pearson tipe IV pada artikel 1895 Karl Pearson.[8] Namun, distribusi t mendapatkan namanya dari William Sealy Gosset, yang pertama mempublikasikannya dalam bahasa Inggris pada 1908 pada jurnal akademis Biometrika menggunakan nama samaran "Student".[9][10] Gosset menggunakan nama samaran karena atasannya di Guinness Brewery lebih suka jika bawahannya menggunakan nama pena ketika mempublikasikan artikel akademis.[11] Gosset merancang uji t sebagai cara ekonomis untuk memantau kualitas stout. Meskipun Gosset yang pertama menggunakan nama "Student", tapi nama Ronald Fisher yang mempopulerkan nama "distribusi t Student"[12] dan "uji t Student" melalui karyanya.

Guinness memiliki kebijakan yang memperbolehkan karyawannya untuk cuti belajar. Hal ini digunakan Gosset untuk belajar pada dua semester pertama pada tahun ajaran 1906–1907 di Laboratorium Biometri milik Karl Pearson di Universitas Kolese London.[13] Identitas Gosset lalu diketahui oleh statistikawan lainnya dan oleh Karl Pearson.[14]

Penggunaan

[sunting | sunting sumber]
Pengujian t satu sampel
Pengujian t dua sampel

Uji t satu sampel

[sunting | sunting sumber]

Uji t satu sampel adalah uji lokasi yang menguji apakah rerata dari populasi memiliki nilai yang telah ditentukan pada hipotesis nol. Dalam menguji hipotesis nol, rerata populasi bernilai sama dengan nilai μ0, yang menggunakan statistika berikut:

dengan x adalah rerata sampel, s adalah simpangan baku sampel, dan n adalah besaran sampel. Nilai derajat kebebasan yang digunakan pada pengujian ini adalah ν = n - 1. Meskipun distribusi populasi induk tidak perlu terdistribusi secara normal, distribusi rerata sampel diasumsikan sebagai normal.

Dengan teorema limit pusat, jika pengamatan independen dan ada momen kedua, maka t diperkirakan sebagai normal N(0,1).

Uji t dua sampel

[sunting | sunting sumber]
Kesalahan tipe I dari dua sampel yang independen dan berpasangan pada uji t sebagai fungsi terhadap korelasi. Bilangan acak yang disimulasikan berasal dari distribusi normal dua variasi dengan nilai varians 1. Level signifikan berada pada 5% dan jumlah kasus adalah 60.
Kekuatan dari dua sampel yang independen dan berpasangan pada uji t sebagai fungsi terhadap korelasi. Bilangan acak yang disimulasikan berasal dari distribusi normal dua variasi dengan nilai variasi 1 dan deviasi dari nilai harapan adalah 0.4. Level signifikan berada pada 5% dan jumlah kasus adalah 60.

Uji tes dua sampel dari hipotesis nol agar rerata dari dua populasi bernilai sama. Seluruh pengujian tersebut disebut sebagai uji t Student, meskipun nama tersebut harusnya digunakan bila varians dari dua populasi juga diasumsikan sama. Bentuk pengujian ketika asumsi ini tidak digunakan biasanya disebut sebagai Uji t Welch. Pengujian-pengujian tersebut biasanya disebut sebagai pengujian t dari sampel tak berpasangan atau independen, karena mereka biasanya digunakan ketika unit statistika dari sampel yang diuji tidak tumpang tindih.[15]

Pengujian t dua sampel untuk rerata yang berbeda melibatkan sampel independen atau berpasangan. Pengujian t berpasangan adalah bentuk dari pemblokkan [en] dan memiliki kekuatan [en] (kemungkinan untuk menghindari kesalahan tipe II, yang juga dikenal sebagai negatif palsi) yang lebih tinggi dari pengujian tak berpasangan (independen). Hal ini terjadi ketika pengujian berpasangan memiliki unit yang mirip dengan pengujian tak berpasangan terhadap "faktor derau" (lihat efek pengacau) yang independen terhadap keanggotaan pada dua grup yang dibandingkan.[16] Pada konteks yang berbeda, pengujian t berpasangan dapat mengurangi efek dari faktor pengacau pada kajian observasional.

Sampel tak berpasangan

[sunting | sunting sumber]

Pengujian t untuk sampel tak berpasangan atau independen digunakan ketika dua sampel yang independen dan terdistribusi secara acak [en] didapatkan, dan satu variabel dari masing-masing populasi dibandingkan. Contoh, misalnya kita mengevaluasi efek dari pelayanan kesehatan, dan kita mengambil 100 subjek untuk kajian kita, lalu menetapkan secara acak 50 subjek untuk grup yang dilayani dan 50 subjek sebagai grup kontrol. Pada kasus ini, kita memiliki dua sampel independen dan akan menggunakan bentuk tak berpasangan dari pengujian t.

Sampel berpasangan

[sunting | sunting sumber]

Pengujian t untuk sampel berpasangan biasanya berisi sampel berpasangan dengan unit yang mirip atau satu grup unit yang telah diuji dua kali (sebuah uji t untuk "pengukuran berulang").

Contoh biasa dari pengujian t untuk pengukuran berulang adalah ketika subjek diuji sebelum suatu perlakuan dan setelah perlakuan. Misalnya, dilakukan pengujian tekanan darah pada subjek. Tekanan darah subjek diuji sebelum dilakukan perlakuan seperti pengobatan untuk mengurangi tekanan darah. Dengan membandingkan tekanan darah pasien sebelum dan setelah pengobatan menggunakan keadaan pasien sebagai kontrol mereka sendiri. Dengan cara itu, penolakan hipotesis nol (disini, dengan tidak ada perbedaan pada perlakuan) dapat menjadi lebih mungkin benar, dengan kekuatan statistika meningkat karena variasi acak antar pasien telah dieliminasi. Namun, peningkatan kekuatan statistika juga dapat memerlukan jumlah pengujian yang lebih tinggi, dengan setiap subjek diuji coba dua kali. Karena setengah dari sampel bergantung pada setengah yang lainnya, versi berpasangan dari uji t Student hanya memiliki n2 - 1 derajat kebebasan (dengan n adalah jumlah observasi). Pasangan menjadi unit pengujian individual dan jumlah sampel harus menjadi dua kali lipat untuk mencapai jumlah derajat kebebasan yang sama. Normalnya, terdapat n - 1 derajat kebebasan (dengan n adalah jumlah observasi).[17]

Pengujian t sampel berpasangan didasarkan pada hasil "sampel pasangan yang cocok" dari sampel tak berpasangan yang selanjutnya digunakan untuk membentuk sampel berpasangan, dengan tambahan variable yang diukur bersama variabel yang diminati.[18] Pasangan tersebut dibawa dengan mengidentidikasikan pasangan nilai yang berisi satu observasi dari setiap dua pasangan, dengan pasangan mirip berdasarkan variabel terukur lainnya. Pendekatan ini kadang digunakan pada kajian observasional untuk mengurangi atau mengeliminasi efek dari efek pengacak.

Pengujian t sampel berpasangan biasanya disebut sebagai "pengujian t sampel terikat" atau "pengujian t sampel dependen".

Lihat juga

[sunting | sunting sumber]

Referensi

[sunting | sunting sumber]
  1. ^ The Microbiome in Health and Disease. Academic Press. 2020-05-29. hlm. 397. ISBN 978-0-12-820001-8.
  2. ^ Szabó, István (2003). "Systeme aus einer endlichen Anzahl starrer Körper". Einführung in die Technische Mechanik (dalam bahasa Jerman). Springer Berlin Heidelberg. hlm. 196–199. doi:10.1007/978-3-642-61925-0_16 (tidak aktif 1 November 2024). ISBN 978-3-540-13293-6. Pemeliharaan CS1: DOI nonaktif per November 2024 (link)
  3. ^ Schlyvitch, B. (October 1937). "Untersuchungen über den anastomotischen Kanal zwischen der Arteria coeliaca und mesenterica superior und damit in Zusammenhang stehende Fragen". Zeitschrift für Anatomie und Entwicklungsgeschichte (dalam bahasa Jerman). 107 (6): 709–737. doi:10.1007/bf02118337. ISSN 0340-2061. S2CID 27311567.
  4. ^ Helmert (1876). "Die Genauigkeit der Formel von Peters zur Berechnung des wahrscheinlichen Beobachtungsfehlers directer Beobachtungen gleicher Genauigkeit". Astronomische Nachrichten (dalam bahasa Jerman). 88 (8–9): 113–131. Bibcode:1876AN.....88..113H. doi:10.1002/asna.18760880802.
  5. ^ Lüroth, J. (1876). "Vergleichung von zwei Werthen des wahrscheinlichen Fehlers". Astronomische Nachrichten (dalam bahasa Jerman). 87 (14): 209–220. Bibcode:1876AN.....87..209L. doi:10.1002/asna.18760871402.
  6. ^ Pfanzagl, J. (1996). "Studies in the history of probability and statistics XLIV. A forerunner of the t-distribution". Biometrika. 83 (4): 891–898. doi:10.1093/biomet/83.4.891. MR 1766040.
  7. ^ Sheynin, Oscar (1995). "Helmert's work in the theory of errors". Archive for History of Exact Sciences. 49 (1): 73–104. doi:10.1007/BF00374700. ISSN 0003-9519. S2CID 121241599.
  8. ^ Pearson, Karl (1895). "X. Contributions to the mathematical theory of evolution.—II. Skew variation in homogeneous material". Philosophical Transactions of the Royal Society of London A. 186: 343–414. Bibcode:1895RSPTA.186..343P. doi:10.1098/rsta.1895.0010.
  9. ^ Student (1908). "The Probable Error of a Mean" (PDF). Biometrika. 6 (1): 1–25. doi:10.1093/biomet/6.1.1. hdl:10338.dmlcz/143545. Diakses tanggal 24 July 2016.
  10. ^ "T Table".
  11. ^ Wendl, Michael C. (2016). "Pseudonymous fame". Science. 351 (6280): 1406. doi:10.1126/science.351.6280.1406. PMID 27013722.
  12. ^ Walpole, Ronald E. (2006). Probability & statistics for engineers & scientists. Myers, H. Raymond (Edisi 7th). New Delhi: Pearson. ISBN 81-7758-404-9. OCLC 818811849.
  13. ^ Raju, T. N. (2005). "William Sealy Gosset and William A. Silverman: Two 'Students' of Science". Pediatrics. 116 (3): 732–735. doi:10.1542/peds.2005-1134. PMID 16140715. S2CID 32745754.
  14. ^ Dodge, Yadolah (2008). The Concise Encyclopedia of Statistics. Springer Science & Business Media. hlm. 234–235. ISBN 978-0-387-31742-7.
  15. ^ Fadem, Barbara (2008). High-Yield Behavioral Science. High-Yield Series. Hagerstown, MD: Lippincott Williams & Wilkins. ISBN 9781451130300.
  16. ^ Rice, John A. (2006). Mathematical Statistics and Data Analysis (Edisi 3rd). Duxbury Advanced. ISBN 0534399428.
  17. ^ Weisstein, Eric. "Student's t-Distribution". mathworld.wolfram.com.
  18. ^ David, H. A.; Gunnink, Jason L. (1997). "The Paired t Test Under Artificial Pairing". The American Statistician. 51 (1): 9–12. doi:10.2307/2684684. JSTOR 2684684.

Daftar pustaka

[sunting | sunting sumber]

Bacaan lebih lanjut

[sunting | sunting sumber]
  • Boneau, C. Alan (1960). "The effects of violations of assumptions underlying the t test". Psychological Bulletin. 57 (1): 49–64. doi:10.1037/h0041412. PMID 13802482.
  • Edgell, Stephen E.; Noon, Sheila M. (1984). "Effect of violation of normality on the t test of the correlation coefficient". Psychological Bulletin. 95 (3): 576–583. doi:10.1037/0033-2909.95.3.576.