Lompat ke isi

Skor ujian

Dari Wikipedia bahasa Indonesia, ensiklopedia bebas

Skor tes merupakan suatu informasi, biasanya berupa angka, yang menggambarkan kinerja seorang peserta ujian terhadap suatu tes tertentu. Salah satu definisi formal menyatakan bahwa skor tes adalah “ringkasan bukti yang terkandung dalam respons peserta terhadap butir-butir tes yang berkaitan dengan konstruk atau sejumlah konstruk yang diukur.” Dengan demikian, skor tes berfungsi sebagai representasi kuantitatif dari kemampuan, pengetahuan, atau sifat psikologis yang menjadi fokus pengukuran.

Kertas ujian.

Dalam praktik pengukuran pendidikan maupun psikologi, skor tes dapat ditafsirkan melalui dua pendekatan utama, yakni penafsiran beracuan norma (norm-referenced interpretation) dan penafsiran beracuan kriteria (criterion-referenced interpretation).[1]

Pada penafsiran beracuan norma, skor tersebut memberikan makna tentang posisi atau kedudukan peserta tes dibandingkan dengan peserta lain dalam kelompok normatif. Misalnya, skor yang berada pada persentil ke-85 menunjukkan bahwa peserta tersebut memperoleh hasil lebih tinggi daripada 85% peserta lain dalam kelompok pembanding. Pendekatan ini lazim digunakan pada tes seleksi, tes bakat, atau tes standar yang bertujuan memetakan keterampilan relatif antarpeserta.[1]

Sebaliknya, penafsiran beracuan kriteria menekankan informasi mengenai sejauh mana peserta tes menguasai materi atau kompetensi tertentu tanpa membandingkannya dengan peserta lain. Dalam pendekatan ini, skor mencerminkan pencapaian terhadap standar atau tujuan pembelajaran, misalnya menunjukkan apakah peserta telah mencapai tingkat penguasaan minimal. Pendekatan ini umum digunakan dalam penilaian kelas, ujian sertifikasi, dan evaluasi kompetensi profesional.[2] Dalam beberapa konteks, kedua pendekatan tersebut dapat digunakan secara bersamaan untuk memberikan gambaran yang lebih komprehensif mengenai kinerja peserta. Melalui kerangka interpretasi yang tepat, skor tes menjadi alat penting untuk evaluasi pendidikan, diagnosis psikologis, seleksi, serta berbagai bentuk pengukuran lainnya.[2]

Jenis-jenis skor ujian

[sunting | sunting sumber]

Terdapat dua jenis utama skor tes, yaitu skor mentah dan skor baku (scaled scores). Skor mentah merupakan skor yang diperoleh tanpa penyesuaian atau transformasi apa pun; contohnya adalah jumlah soal yang dijawab dengan benar pada suatu tes. Skor ini menggambarkan performa dasar peserta sebelum dipertimbangkan aspek kesulitan tes atau variasi antar bentuk tes. Sebaliknya, skor baku adalah hasil dari suatu proses transformasi yang diterapkan pada skor mentah. Transformasi tersebut dapat berupa penyeragaman, penyesuaian distribusi nilai, atau prosedur lain seperti yang terjadi pada sistem penilaian relatif (relative grading). Tujuan utama dari skor baku adalah untuk melaporkan hasil peserta tes dalam suatu skala yang konsisten, meskipun mereka mengerjakan bentuk tes yang berbeda atau menghadapi tingkat kesulitan soal yang tidak sama.

Sebagai contoh, anggaplah suatu tes memiliki dua bentuk. Bentuk pertama lebih sulit dibandingkan bentuk kedua. Melalui prosedur penyetaraan (equating), diketahui bahwa skor 65% pada bentuk pertama setara dengan skor 68% pada bentuk kedua. Untuk memastikan bahwa kedua hasil yang setara tersebut dilaporkan secara konsisten, skor mentah dapat dikonversi ke dalam skala baku, misalnya skala 100 hingga 500, sehingga keduanya sama-sama dilaporkan sebagai skor 350. Dengan demikian, skor baku memungkinkan interpretasi yang adil dan setara antar bentuk tes.

Di Amerika Serikat, dua contoh tes terkenal yang menggunakan skor baku adalah ACT dan SAT. ACT menggunakan rentang skor 0 hingga 36, sedangkan SAT menggunakan rentang 200 hingga 800 untuk setiap bagian tes. Secara historis, skala tersebut dirancang agar mencerminkan nilai rata-rata dan standar deviasi tertentu: rata-rata 18 dan standar deviasi 6 untuk ACT, serta rata-rata 500 dan standar deviasi 100 untuk SAT. Batas atas dan bawah ditetapkan secara logis berdasarkan fakta bahwa interval ±3 standar deviasi mencakup lebih dari 99% populasi. Skor di luar rentang tersebut sulit diukur secara presisi dan memiliki nilai praktis yang rendah.

Perlu dicatat bahwa proses penskalaan tidak memengaruhi sifat psikometrik dari suatu tes. Penskalaan dilakukan setelah proses penilaian dan, bila diperlukan, proses penyetaraan selesai. Dengan demikian, penskalaan tidak berkaitan langsung dengan aspek psikometri, melainkan berhubungan dengan isu interpretabilitas, yaitu cara skor dilaporkan agar dapat dipahami dan digunakan secara konsisten oleh berbagai pemangku kepentingan.

Referensi

[sunting | sunting sumber]
  1. 1 2 Meijer, Rob R. (2003-01). "Book Review: Test Scoring Edited by David Thissen and Howard Wainer Mahwah, NJ: Lawrence Erlbaum, 2001, 422 pp., $99.95 (hardcover) ISBN 0-8058-3766-3". Applied Psychological Measurement. 27 (1): 75–77. doi:10.1177/014662102237799. ISSN 0146-6216.
  2. 1 2 https://education.uiowa.edu/itp/itbs/itbs_interp_score.htm