Psikometri atau pengukuran psikologis adalah cabang ilmu psikologi yang mendalami seluk beluk pengukuran dan analisis berbagai perbedaan antar individu (individual differences)[1] sehingga dapat dikatakan bahwa psikometri mempelajari perbedaan antar individu dan antar kelompok. Aktivitas utama dalam psikometri meliputi konstruksi atau penyusunan berbagai teori psikologi menjadi alat ukur psikologi/alat tes psikologi, serta pengembangan dan analisis data hasil pengukuran tersebut.[1]

Psikometri merupakan sebuah upaya untuk mendukung paradigma Penilaian Psikologis Berbasis Bukti (Evidence-based Psychological Assessment/EBPA).[2] Menurut paradigma ini, pemenuhan kualitas psikometris yang baik merupakan sebuah syarat perlu (neccessary condition) namun belum memadai untuk menghasilkan penilaian atau asesmen yang baik. Asesmen yang baik merupakan kombinasi antara karakteristik psikometris yang terbaik dan karakteristik kontekstual dari orang atau kelompok yang dikenai pengukuran, baik konteks fisik, bahasa, preferensi, kesejarahan, maupun budaya. Oleh karenanya penyelenggara atau pemberi tes psikometris yang kompeten merupakan mereka yang tidak hanya menguasai substansi tes melainkan juga menguasai substansi lapangan di mana pengetesan dilaksanakan.

Pada awalnya, aktivitas psikometri dilakukan dalam upaya mengukur kecerdasan. Namun sejalan dengan perkembangannya, saat ini aktivitas psikometri banyak dipakai dalam bidang ilmu sosial terutama pendidikan dan psikologi, mencakup pengukuran pengetahuan, kemampuan, sikap, dan kepribadian. Salah satu hasil dari aktivitas psikometri adalah tes psikologis atau psikotes.

Konsep Kunci

sunting

Konsep kunci dalam psikometri adalah validitas dan reliabilitas .Suatu alat ukur psikologis dikatakan valid jika suatu tes sungguh-sungguh mengukur atribut psikologis yang hendak diukurnya.[3] Sementara suatu alat ukur psikologi dikatakan reliabel jika hasil pengukurannya konsisten saat alat tes tersebut dilakukan berulang kali terhadap suatu populasi individu atau kelompok.[3]

Validitas

sunting

Menurut Supratiknya (2014), validitas mengacu pada "taraf sejauh mana evidensi atau bukti-bukti empiris maupun teoretis mendukung cara penafsiran skor tes sesuai tujuan penggunaan tes".[1] Artinya bahwa validasi berusaha memeriksa dan mengevaluasi kualitas penafsiran skor tes sesuai dengan tujuan penggunaan tes, bukan tes itu sendiri. Hal ini dapat dilihat dari lima jenis evidensi yang perlu dikumpulkan dalam rangka memeriksa dan mengevaluasi validitas alat ukur.

  • Evidensi terkait isi tes: Kesesuaian antara isi tes dengan teori yang diukur. Evidensi ini dapat diperoleh melalui analisis logis atau empiris terhadap seberapa cocok isi tes dan interpretasi tes mewakili teori yang dimnaksud. Dalam konsep lama, evidensi ini terkait dengan validitas isi atau content validity.
  • Evidensi terkait respon: Penilaian terhadap kesesuaian antara teori yang diukur dengan kinerja atau respon yang diberikan oleh subjek. Evidensi ini dapat diperoleh dengan cara mengobservasi atau mewawancarai subjek pengetesan. Dalam konsep lama, evidensi ini terkait dengan validitas konstruk atau construct validity.
  • Evidensi terkait struktur internal tes: Penilaian terhadap kesesuaian hubungan antar item dan hubungan antar komponen tes sesuai dengan teori yang diukur. Evidensi ini umumnya diperoleh dengan analisis faktor konfirmatori dan/atau teknik differential item fuction (DIF). Dalam konsep lama, jenis evidensi ini juga dikaitkan dengan validitas konstruk atau construct validity.
  • Evidensi terkait hubungan dengan variabel lain: Analisis terhadap hubungan antara hasil tes dengan tes-tes atau bahkan teori-teori lain diluar hasil tes yang didapatkan. Evidensi ini diperoleh dengan menganalisis hubungan antara skor tes dan variabel-variabel psikologis lain diluar tes itu sendiri. Variabel yang dimaksud dapat berupa tes-tes lain yang mengukur teori yang sama, ataupun teori lain yang berbeda sehingga dapat dibandingkan dengan teori yang diukur. Dalam pengertian lama, evidensi ini dikaitkan dengan validitas terkait kriteria atau criterion-related validity.
  • Evidensi terkait konsekuensi pengetesan: Melihat konsekuensi atau dampak atau akibat baik dari penerapan tes kepada subjek. Hal-hal tersebut sering kali dapat direncanakan maupun tidak direncanakan. Contohnya psikotes sebuah perusahaan yang direncanakan berdampak pada penempatan karyawan sesuai kemampuannya dan menyeleksi calon karyawan yang tidak sesuai kriteria. Contoh yang tidak direncanakan misalnya peningkatan motivasi belajar siswa atau metode pengajaran guru di kelas setelah mengetahui hasil pengetesan. Dalam konsep lama, jenis evidensi ini terkait dengan validitas konstruk atau construct validity.

Reliabilitas

sunting

Menurut Supratiknya (2014), reliabilitas mengacu pada "konsistensi hasil pengukuran jika prosedur pengetesannya dilakukan secara berulangkali terhadap suatu populasi individu atau kelompok".[1] Artinya bahwa reliabilitas berusaha memastikan bahwa sebuah alat ukur menghasilkan sebuah nilai yang bebas dari kesalahan pengukuran. Kenyataannya, kelompok atau individu yang sama selalu menunjukkan hasil pengukuran yang berbeda setiap kali dikenai tes yang sama pada waktu yang berbeda. Hal itu karena skor yang dicapai oleh subjek selalu mengandung sejumlah kecil kesalahan pengukuran atau measurement error, yaitu selisih antara skor yang dicapai oleh subjek dari suatu alat tes dengan skor murni. Kesalahan pengukuran ini bersifat acak (random) dan tidak terprediksi (unpredictable) sehingga tidak mungkin dihilangkan dari skor yang dicapai oleh subjek. Disini reliabilitas berusaha mencari besaran agregat kesalahan pengukuran tersebut dengan beberapa cara, yaitu dalam bentuk varians atau deviasi standar kesalahan pengukuran, koefisien reliabilitas, dan fungsi informasi tes berbasis item-response theory (IRT).

  • Varians atau Standar Deviasi kesalahan pengukuran: Besaran agregat kesalahan pengukuran bisa dirumuskan dalam bentuk varians atau standar deviasi kesalahan pengukuran yang didapatkan dari serangkaian analisis statistik. Keseluruahn varians kesalahan pengukuran sesungguhnya adalah rata-rata (a weighted average) dari nilai-nilai yang diperoleh suatu alat tes. Makin kecil standar deviasi kesalahan pengukuran, maka makin kecil pula kesalahan pengukurannya, sehingga makin reliabel pula hasil pengukurannya.
  • Koefisien Reliabilitas: Cara lain merumuskan agregat kesalahan pengukuran melalui bentuk koefisien reliabilitas. Secara tradisional ada tiga jenis koefisien reliabilitas. Makin besar nilai dari tiga jenis koefisien tersebut, makin tinggi reliabilitas hasil pengukurannya.
    • Koefisien bentuk alternatif: koefisien yang diperoleh dari pemberian bentuk-bentuk paralel tes pada waktu yang berbeda.
    • Koefisien tes-retes: koefisien yang diperoleh dari pemberian tes yang sama pada waktu pada waktu yang berbeda.
    • Koefisien konsistensi internal: koefisien yang diperoleh dari hubungan antar item dari pemberian tes pada satu waktu.
  • Fungsi Informasi Tes: Fungsi informasi tes secara efisien menunjukkan seberapa baik tes mampu membedakan subjek pada berbagai atribut psikologis yang diukur. Item-response theory (IRT) digunakan sebagai model untuk menunjukkan proporsi jawaban benar terhadap suatu item yang meningkat pada berbagai taraf yang secara progresif makin meningkat dari atribut psikologis yang diukur. Fungsi ini dapat dipandang sebagai pernyataan matematis tentang ketepatan pengukuran pada masing-masing taraf atribut psikologis yang diukur. Makin tinggi ketepatan maka makin kecil kesalahan pengukuran, sehingga makin tinggi reliabilitas hasil pengukurannya.

Referensi

sunting
  1. ^ a b c d Supratiknya, A. (2014). Pengukuran Psikologis. Yogyakarta: Penerbit USD.
  2. ^ Iliescu, Dragos (2021-09-13). "Evidence-based Psychological Assessment": 50–52. ISBN 978-989-758-515-9. 
  3. ^ a b Clark-Carter, D. (2010). Quantitative psychological research: a student’s handbook. New York: Psychology Press.