A. VALIDITAS
Dalam
instrumen suatu penelitian baik itu instrumen tes maupun non tes, sebagai upaya
untuk menyusun instrumen yang baik sesuai dengan teori dan indikator yang ingin
dicapai dalam suatu penelitian serta mampu mengukur apa yang seharusnya diukur.
Tujuan yang demikin dapat direalisasikan dengan adanya validitas dan
reliabilitas suatu instrumen, baik di bidang pendidikan maupun psikologi. Lalu
apakah itu validitas dan reliabilitas? Apa peran keduanya bagi instrumen
penelitian?
Validitas,
ada berbagai pendapat mengenai validitas untuk instrumen sebagai pengukuran, menurut Arikunto (1999:65) validitas adalah suatu
ukuran yang menunjukkan tingkat kesahihan suatu tes, suatu tes dikatakan valid
apabila tes tersebut mampu mengukur apa yang hendak diukur, tes memiliki
validitas yang tinggi jika hasilnya sesuai dengan kriteria dalam arti memiliki
kesejajaran antara tes dan kriteria”. Pendapat di atas diperkuat oleh Kerlinger
dkk (dalam Heri, tanpa tahun) bahwa validitas suatu alat ukur adalah sejauh
mana alat ukur itu mampu mengukur apa yang seharusnya diukur. Sementara itu,
menurut Linn dan Gronlund (dalam Heri, tanpa tahun) menjelaskan validitas
mengacu pada kecukupan dan kelayakan interpretasi yang dibuat dari penilaian,
berkenaan dengan penggunaan khusus. Sesuai dengan pendapat yang dikemukakan oleh
para ahli di atas, bahwa validitas sebagai pengukuran untuk menunjukkan sesuai
atau tidaknya suatu instrumen dengan kriteria yang akan diteliti, hingga
mendapatkan instrumen yang valid dengan mampu mengukur apa yang hendak diukur,
jadi instrumen bersifat lebih spesifik sesuai dengan kriteria yang akan
diteliti.
Validitas memiliki 3 tipe, yaitu:
1. Validitas
kriteria (criterion-related)
2. Validitas
isi (content related), dan
3. Validitas
konstruk (construct-related)
(Nunnally,
1978, Allen dan Yen, 1979, Fernandes, 1984, Woolfolk dan McCane, 1984,
Kerlinger, 1986, dan Lawrence, 1994).
Macam-macam
validitas di atas dapat diketahui melalui fakta keberadaan validitas, sedangkan
sumber fakta validitas dapat dikelompokkan menjadi isi tes, proses, respons,
struktur internal, hubungan dengan variabel lain, dan konsekuensi dari
pelaksanaan tes. Dengan adanya analisis empirik maupun non empirik dari isi tes
dan skor tes data respons butir dapat mengidentifikasi kevalidan suatu
perangkat tes. Dalam validitas kriteria terdapat validitas prediktif yang
dimaksud untuk menjawab pertanyaan sejauh mana tes memprediksi kemampuan siswa
di masa mendatang, dan validitas konkuren yang dimaksud untuk mengestimasi
kemampuan dengan alat ukur lain dengan tenggang waktu yang hampir bersamaan.
Validitas isi adalah sejauh mana butir-butir yang terdapat dalam instrumen
mampu mewakili komponen-komponen yang hendak diukurnya baik dalam segi isi
maupun cerminan ciri perilaku yang akan diteliti. Validitas isi dilakukan
dengan menyerahkan bentuk instrumen tersebut kepada ahli (sesuai dengan
bidangnya) sebagai validator, dengan maksud untuk mengoreksi apakah instrumen
tersebut sudah dikatakan valid dengan kata lain mampu mengukur apa yang
(konsep) hendak diukurnya. Tipe yang ketiga validitas konstruk, validitas ini
dimaksud untuk menunjukkan apakah instrumen tersebut mampu mengkonstruk
teoritis (mengungkap suatu kemampuan) yang hendak diukurnya. Validitas ini
dilakukan dengan menguji coba soal kepada siswa lain (selain objek penelitian)
yang sesuai dengan jenjang pendidikannya. Apabila hasilnya sesuai dengan
harapan, maka instrumen itu dianggap memiliki validitas konstruk yang baik.
Dalam
pengukuran validitas, validitas isi yang ditentukan menggunakan kesepakatan
ahli, ketika suatu instrumen telah diyakini oleh para ahli mampu mengukur
penguasaan kemampuan yang didefinisikan, dengan indeks validitas butir yang
diusulkan oleh Aiken dirumuskan sebagai berikut: , dengan , r = skor kategori pilihan rater dan = skor terendah dalam
kategori penyekoran, n = banyaknya rater, dan c = banyaknya kategori yang dapat
dipilih rater. Berdasarkan kesepakatan di atas maka V merupakan indeks
kesepakatan rater terhadap kesesuaian butir (sesuai tidaknya butir instrumen)
dengan indikator yang ingin diukur dengan instrumen tersebut.
Lain
halnya dalam validitas konstruk, dalam pengukuran validitasnya dengan
membuktikan kebermaknaan skor hasil pengukuran, lalu analisis yang banyak
digunakan antara lain dengan analisis faktor eksploratori (exploratory factor analysis, EFA) maupun analisis faktor
konfirmatori (confirmatory factor
analysis, CFA). Dalam segi penggunaannya, EFA digunakan ketika model
pengukuran dari konstruk instrumen masih dicari ataupun dilakukan eksplorasi,
namun pada CFA, ketika model pengukuran telah ada teorinya, maka konstruk
instrumen tinggal dibuktikan atau dikonfirmasi. Pada analisis faktor dapat
menggunakan program komputer seperti SPSS, SAS, MINITAB, R, MPLUS, dan lain
sebagainya.
Kemudian
dalam validitas kriteria ini dapat digunakan dengan melihat kebermanfaatan dari
interpretasi skor hasil pengukuran (usefulness).
Pada validitas ini diperlukan skor hasil pengukuran menggunakan instrumen lain
yang lebih terstandar. Dalam penghitungannya yang sering digunakan dalam
validasi ini adalah menggunakan analisis korelasi, seperti analisis product-moment. Jika kriteria yang telah
ada saat skor penilaian diperoleh atau dalam perolehan kedua data dalam rentang
waktu yang tidak terlalu lama, validasi ini bersifat konkuren, namun jika
sebaliknya kedua data diperoleh dalam rentang waktu yang cukup lama maka
validasi ini bersifat prediktif. Validitas kriteria ini dapat diketahui dengan
mengestimasi korelasi skor tes peserta dengan skor kriteria. Dengan adanya
validitas kriteria ini memiliki manfaat yaitu dengan adanya validitas kriteria
ini dapat memprediksi suatu skor kemampuan ke skor kriteria sebagai cara
memprediksi kemampuan atau performen peserta tes. Prediksi ini menggunakan
persamaan regresi, ada 2 macam regresi yang dapat digunakan dalam hal ini,
yaitu regresi sederhana (tunggal) yang memiliki ciri prediktornya hanya satu saja,
persamaannya sebagai berikut:
Dengan
merupakan hasil prediksi, sebagai konstanta, sebagai koefisien prediktor, dan X merupakan
prediktor.
Cara
kedua adalah menggunakan regresi ganda, dengan ciri prediktornya lebih dari
satu variabel. Regresi ganda ini dipergunakan ketika tes terdiri dari beberapa
subtes, dan prediktor merupakan jumlahan skor dari subtes-subtes yang terdapat
dalam perangkat. Persamaan regresi ini sebagai berikut:
B.
RELIABILITAS
Dalam
suatu instrumen tes, maka peran reliabilitas adalah untuk mengetahui seberapa
andal instrumen
yang akan diteskan, menilik dari reliabilitas itu sendiri merupakan derajat
keajegan (consistency) di antara 2
buah hasil pengukuran pada objek yang sama. Lebih jelasnya bahwa konsistensi
hasil pengukuran dengan menggunakan alat ukur yang sama untuk orang yang
berbeda atau pada waktu yang berbeda tetapi kondisi yang sama. Konsistensi ini
berkaitan dengan tingkat kesalahan hasil suatu tes yang berupa skor.
Allen dan Yen (dalam Retnawati: tanpa tahun)
menyatakan bahwa tes dikatakan reliabel (ajeg) jika skor amatan mempunyai
korelasi yang tinggi dengan skor yang sebenarnya. Selanjutnya dinyatakan bahwa reliabilitas
merupakan koefisien korelasi antara dua skor amatan yang diperoleh dari hasil
pengukuran menggunakan tes yang paralel. Dengan demikian pengertian yang dapat
diperoleh dari penrnyataan di atas bahwa suatu tes itu dikatakan reliabel
(ajeg) jika hasil pengukuran mendektati keadaan peserta tes yang sebenarnya.
Namun dalam pendidikan, ciri atau karakter seseorang tidak dapat langsung
dilakukan pengukuran, yang mana hal tersebut bersifat abstrak.
Reliabilitas
suatu instrumen tes pada umumnya diekspresikan secara numerik dalam bentuk
koefisien yang besarnya -1 > 0 > 1. Koefisien itu yang menunjukkan tinggi
atau rendahnya reliabilitas tersebut. Ketika koefisien tinggi maka reliabilitas
pun juga tinggi yang menunjukkan kesalahan yang kecil dan pengaruh kesalahan
pengukuran telah terkurangi, demikian sebaliknya ketika koefisien rendah maka
reliabilitas pun juga rendah yang mengindikasikan kesalahan yang tidak sedikit.
Kesalahan pengukuran itu sendiri dapat disebabkan oleh beberapa faktor,
diantaranya adalah karakteristik tes evaluasi itu sendiri, seperti butir-butir
tes yang meragukan, dan tidak sesuai dengan aturan buku, peserta tes yang
lelah/ kondisi yang tidak kondusif untuk diselenggarakannya tes., problema
pribadi, motivasi dari siswa yang kurang, lingkungan diselenggarakan tes yang
tidak memadai atau mendukung, atau bahkan kombinasi dari
permasalahan-permasalahan di atas.
Perhitungan
reliabilitas disebut dengan estimasi. Estimasi reliabilitas tes itu sendiri
dapat dilakukan dengan dua cara sebagai berikut:
1.
Pengukuran Konsisitensi Eksternal
Pengukuran
ini diperoleh dengan cara mengolah hasil pengetesan yang berbeda, baik itu dari
instrumen yang berbeda maupun sama, pengukuran ini pun dapat dilakukan dengan
dua cara:
a.
Metode tes ulang (Test-Retest-Method)
Dilihat
dari segi nama pun telah mencerminkan bahwa dengan metode ini untuk mengetahui
sampai dimana suatu pengukuran dapat diandalkan, maka pengukuran ini dapat
dilakukan dua kali, pengukuran pertama dan ulangannya. Kedua-duanya dapat dilakukan
pada orang yang sama maupun berbeda. Reliabilitas tes retest ini penting ketika
kita menafsirkan koefisien tes-retes untuk mengetahui: jangka waktu antara
kedua pengambilan penilaian, stabilitas yang diharapkan dari kinerja yang
diukur. Secara umum, semakin lama antara interval pelaksanaan tes yang
berulang, maka semakin rendah tingkat reliabilitasnya. Untuk mengetahui
koefisien reliabilitas melalui pendekatan tes-retes dapat dilakukan dengan
menghitung koefisien korelasi linier antara distribusi skor subjek pada
pemberian tes pertama dengan skor pada pemberian skor kedua.
b.
Metode Bentuk Paralel (Equivalent)
Tes
paralel atau tes equivalent adalah
dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran, dan susunan,
tetapi butir-butir soalnya berbeda. Dalam menggunaka tes paralel, pengetes
harus menyiapkan dua buah tes, dan masing-masing instrumen tes tersebut
diujicobakan pada sekelompok siswa wang sama. Penggunaan metode ini baik karena
siswa dihadapkan oleh dua macam tes, sehingga tidak ada faktor “masih
ingat-ingat soalnya”. Namun kelemahan metode ini adalah pengetes pekerjaannya
berat karena harus menyusun dua seri tes, dan harus dalam waktu yang lama dalam
mencobakan dua kali tes. Adapun langkah-langkah dalam metode ini sebagai
berikut:
i.
Menentukan subjek sasaran yang hendak
dites
ii.
Melakukan tes yang dimaksud kepada
sasaran subjek yang dimaksud
iii.
Diadministrasi dengan baik
iv.
Dalam waktu yang tidak begitu lama
melakukan tes yang kedua pada kelompok tersebut
v.
Mengkorelasikan antara kedua skor
tersebut
Reliabiitas
ekuivalen merupakan salah satu bentuk yang diterima dan umum dipakai dalam
penelitian terutama dalam penelitian pendidikan.
2.
Pengukuran Konsistensi Internal
Reliabilitas
ini diperoleh dengan cara menganalisis data dari satu kali pengetesan.
Pengetesan suatu teknik didasarkan atas bentuk instrumen atau selera peneliti.
Namun, untuk beberapa teknik diperlukan persyaratan-persyaratan tertentu
sehingga peneliti tidak begitu saja memilih teknik-teknik tersebut. Beberapa
metode yang dapat digunakan untuk mencari besarnya reabilitas antara lain
sebagai berikut:
a.
Metode Belah Dua (Split Half Method)
Dalam
metode belah dua ini, pengetasnnya hanya menggunakan satu tes yang dicobakan
satu kali pada sejumlah sampel. Item-item tesnya dibagi dua, kemudian skor dari
setengah item-item tes pada bagian yang pertama dikorelasikan dengan skor
setengah item-item tes pada bagian yang kedua. Adapun persyaratan yang harus
dipenuhi dalam menggunaka teknik belah dua yaitu: banyaknya butir pertanyaan
atau butir soal dalam instrumen harus genap agar dapat dibelah dua, dan antara
belahan pertama dan belahan kedua harus seimbang. Terkait belahan instrumen
yang dikatakan seimbang jika jumlah butir pertanyaannya sama dan pertanyaan
tersebut mengungkapkan aspek yang sama. Untuk menghindari kemungkinan
terjadinya pengelompokan item-item tertentu ke dalam salah satu belahan saja
melalui cara berikut: membelah item-item genap dan item-item ganjil yang
selanjutnya disebut belahan ganjil-genap, dan membelah atas item-item awal dan
item-item akhir yaitu separoh jumlah pada nomer-nomer awal dan separo pada
nomer-nomer akhir yang selanjutnya disebut belahan awal-akhir.
Adapun
cara pengujiannya menggunakan berbagai cara berikut:
1)
Reliabilitas dengan Rumus Spearman-Brown
Rumus
spearman brown yang digunakan adalah:
Keterangan:
reliabilitas instrumen
indeks korelasi antara dua belahan instrumen
banyaknya responden
belahan pertama
belahan kedua
2)
Reliabilitas dengan Rumas Flanagan
Dalam
teknik ini, maka peneliti harus melakukan analisis butir terlebih dahulu dan
menggunakan teknik belah dua ganjil-genap. Rumus Flanagan sebagai berikut:
Keterangan:
reliabilitas instrumen
varians belahan pertama (varians skor butir
ganjil)
varians belahan kedua (varians skor
butir-butir genap)
varians skor total
Untuk
semua rumus varians adalah:
3) Reliabilitas
denga Rumus Rulon
Dalam
metode ini, perbedaan skor subjek pada kedua belahan tesakan membentuk
distribusi perbedaan skor dengan varians yang besarnya ditentukan oleh varians
eror, masing-masing belahan menentuka varians eror keseluruhan tes. Metode ini
dengan merumuskan formula untuk mengestimasi reliabilitas belah dua tanpa perlu
berasumsi bahwa kedua belahan mempunyai varians yang sama.
Keterangan:
reliabilitas instrumen
varians total atau varians skor total
varians (varians difference)
skor pada belahan awal
dikurangi skor pada belahan akhir
b. Kuder-Richardson-Realiability
Pada
metode ini, yang membedakan penggunaannya adalah jumlah butir tes genap atau
ganjil.
1)
KR-20
Apabila
peneliti memiliki instrumen tes dengan jumlah butir pertanyaan ganjil, maka
dapat menggunkan rumus KR-20 sebagai berikut:
Keterangan:
reliabilitas instrumen
banyaknya butir pertanyaan atau banyaknya soal
varians total
proporsi subjek yang menjawab betul pada suatu
butir (proporsi subjek yang mendapat skor 1)
2)
KR-21
Keterangan:
reliabilitas instrumen
banyaknya butir pertanyaan atau banyaknya soal
varians total
skor rata-rata
c.
Cronbanch Alpha
Rumus
Alpha digunakan untuk mencari
reliabilitas instrumen yang skornya bukan 1 dan 0, misalnya instrumen angket
dan soal dalam bentuk uraian.
Rumus
Alpha sebagai berikut:
Keterangan:
reliabilitas instrumen
banyaknya butir pertanyaan atau banyaknya soal
jumlah varians butir
varians total
Rumus
ini yang paling banyak digunakan dalam penelitian pendidikan yang diyakini
lebih valid dalam perhitungannya.