November 2015 ~ Ali Maskur (Logos College)

A. VALIDITAS

Dalam instrumen suatu penelitian baik itu instrumen tes maupun non tes, sebagai upaya untuk menyusun instrumen yang baik sesuai dengan teori dan indikator yang ingin dicapai dalam suatu penelitian serta mampu mengukur apa yang seharusnya diukur. Tujuan yang demikin dapat direalisasikan dengan adanya validitas dan reliabilitas suatu instrumen, baik di bidang pendidikan maupun psikologi. Lalu apakah itu validitas dan reliabilitas? Apa peran keduanya bagi instrumen penelitian?

Validitas, ada berbagai pendapat mengenai validitas untuk instrumen sebagai pengukuran, menurut Arikunto (1999:65) validitas adalah suatu ukuran yang menunjukkan tingkat kesahihan suatu tes, suatu tes dikatakan valid apabila tes tersebut mampu mengukur apa yang hendak diukur, tes memiliki validitas yang tinggi jika hasilnya sesuai dengan kriteria dalam arti memiliki kesejajaran antara tes dan kriteria”. Pendapat di atas diperkuat oleh Kerlinger dkk (dalam Heri, tanpa tahun) bahwa validitas suatu alat ukur adalah sejauh mana alat ukur itu mampu mengukur apa yang seharusnya diukur. Sementara itu, menurut Linn dan Gronlund (dalam Heri, tanpa tahun) menjelaskan validitas mengacu pada kecukupan dan kelayakan interpretasi yang dibuat dari penilaian, berkenaan dengan penggunaan khusus. Sesuai dengan pendapat yang dikemukakan oleh para ahli di atas, bahwa validitas sebagai pengukuran untuk menunjukkan sesuai atau tidaknya suatu instrumen dengan kriteria yang akan diteliti, hingga mendapatkan instrumen yang valid dengan mampu mengukur apa yang hendak diukur, jadi instrumen bersifat lebih spesifik sesuai dengan kriteria yang akan diteliti.

Validitas memiliki 3 tipe, yaitu:

1. Validitas kriteria (criterion-related)

2. Validitas isi (content related), dan

3. Validitas konstruk (construct-related)

(Nunnally, 1978, Allen dan Yen, 1979, Fernandes, 1984, Woolfolk dan McCane, 1984, Kerlinger, 1986, dan Lawrence, 1994).

Macam-macam validitas di atas dapat diketahui melalui fakta keberadaan validitas, sedangkan sumber fakta validitas dapat dikelompokkan menjadi isi tes, proses, respons, struktur internal, hubungan dengan variabel lain, dan konsekuensi dari pelaksanaan tes. Dengan adanya analisis empirik maupun non empirik dari isi tes dan skor tes data respons butir dapat mengidentifikasi kevalidan suatu perangkat tes. Dalam validitas kriteria terdapat validitas prediktif yang dimaksud untuk menjawab pertanyaan sejauh mana tes memprediksi kemampuan siswa di masa mendatang, dan validitas konkuren yang dimaksud untuk mengestimasi kemampuan dengan alat ukur lain dengan tenggang waktu yang hampir bersamaan. Validitas isi adalah sejauh mana butir-butir yang terdapat dalam instrumen mampu mewakili komponen-komponen yang hendak diukurnya baik dalam segi isi maupun cerminan ciri perilaku yang akan diteliti. Validitas isi dilakukan dengan menyerahkan bentuk instrumen tersebut kepada ahli (sesuai dengan bidangnya) sebagai validator, dengan maksud untuk mengoreksi apakah instrumen tersebut sudah dikatakan valid dengan kata lain mampu mengukur apa yang (konsep) hendak diukurnya. Tipe yang ketiga validitas konstruk, validitas ini dimaksud untuk menunjukkan apakah instrumen tersebut mampu mengkonstruk teoritis (mengungkap suatu kemampuan) yang hendak diukurnya. Validitas ini dilakukan dengan menguji coba soal kepada siswa lain (selain objek penelitian) yang sesuai dengan jenjang pendidikannya. Apabila hasilnya sesuai dengan harapan, maka instrumen itu dianggap memiliki validitas konstruk yang baik.

Dalam pengukuran validitas, validitas isi yang ditentukan menggunakan kesepakatan ahli, ketika suatu instrumen telah diyakini oleh para ahli mampu mengukur penguasaan kemampuan yang didefinisikan, dengan indeks validitas butir yang diusulkan oleh Aiken dirumuskan sebagai berikut:

, dengan

, r = skor kategori pilihan rater dan

= skor terendah dalam kategori penyekoran, n = banyaknya rater, dan c = banyaknya kategori yang dapat dipilih rater. Berdasarkan kesepakatan di atas maka V merupakan indeks kesepakatan rater terhadap kesesuaian butir (sesuai tidaknya butir instrumen) dengan indikator yang ingin diukur dengan instrumen tersebut.

Lain halnya dalam validitas konstruk, dalam pengukuran validitasnya dengan membuktikan kebermaknaan skor hasil pengukuran, lalu analisis yang banyak digunakan antara lain dengan analisis faktor eksploratori (exploratory factor analysis, EFA) maupun analisis faktor konfirmatori (confirmatory factor analysis, CFA). Dalam segi penggunaannya, EFA digunakan ketika model pengukuran dari konstruk instrumen masih dicari ataupun dilakukan eksplorasi, namun pada CFA, ketika model pengukuran telah ada teorinya, maka konstruk instrumen tinggal dibuktikan atau dikonfirmasi. Pada analisis faktor dapat menggunakan program komputer seperti SPSS, SAS, MINITAB, R, MPLUS, dan lain sebagainya.

Kemudian dalam validitas kriteria ini dapat digunakan dengan melihat kebermanfaatan dari interpretasi skor hasil pengukuran (usefulness). Pada validitas ini diperlukan skor hasil pengukuran menggunakan instrumen lain yang lebih terstandar. Dalam penghitungannya yang sering digunakan dalam validasi ini adalah menggunakan analisis korelasi, seperti analisis product-moment. Jika kriteria yang telah ada saat skor penilaian diperoleh atau dalam perolehan kedua data dalam rentang waktu yang tidak terlalu lama, validasi ini bersifat konkuren, namun jika sebaliknya kedua data diperoleh dalam rentang waktu yang cukup lama maka validasi ini bersifat prediktif. Validitas kriteria ini dapat diketahui dengan mengestimasi korelasi skor tes peserta dengan skor kriteria. Dengan adanya validitas kriteria ini memiliki manfaat yaitu dengan adanya validitas kriteria ini dapat memprediksi suatu skor kemampuan ke skor kriteria sebagai cara memprediksi kemampuan atau performen peserta tes. Prediksi ini menggunakan persamaan regresi, ada 2 macam regresi yang dapat digunakan dalam hal ini, yaitu regresi sederhana (tunggal) yang memiliki ciri prediktornya hanya satu saja, persamaannya sebagai berikut:

Dengan

merupakan hasil prediksi,

sebagai konstanta,

sebagai koefisien prediktor, dan X merupakan prediktor.

Cara kedua adalah menggunakan regresi ganda, dengan ciri prediktornya lebih dari satu variabel. Regresi ganda ini dipergunakan ketika tes terdiri dari beberapa subtes, dan prediktor merupakan jumlahan skor dari subtes-subtes yang terdapat dalam perangkat. Persamaan regresi ini sebagai berikut:

B. RELIABILITAS

Dalam suatu instrumen tes, maka peran reliabilitas adalah untuk mengetahui seberapa andal instrumen yang akan diteskan, menilik dari reliabilitas itu sendiri merupakan derajat keajegan (consistency) di antara 2 buah hasil pengukuran pada objek yang sama. Lebih jelasnya bahwa konsistensi hasil pengukuran dengan menggunakan alat ukur yang sama untuk orang yang berbeda atau pada waktu yang berbeda tetapi kondisi yang sama. Konsistensi ini berkaitan dengan tingkat kesalahan hasil suatu tes yang berupa skor.

Allen dan Yen (dalam Retnawati: tanpa tahun) menyatakan bahwa tes dikatakan reliabel (ajeg) jika skor amatan mempunyai korelasi yang tinggi dengan skor yang sebenarnya. Selanjutnya dinyatakan bahwa reliabilitas merupakan koefisien korelasi antara dua skor amatan yang diperoleh dari hasil pengukuran menggunakan tes yang paralel. Dengan demikian pengertian yang dapat diperoleh dari penrnyataan di atas bahwa suatu tes itu dikatakan reliabel (ajeg) jika hasil pengukuran mendektati keadaan peserta tes yang sebenarnya. Namun dalam pendidikan, ciri atau karakter seseorang tidak dapat langsung dilakukan pengukuran, yang mana hal tersebut bersifat abstrak.

Reliabilitas suatu instrumen tes pada umumnya diekspresikan secara numerik dalam bentuk koefisien yang besarnya -1 > 0 > 1. Koefisien itu yang menunjukkan tinggi atau rendahnya reliabilitas tersebut. Ketika koefisien tinggi maka reliabilitas pun juga tinggi yang menunjukkan kesalahan yang kecil dan pengaruh kesalahan pengukuran telah terkurangi, demikian sebaliknya ketika koefisien rendah maka reliabilitas pun juga rendah yang mengindikasikan kesalahan yang tidak sedikit. Kesalahan pengukuran itu sendiri dapat disebabkan oleh beberapa faktor, diantaranya adalah karakteristik tes evaluasi itu sendiri, seperti butir-butir tes yang meragukan, dan tidak sesuai dengan aturan buku, peserta tes yang lelah/ kondisi yang tidak kondusif untuk diselenggarakannya tes., problema pribadi, motivasi dari siswa yang kurang, lingkungan diselenggarakan tes yang tidak memadai atau mendukung, atau bahkan kombinasi dari permasalahan-permasalahan di atas.

Perhitungan reliabilitas disebut dengan estimasi. Estimasi reliabilitas tes itu sendiri dapat dilakukan dengan dua cara sebagai berikut:

1. Pengukuran Konsisitensi Eksternal

Pengukuran ini diperoleh dengan cara mengolah hasil pengetesan yang berbeda, baik itu dari instrumen yang berbeda maupun sama, pengukuran ini pun dapat dilakukan dengan dua cara:

a. Metode tes ulang (Test-Retest-Method)

Dilihat dari segi nama pun telah mencerminkan bahwa dengan metode ini untuk mengetahui sampai dimana suatu pengukuran dapat diandalkan, maka pengukuran ini dapat dilakukan dua kali, pengukuran pertama dan ulangannya. Kedua-duanya dapat dilakukan pada orang yang sama maupun berbeda. Reliabilitas tes retest ini penting ketika kita menafsirkan koefisien tes-retes untuk mengetahui: jangka waktu antara kedua pengambilan penilaian, stabilitas yang diharapkan dari kinerja yang diukur. Secara umum, semakin lama antara interval pelaksanaan tes yang berulang, maka semakin rendah tingkat reliabilitasnya. Untuk mengetahui koefisien reliabilitas melalui pendekatan tes-retes dapat dilakukan dengan menghitung koefisien korelasi linier antara distribusi skor subjek pada pemberian tes pertama dengan skor pada pemberian skor kedua.

b. Metode Bentuk Paralel (Equivalent)

Tes paralel atau tes equivalent adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran, dan susunan, tetapi butir-butir soalnya berbeda. Dalam menggunaka tes paralel, pengetes harus menyiapkan dua buah tes, dan masing-masing instrumen tes tersebut diujicobakan pada sekelompok siswa wang sama. Penggunaan metode ini baik karena siswa dihadapkan oleh dua macam tes, sehingga tidak ada faktor “masih ingat-ingat soalnya”. Namun kelemahan metode ini adalah pengetes pekerjaannya berat karena harus menyusun dua seri tes, dan harus dalam waktu yang lama dalam mencobakan dua kali tes. Adapun langkah-langkah dalam metode ini sebagai berikut:

i. Menentukan subjek sasaran yang hendak dites

ii. Melakukan tes yang dimaksud kepada sasaran subjek yang dimaksud

iii. Diadministrasi dengan baik

iv. Dalam waktu yang tidak begitu lama melakukan tes yang kedua pada kelompok tersebut

v. Mengkorelasikan antara kedua skor tersebut

Reliabiitas ekuivalen merupakan salah satu bentuk yang diterima dan umum dipakai dalam penelitian terutama dalam penelitian pendidikan.

2. Pengukuran Konsistensi Internal

Reliabilitas ini diperoleh dengan cara menganalisis data dari satu kali pengetesan. Pengetesan suatu teknik didasarkan atas bentuk instrumen atau selera peneliti. Namun, untuk beberapa teknik diperlukan persyaratan-persyaratan tertentu sehingga peneliti tidak begitu saja memilih teknik-teknik tersebut. Beberapa metode yang dapat digunakan untuk mencari besarnya reabilitas antara lain sebagai berikut:

a. Metode Belah Dua (Split Half Method)

Dalam metode belah dua ini, pengetasnnya hanya menggunakan satu tes yang dicobakan satu kali pada sejumlah sampel. Item-item tesnya dibagi dua, kemudian skor dari setengah item-item tes pada bagian yang pertama dikorelasikan dengan skor setengah item-item tes pada bagian yang kedua. Adapun persyaratan yang harus dipenuhi dalam menggunaka teknik belah dua yaitu: banyaknya butir pertanyaan atau butir soal dalam instrumen harus genap agar dapat dibelah dua, dan antara belahan pertama dan belahan kedua harus seimbang. Terkait belahan instrumen yang dikatakan seimbang jika jumlah butir pertanyaannya sama dan pertanyaan tersebut mengungkapkan aspek yang sama. Untuk menghindari kemungkinan terjadinya pengelompokan item-item tertentu ke dalam salah satu belahan saja melalui cara berikut: membelah item-item genap dan item-item ganjil yang selanjutnya disebut belahan ganjil-genap, dan membelah atas item-item awal dan item-item akhir yaitu separoh jumlah pada nomer-nomer awal dan separo pada nomer-nomer akhir yang selanjutnya disebut belahan awal-akhir.

Adapun cara pengujiannya menggunakan berbagai cara berikut:

1) Reliabilitas dengan Rumus Spearman-Brown

Rumus spearman brown yang digunakan adalah:

Keterangan:

reliabilitas instrumen

indeks korelasi antara dua belahan instrumen

banyaknya responden

belahan pertama

belahan kedua

2) Reliabilitas dengan Rumas Flanagan

Dalam teknik ini, maka peneliti harus melakukan analisis butir terlebih dahulu dan menggunakan teknik belah dua ganjil-genap. Rumus Flanagan sebagai berikut:

Keterangan:

reliabilitas instrumen

varians belahan pertama (varians skor butir ganjil)

varians belahan kedua (varians skor butir-butir genap)

varians skor total

Untuk semua rumus varians adalah:

3) Reliabilitas denga Rumus Rulon

Dalam metode ini, perbedaan skor subjek pada kedua belahan tesakan membentuk distribusi perbedaan skor dengan varians yang besarnya ditentukan oleh varians eror, masing-masing belahan menentuka varians eror keseluruhan tes. Metode ini dengan merumuskan formula untuk mengestimasi reliabilitas belah dua tanpa perlu berasumsi bahwa kedua belahan mempunyai varians yang sama.