MatKul
Pengembangan Evaluasi Pembelajaran PAI
Dosen Pengampu :
Dr. H. Agus Maimun, M.Pd & Dr. H. Mulyono, MA.
Oleh:
Moch. Hafidz Abror
Wahyudi
Indhra Musthofa
Mahasiswa PAI PascaSarjana UIN Maliki Malang
April 2014
PENDAHULUAN
Latar Belakang
Evaluasi memiliki arti penting dalam
kegiatan belajar mengajar yang dilaksanakan oleh seorang guru. Diantara tujuan
dari evaluasi adalah untuk menilai ketercapaian tujuan pendidikan oleh anak
didik, sarana untuk mengetahui apa yang telah anak didik ketahui dalam kegiatan
belajar mengajar, dan memotivasi anak didik. Untuk mengevaluasi hasil belajar
dan proses belajar siswa, seorang guru menggunakan berbagai macam alat atau
instrumen evaluasi seperti tes tertulis, tes lisan, ceklis-observasi,
angket-wawancara, dan dokumentasi.
Keberhasilan mengungkap hasil dan
proses belajar ini sebagaimana adanya (objektivitas hasil penilaian) sangat
bergantung pada kualitas alat penilainya, di samping itu juga yang tidak kalah
pentingnya tergantung pada cara pelaksanaannya. Suatu alat penilaian dikatakan
mempunyai kualitas yang baik apabila alat tersebut memiliki atau memenuhi dua
hal, yaitu validitas (ketepatan) dan reliabilitas (ketetapan atau keajegan)
alat tes terjamin kualitasnya.
Alat tes yang
bagaimana dan seperti apa yang dikatakan memiliki validitas dan reliabilias
ini, selanjutnya pada
makalah ini akan di bahas “Validitas test”.
PEMBAHASAN
1.
Validitas
a.
Pengertian Validitas
Dalam istilah bahasa Indonesia valid dikenal dengan istilah sahih atau
tepat benar. Valid menurut Gronlund dapat diartikan sebagai ketepatan
interpretasi yang dihasilkan dari skor tes atau instrumen evaluasi. Suatu
instrumen tes dikatakan valid, seperti dikatakan oleh Gay dan Johnson apabila
instrumen yang digunakan dapat mengukur apa yang hendak diukur.
Contoh yang dapat menggambarkan validitas misalnya guru olahraga yang akan
menilai kemampuan dan pemahaman siswa mengenai lari estafet maka seharusnya
guru tersebut menggunakan jenis tes praktek agar diperoleh hasil tes sesuai
tujuan. Perlu ditekankan disini bahwa suatu tes yang valid untuk menilai suatu
kelompok belum tentu tes tersebutjuga valid bila digunakan pada kelompok lain
karena perbedaan pada setiap anggota kelompok tersebut.[1]
Ruang lingkup bahasan dari validitas tes meliputi: macam validitas, cara
menentukan validitas tes, validitas butir, aplikasi penerapan rumus-rumus para
ahli dalam menentukan validitas suatu tes. Fungsi validitas instrumen adalah
untuk menentukan kesahihan instrumen sehingga jika instrumen tersebut digunakan
untuk mengumpulkan data atau digunakan untuk mengukur kemampuan seseorangtidak
diragukan lagi hasil yang diperoleh oleh instrumen tersebut.[2]
Dalam operasionalannya terdapat empat langkah validitas yaitu, triangulasi
yang mencakup keragaman sumber, data, metode, dan teori konstruk validitas
dalam pemahaman pengakuan terhadap konstruk yang ada dan bukan memaksakan
implementasi konstruk atau teori terhadap informan atau konteks; validitas
permukaan yang segera mengenal apayang terjadi secara spontan berseru “ya,
tentu saja” terhadap situasi yang sedang terjadi; dan validitas penyebab yang
mendorong partisipan untuk mengetahui kenyataan yang menyebabkan transformasi.
Menurut Richadson bahwa ada validitas tradisonal yang sangat kaku dan hanya
berdimensi dua. Ia menginginkan citra kristal sentral yang secara simetris
mengkombinasikan substansi dan pendekatan-pendekatan.[3]
b.
Makna Validitas
Validitas suatu instrumen evaluasi mempunyai beberapa makna penting
diantaranya adalah sebagai berikut:
1)
Validitas berhubungan dengan ketepatan interpretasi hasil tes atau
instrumen evaluasi untuk grup individual dan bukan instrumen itu sendiri.
2)
Validitas diartikan sebagai derajat yang menunjukkan kategori yang bisa
mencakup kategori yang bisa mencakup kategori rendah, menengah, dan tinggi.
3)
Prinsip suatu tes valid, tidak universal. Validitas suatu tes yang perlu
diperhatikan oleh para peneliti adalah bahwa ia hanya valid untuk suatu tujuan
saja.[4]
c.
Unsur Validitas
Ada dua unsur penting dalam validitas tes. Unsur tersebut adalah sebagai
berikut:
1)
Validitas suatu tes harus menunjukkan suatu derajat tertentu, ada yang
sempurna, ada yang sedang, dan ada pula yang rendah.
2)
Validitas selalu dihubungkan dengan suatu putusan atau tujuan spesifik.
Sebagaimana pendapat R. L Thorndike dan H. P Hagen bahwa “validiti is always
in relation to a specific decision or use”.[5]
d.
Faktor yang Mempengaruhi Validitas
Banyak faktor yang dapat mempengaruhi hasil tes evaluasi valid. Beberapa
faktor tersebut secara garis besar dapat dibedakan menurut sumbernya, yaitu
faktor internal dari tes, faktor eksternal tes, dan faktor yang berasal dari
siswa yang bersangkutan.
1)
Faktor yang berasal dari dalam tes
Beberapa sumber yang pada umumnya berasal dari faktor internal tes evaluasi
diantaranya sebagai berikut:
a)
Arahan tes yang disusun dengan makna yang jelas sehingga dapat menambah
validitas tes.
b)
Kata-kata yang dugunakan dalam struktur instrumen evaluasi harus mudah.
c)
Item-item dikonstruksikan dengan baik.
d)
Tingkat kesulitan soal harus disesuaiakan dengan materi pembelajaran yang
diterima oleh siswa.
e)
Jumlah item dan waktu evaluasi harus disesuaikan dengan pelajaran yang
diterima siswa.
2)
Faktor yang berasal dari administrasi dan skor
Faktor yang berasal dari
administrasi dan skor yang dibuat oleh guru. Berikut beberapa faktor yang
bersumber dari administrasi dan skor antara lain:
1)
Waktu mengerjakan harus sesuai dengan jumlah soal yang diberikan pada
siswa, agar siswa tidak tergesa-gesa menjawab soal tersebut.
2)
Pemberian petunjuk dari pengawas yang harus bisa dilakukan oleh semua
siswa.
3)
Teknik pemberian skor harus konsisten.
3)
Faktor-faktor yang berasal dari jawaban siswa
Seringkali terjadi bahwa interpretasi terhadap item-item tes evaluasi valid
karena dipengaruhi oleh jawaban siswa bukan instrumen evaluasi lagi. Misalnya
saja siswa senang mengikuti suatu ujian karena guru mata pelajaran mereka baik,
ramah dan mudah dimengerti ketika menerangkan, atau ketika siswa harus tampil
dalam evaluasi keterampilan suasana ketika tampil nyaman dan tenang, hal inilah
yang dapat meningkatkan kualitas validitas suatu tes.[6]
e.
Teknik Uji Validitas
validitas suatu tes evaluasi bukanlah merupakan ciri yang absolut atau
mutlak. Suatu tes evaluasi dapat mempunyai validitas yang bertingkat-tingkat
seperti tinggi, sedang, dan rendah tergantung pada tujuan yang diinginkan.
Sehubungan dengan itu ada beberapa jenis validitas yaitu:
1)
Validitas isi (content validity)
Suatu tes dikatakan memiliki validitas isi jika scope dan isi tes
itu sesuai dengan scope dan isi kurikulum yang sudah diajarkan. Isi tes
sesuai atau mewakili sampel-sampel belajar yang seharusnya dicapai menurut
tujuan kurikulum. Validitas isi juga mempunyai peran yang sangat penting untuk
tes pencapaian hasil belajar.
Validitas isi biasanya ditentukan oleh para ahli. Walaupun tidak ada
formula matematika khusus untuk menghitung dan tidak ada cara secara pasti akan
tetapi untuk memberikan gambaran bagaimana suatu tes divalidasi dengan
validitas tes para ahli memberikan beberapa opsi yaitu dengan mengamatinya
secara langsung pada tes dan item tes secara seksama sehingga diperoleh cara
perbaikan jika ada kesalahan.
Upaya lain yang dapat ditempuh dalam rangka mengetahui validitas isi dari
hasil tes belajar adalah dengan jalan menyelenggarakan iskusi panel. Dalam
forum diskusi tersebut, para pakar ayng yag dipandang memiliki keahlian yang
ada hubungannya dengan mata pelajaran yang diujikan, dimintapendapat dan
rekomendasinya terhadap isi atau materi yang terkandung dalam tes hasil belajar
yang bersangkutan. Hasil-hasil diskusi itu selanjutnya dijadikan pedoman atau
bahan acuan untuk memperbaiki dan menyempurnakan isi atau materi tes hasil
belajar tersebut.[7]
Salah satu tipe dalam penentuan kesimpulan harus dikaitkan dengan intisari
dari validitas tes. Dalam hal ini, dalam menulis suatu tes, kita ingin
mengambil kesimpulan bahwa siswa yang mendapat skor tinggi dalam tes akan
hati-hati dan lebih bertanggung jawab daripada siswa yang mendapatkan skor
rendah. Untuk mengerjakan semua itu, isi tes harus berdasarkan pada definisi
lain dari ”safe driving ability” yang dapat menggambarkan pengetahuan,
keterampilan, dan pengertian dari kehati-hatian harus diberikan komando.
Berikut ini, para pembuat tes kemampuan kognitif biasanya menghasilkan
bukti validitas dalam prosesnya jika:
Mendefinisikan secara eksplisit kemampuan yang akan diukur
Menjelaskan
secara detail tugas-tugas yang termasuk dalam tes
Menjelaskan
alasan untuk menggunakan beberapa tugas untuk mengukur kemampuan dalam suatu
pertanyaan.
Menulis dokumen yang berisikan komponen-komponen tersebut menghasilkan
suatu rasional eksplisit yang mengindikasikan apa sebenarnya yang diukur oleh
tes dan ini merupakan bukti untuk Validitas Rasional Intrinsik. Namun
permasalahanya, para pembuat tes termasuk guru, bertujuan untuk menghsilkan tes
yang mengandung validitas intrinsik, tetapi mereka jarang menyatakan secara
eksplisit tujuan tersebut. Mereka jarang memperhatikan proses pengkonstruksian
tes sebagai proses validasi tes: Jarang dokumen mereka menuliskan alasan untuk
membuat keputusan dalam pengembangan tes. Dan pada dasarnya, siapapun yang
mempersiapkan diri untuk membuat tes yang memuat validitas instrinsik harus
menunjukkan jawaban dari pertanyaan-pertanyaan berikut:Tentang apa sekumpulan keputusan
yang akan dibuat? Apa domain yang akan
diukur, apakah pengetahuan, keterampilan, atau tugas yang menunjukkan dasar
dari pengambilan keputusan? Apa kepentingan relatif
dari subdomain yang teridiri dari definisi domain? Jenis kekayaan atau isi apa yang dimiliki oleh item tes yang akan
memberikan jaminan bahwa prestasi yang diukur merupakan elemen dari domain? Apakah item tes cukup menggambarkan domain pengetahuan, keterampilan, dan
tugas? Apakah bagian dari item-item tes cukup mewakili bentuk dari kepentingan
relatif sub domainnya? Domain atau subdomain apa
yang berada di luar domain yang menarik ditunujukkan dalam tes?
Ketujuh garis besar tersebut menekankan bahwa apa yang diukur oleh tes atau
bermaksud untuk diukur. Cronbach (dalam Ebel) menganjurkan bahwa apa yang
diukur oleh tes kurang penting dibandingkan dengan apa yang seharusnya diukur.
2) Validitas Berdasarkan Kriteria
Korelasi antara skor tes dan kriteria
pengukuran menghargai beberapa jenis bukti-bukti yang baik dalam mendukung
kevalidan suatu tes yang digunakan. Ini kelihatannya memberikan suatu
kebebasan, tujuan validasi berdasarkan keputusan dan kesimpulan yang dibuat
selama pengembangan tes. Tetapi, ada sebagian kecil tes yang digunakan untuk
kemampuan kognitif telah didukung dengan kriteria yang cukup menarik sebagai
bukti validitasnya.
Dalam beberapa kasus dilapangan,
kriteria pengukuran tidak tersediaApa yang seharusnya dijadikan kriteria
pengukuran untuk kemampuan aritmatik siswa kelas lima (5) atau kemampuan untuk
memahami sebuah perkara? Tes tersebut biasanya secara langsung mengukur
kemampuan dengan maksimal apabila sudah direncanakan dengan baik. Jika
diperoleh hasil pengukuran yang lebih baik, tes bersangkutan akan tidak
diperlukan lagi.
Validitas berdasarkan Kriteria secara
umum dibedakan menjadi dua macam, diantaranya: Validitas Prediksi (predictive)
dan validitas Konkuren (concurrent). Ketika skor tes digunakan untuk
memprediksi kriteria skor di masa yang akan datang, bukti yang dihasilkan dapat
dianggap sebagai suatu prediksi. Sementara itu, validitas konkuren menunjukkan
bahwa sekumpulan tes yang diberikan ”secara konkuren” mengukur kemampuan yang
sama yang dispesifikasikan sebagai sekumpulan kriteria skor.
Validitas Prediksi
Lebih jauh Sukardi (2008:35) menyatakan
bahwa validitas prediksi sebagai derajat yang menunjukkan suatu tes dapat
memprediksi tentang bagaimana seorang akan melakukan suatu prospek tugas atau
pekerjaan yang direncanakan. Sebagai contoh, tes kemampuan Aljabar dapat
dikatakan mempunyai validitas prediksi jika hasil tes tersebut dapat menduga
anak yang mempunyai kemampuan dan anak yang tidak mempunyai kemampuan. Validitas
prediksi suatu tes pada umumnya ditentukan dengan membangun hubungan antara
skor tes dan beberapa ukuran keberhasilan dalam siituasi tertentu yang
digunakan untuk memprediksi keberhasilan, yang selanjutnya disebut sebagai
Prediktor. Sedangkan tingkah laku hendak diprediksi pada umumnya disebut
sebagai kriterion.
Ketika kriteria telah ditentukan,
prosedur selanjutnya adalah menentukan validitas prediksi suatu tes dengan cara
(Sukardi, 2008:37):
v Buat item tes sesuai dengan tujuan yang hendak dicapai
v Tentukan kelompok yang dijadikan subjek dalam pilot study
v Identifikasi kriterion prediksi yang hendak dicapai
v Tunggu sampai tingkah laku yang diprediksi atau variabel kriterion muncul
dan terpenuhi dalam kelompok yang telah ditetentukan
v Capai ukuran-ukuran kriterion tersebut
v Korelasikan dua set skor yang dihasilkan
Validitas Konkuren
Validitas konkuren adalah derajat
dimana skor dalam suatu tes dihubungkan dengan skor lain yang telah dibuat. Tes
dengan validasi konkuren biasanya diadministrasi dalam waktu yang sama atau
dengan kriteria valid yang sudah ada. Sering terjadi bahwa tes dibuat atau
dikembangkan untuk pekerjaan sama seperti beberapa tes lainnya, tetapi dengan
cara yang lebih mudah dan lebih cepat. Validitas konkuren ditentukan dengan
membangun analisis korelasi atau pembedaan. Cara-cara membuat tes dengan
validitas konkuren dapat dilakukan dengan beberapa langkah, diantaranya:
v Berikan tes yang baru dibuat pada suatu kelompok tertentu
v Catat/sediakan tes baku yang ada disertai dengan koefisin validitasnya
v Korelasikan dua skor tes tersebut.
Hasil yang diperoleh sebagai koefisien
korelasi menunjukkan derajat korelasi antar kedua tes. Jika koefisien tinggi,
berarti tes yang baru tersebut mempunyai validitas konkuren baik (valid) karena
tes baku dianggap sudah valid.
3) Validitas kostruk (construct validity)
validitas konstruk adalah validitas
yang mempermasalahkan seberapa jauh item-item tes mampu mengukur apa-apa yang
benar-benar hendak diukur sesuai dengan konsep khusus atau definisi konseptual
yang telah ditetapkan.
Validitas konstruk biasa digunakan
untuk instrumen-instrumen yang dimaksudkan mengukur variabel-variabel konsep,
baik yang sifatnya performansi tipikal seperti instrumen untuk mengukur sikap,
minat, konsep diri, lokus control, gaya kepemimpinan, motivasi berprestasi, dan
lain-lain, maupun yang sifatnya performansi maksimum seperti instrumen untuk
mengukur bakat (tes bakat), intelegensi (kecerdasan intelekual), kecerdasan
emosional dan lain-lain.
Untuk menentukan validitas konstruk
suatu instrumen harus dilakukan proses penelaahan teoritis dari suatu konsep
dari variabel yang hendak diukur, mulai dari perumusan konstruk, penentuan
dimensi dan indikator, sampai kepada penjabaran dan penulisan butir-butir item
instrumen. Perumusan konstruk harus dilakukan berdasarkan sintesis dari
teori-teori mengenai konsep variabel yang hendak diukur melalui proses analisis
dan komparasi yang logik dan cermat.
Menyimak proses telaah teoritis seperti
telah dikemukakan, maka proses validasi konstruk sebuah instrumen harus
dilakukan melalui penelaahan atau justifikasi pakar atau melalui penilaian
sekelompok panel yang terdiri dari orang-orang yang menguasai substansi atau
konten dari variabel yang hendak diukur.
Untuk menentukan adanya validitas
konstruk, suatu tes dikorelasikan dengan suatu konsepsi atau teori. Item dalam
tes tersebut harus sesuai dengan ciri-ciri yang disebutkan dalam konsepsi tadi.
Dengan kata lain, hasil-hasil tes tersebut disesuaiakan dengan tujuan atau ciri-ciri
tingkah laku yang hendak diukur.
Seperti halnya pada penganalisisan validitas isi, maka penganalisisan
validitas konstruksi dapat dilakukan dengan jalan menyelenggarakan diskusi
panel. Pengujian validitas konstruksi tes ini pun dapat dilakukan baik sesudah
maupun sebelum tes hasil belajar tersebut dilaksanakan.[8]
Thorndike,
Robert M, Christ, Tracy Thorndike, Measurement and Evaluation in Psychology and
Education
Sukardi, Evaluasi pendidikan Prinsip dan
Operasionalnya, (Jakarta: Bumi Aksara, 2009).
Hamzah B. Uno, Perencanaan Pembelajaran, (Jakarta:
Bumi Aksara, 2011.
Rochiati Wiriaatmadja, Metode Penelitian Tindakan
Kelas, (Bandung: Remaja Rosdakarya, 2008)
Zainal Arifin, Evaluasi Pembelajaran, (Bandung:
Remaja Rosdakarya, 2011).
Anas Sudijono, Pengantar Evaluasi Pendidikan (Jakarta:
Raja Grafindo Persada, 2009.
[3] Rochiati Wiriaatmadja, Metode Penelitian
Tindakan Kelas, (Bandung: Remaja Rosdakarya, 2008), 162-163.
No comments:
Post a Comment