PascaSarjana "PAI" UIN Maliki Malang
April 2014
Mulai sekitar 1980, lihat lagi bersatu validitas grdually muncul .
Kami telah menyinggung beberapa aspek konseptualisasi baru ini sudah, tetapi
sekarang kita mengeksplorasi lebih terinci. Menurut pandangan ini , uji
validitas ( atau bahkan validasi test) adalah sesuatu yang keliru karena apa
yang divalidasi adalah interpretasi skor tes dan penggunaan orang-orang untuk
tujuan tertentu diterapkan , bukan tes isself ( Cronbach , 1988; Messick ,
1989; Shepard , 1993) . Jika kita membangun tets tetapi tidak pernah mengelola
itu , validasi tidak masalah . Jika kita memberikan tes untuk agroup ujian dan
mengumpulkan beberapa skor tes tapi kemudian mengunci skor tersebut di lemari
besi , validasi masih tidak masalah . Tapi, setelah kita mengambil nilai dari
lemari besi dan menggunakannya untuk tujuan - tujuan - kita harus bertanya
tentang kelayakan nilai untuk menggunakannya. Kesimpulan membutuhkan validasi
terdiri dari dua jenis utama : tindakan ar interpretatif . Kesimpulan interpreative
adalah pernyataan dari apa tes scors berarti bahwa adalah , penafsiran kita
tentang mereka . Kesimpulan tindakan adalah klaim mengenai kesesuaian dan
utilitas skor tets sebagai dasar untuk beberapa tindakan tertentu seperti
pengambilan keputusan yang diterapkan .
Validasi tes ini kemudian dipandang sebagai proses pengumpulan
bukti dalam supprot kesimpulan ini berdasarkan skor . Validasi infrences
interpretatif cartain melibatkan menyatukan beberapa baris bukti di spport
interpretasi tertentu nilai ujian sementara , pada saat yang sama , menunjukkan
bahwa interpretasi othr kurang masuk akal . Validantion dari infrences tindakan
membutuhkan baik bukti makna nilai dan bukti kesesuaian dan kegunaan dari skor
tes untuk tujuan terapan tertentu . Tujuan dari uji validasi , oleh karena itu
, untuk membangun kasus terbaik yang mungkin kita bisa untuk kesimpulan kita
ingin membuat .
Sejauh ini, diskusi kita validasi tes telah difokuskan terutama
pada kompilasi bukti untuk mendukung kesimpulan tindakan. Messick (1989 ) telah
memperluas batas-batas validitas melampaui makna inti untuk includethe
implikasi nilai interpretasi skor dan utilitas , relevansi , dan konsekuensi
sosial yang terkait dengan penggunaan tets . Dia berargumen bahwa validasi
harus melampaui evedence terkait dengan tets skor yang berarti untuk memasukkan
konsekuensi dari nilai interprettion dan penggunaan - baik tes aktual dan
potensial .
Menetapkan berarti untuk menguji Carres skor dengan itu impications
nilai tertentu . Rata- dampak nilai-nilai arti pada berbagai tingkat - dari
konstruk label sendiri ( itu membuat diffrences apakah kita mengacu pada tes
sebagai " tets IQ , " yang merupakan istilah dimuat sosial , atau
sebagai ukuran " kemampuan kognitif umum , " yang membawa jauh lebih
sedikit makna kelebihan ) dengan teori di mana konstruk tertanam , dan ideologi
lerger yang memunculkan teori . Becuose tidak ada interpretasi adalah bebas
nilai , valueimpications makna nilai harus dimasukkan dalam setiap pembahasan
tentang validitas . Selain itu, setiap keputusan yang melibatkan nilai tes
memiliki konsekuensi , beberapa di antaranya mungkin tidak diinginkan . Menilai
apakah atau tidak ada tes melakukan apa yang ingin kita untuk melakukan -yaitu
, apakah itu berfungsi diterima dalam bukti diterapkan pengaturan - minta dari
relevansi dan kegunaan nilai tes untuk penggunaan yang diusulkan dan
pertimbangan dari kedua konsekuensi sosial dimaksudkan dan tidak disengaja
penggunaan tersebut . Setiap kali kita menggunakan nilai ujian untuk membuat
keputusan tentang orang-orang , beberapa jenis hasil dampak sosial . Kesesuaian
penggunaan tes tertentu dibenarkan mengingat semua hasil yang mungkin .
Pembenaran tersebut memerlukan dampak dari setiap consequencess sosial yang
merugikan .
Validasi Sebagai Perusahaan Ilmiah
Menurut Angoff ( 1988) , Messick (1980 , 1988, 1989 ) , dan
lain-lain , proses yang kami gunakan untuk mengumpulkan , orgenize , dan
meringkas bukti untuk mendukung kesimpulan tertentu berbasis nilai adalah ,
untuk semua intenst dan tujuan , metode ilmu . Apa separatees ilmu dari
nonsciences adalah kemauan untuk mengekspos ide-ide kita tentang sifat fenomena
yang diteliti untuk theart sanggahan . Untuk diperluas secara bahwa komunitas
pengujian mematuhi metode ilmiah , pengukuran dapat dianggap sebagai ilmu
pengetahuan dan validasi dari penyelidikan scintific . Pada tahun 1980 Messick
menyatakan bahwa validasi melibatkan " pengujian hipotesis ransum tentang
hubungan teoritis yang relevan " ( p.1015 ) . dekade kemudian ia
menyatakan bahwa berdasarkan - nilai " infrences adalah hipotesis dan
validasi infrences adalah pengujian hipotesis " ( Messick , 1989 , p . 14
) . Shadish , memasak , dan campbell ( 2002) memberikan analisis rinci tentang
hubungan antara validitas , inferensi kausal , dan pengujian hipotesis ilmiah
umumnya .
Pengujian hipotesis , pada umumnya , melibatkan membuat pernyataan
tentang sifat dari beberapa fenomena yang menarik dan kemudian cheking untuk
melihat apakah ide-ide yang sesuai cukup baik dengan enidene tersebut . Secara
optimal , prediksi spesifik yang berasal dari kerangka teori yang relevan yang
memberi makna pada prediksi sendiri , serta data terhadap yang prediksi akan
betested . Jika pengamatan tidak seperti yang diharapkan . Jika data tidak
konsisten dengan prediksi yang masuk akal dari pernyataan yang telah dibantah .
Jika hasil yang diamati adalah sebagai perkiraan , hipotesis tetap
dipertahankan dan theriad dukungan untuk anes ide-ide tentang fenomena yang
diteliti telah diperoleh . Titik penting adalah bahwa hipotesis setated
sedemikian rupa sehingga mereka Caan disanggah . Konfirmasi tidak cukup . Kita
harus mencari bukti yang bertentangan dalam rangka untuk menantang ide-ide kami
.
Langkah pertama sia-sia proses validasi , karena dengan pengujian
hipotesis lebih umum , adalah untuk menyatakan exctly apa macam infrences yang
diinginkan - yaitu , apa penafsiran dan penggunaan nilai ujian kami ingin
membuat . Langkah selanjutnya adalah menentukan jenis bukti yang kita akan
menerima sebagai garding kewajaran kesimpulan yang diinginkan . Akhirnya ,
penentuan dibuat mengenai kewajaran innferences sesired dalam terang bukti
akumulasi .
Beberapa penjelasan dapat maju untuk hampir setiap fenomena . Untuk
membenarkan infrences berbasis nilai yang diinginkan , sangat penting bahwa kita
mengeksplorasi dan mengesampingkan penjelasan keluar -bersaing . Kami
cannstrate yang tenabiliity hipotesis kami dengan berhasil mengekspos ke
karenanya sanggahan , tetapi kenyataan bahwa hipotesis kami tidak dibenarkan
tidak melakukan apapun untuk mendiskreditkan sejumlah hipotesis saingan . Oleh
karena itu , dalam herefore , selain menguji hipotesis kami langsung , kami
mendapatkan taksi bukti kuat untuk confrim masuk akal sebesar demonstating
bahwa penjelasan bersaing didukung kurang baik .
Sampai-sampai infernces berbasis nilai kita mendapatkan makna dan
impor mereka dari teori subtntive , validasi juga pengujian tehory . Jika teori
mensyaratkan bahwa hasil tertentu harus terjadi dan tidak , bukti-bukti ini
berdampak buruk pada teori , serta pada operasi pengukuran . Ada intraction
terus-menerus antara skor yang dihasilkan oleh tes dan kerangka kerja
theortical di mana tes dikembangkan . Data dan teori uji dan memodifikasi satu
sama lain . Selain itu, identifikasi dan pengujian hipotesis kontra - adalah
cara yang efisien untuk mengekspos setiap kerentanan dalam teori konstruk kami
. Sebagai pengujian hipotesis terhubungkan , dukungan dari teori melibatkan
kedua konfirmasi yhe hasil yang diharapkan dan , di samping itu, sanggahan
penjelasan saingan .
Validasi kesimpulan mengenai penggunaan skor tes sebagai dasar
untuk tindakan hampir selalu accurs dalam konteks sosial dan politik yang penuh
konflik ( dan kadang-kadang implisit ) agenda . Setiap perusahaan ilmiah yang
terjadi dalam pengaturan politik , menurut definisi , ilmu terapan . Akibatnya,
pengujian hipotesis ( dan teori ) terkait dengan penggunaan - orang infernces
tentang nilai tes relevane , utilitas , dan penyelidikan sosial dampak -
merupakan ilmiah dalam arti diterapkan .
Meskipun ilmu pengetahuan dulunya adalah salah satu pemikiran untuk
menjadi apolitis dan nilai netral , telah generlly menjadi diterima dalam
komunitas ilmiah bahwa ini bukan sekarang , tidak pernah ada, kasus tersebut .
Sebagai filsuf baru dari ilmu - serta menguji teori - telah menunjukkan, data
kami menanggung tanda teori dan teori-teori kita mencerminkan nilai-nilai kita
( Shadish et al . , 2002) . Mengingat realitas politik yang sarat nilai
penggunaan tes contemporery , tampaknya konstruktif untuk mencatat dampak
potensial positif contentiousness tersebut . Cronbach ( 1988) menunjukkan bahwa
kehadiran titik bertentangan pandang sering memaksa kita untuk artikulate dan
hati-hati mempertimbangkan nilai-nilai yang mendasari penggunaan dimaksudkan
skor tes . Messick ( 1989) ditimbang dengan pengamatan bahwa pengakuan berbagai
perspektif dapat membantu mengimbangi " preemptivencess dari ( sendiri
kami) nilai komitmen " ( hal. 87 ) . Selain itu, pengakuan dan dengan
mempertimbangkan faktor-faktor yang telah membantu membentuk posisi kami dapat
actuallty memperkuat kasus kami mencoba untuk membuat dalam mendukung inferensi
aparticular .
Validitas konstruk sebagai seluruh validitas
Menurut Messick ( 1989) , validitas konstruk mencakup semua "
bukti dan alasan-alasan yang mendukung kepercayaan dari interpretasi skor dalam
hal konsep jelas yang menjelaskan kedua hasil tes dan hubungan dengan variabel
lain ( hal.34 ) . Sebuah fitur penting dari membangun wfforts validasi adalah
bahwa ada akan beberapa mengorganisir teoritis atau konseptual kerangka kerja (
Messick " konsep jelas " ) untuk melayani sebagai panduan untuk
mencetak gol interpretasi .
Bukti untuk Mendukung contruct Validitas Inferensi Score Berbasis
Validitas tidak semua atau tidak sama sekali ; rether itu adalah
masalah derajat . Seseorang mungkin memiliki banyak bukti , atau sangat surat ,
yang dapat digunakan untuk membangun sebuah kasus untuk mendukung interpretasi
cartain atau penggunaan skor tes . Selanjutnya , jenis berbeda dari bukti dapat
dibawa untuk menanggung pada validasi kesimpulan berbasis nilai . Sebuah
argumen yang efektif untuk validitas konstruksi dari setiap inferensi berbasis
nilai harus mencakup bukti rasional dan empiris , tidak memadai sendiri .
Ketika inferensi tentang kelayakan dan kecukupan interpretasi skor atau
kegunaan dari nilai tes untuk cartain diterapkan tujuan didukung bat oleh bukti
empiris yang kuat dan alasan teoritis menarik , kesimpulan yang sama lebih
parsuasive maka bila kurang ( atau lemah ) bukti disediakan . Jika , pada saat
yang sama engkau , seseorang dapat menunjukkan bahwa hipotesis alternatif
didukung kurang baik , kasus dalam mendukung kesimpulan seseorang yang
diinginkan menjadi sangat kuat .
Justifikasi yang cukup kesimpulan membutuhkan baik reasonig dalam
terang kerangka konseptual dari fenomena yang bersangkutan dan precense data
yang relevan . Pernyataan kami harus diuji terhadap realitas. Namun, data tidak
memiliki makna kecuali ditafsirkan dalam beberapa cotext theotical mereka tidak
" Aspeak untuk diri mereka sendiri . " Selain itu, meskipun teori
perilaku yang relevan secara optimal sumber kesimpulan kami , dapat memiliki
sedikit bantalan pada validasi tersebut kesimpulan kecuali didasarkan pada yang
measement konstruksi teoritis yang bersangkutan . Proses validasi konstruk
membangun sebuah kasus yang nilai tes melakukan tap tu memang menjadi konstruk
yang mendasari yang diinginkan atau skor yang relevens dan berguna untuk
penggunaan yang diterapkan adalah boht perusahaan yang rasional dan empiris .
Validasi adalah proses yang tidak pernah eding pengumpulan dan
penilaian bukti untuk menentukan masuk akal kesimpulan skor berbasis . Karena
kita tidak pernah memiliki " semua bukti , " validasi selalu tidak
lengkap . Temuan masa depan dapat memperkuat atau undemine validitas buktinya
ada . Validasi , kemudian , dapat dianggap sebagai proses yang berkelanjutan
membuat kasus yang paling masuk akal kita bisa untuk saat ini kesimpulan
penafsiran atau actio relevan dengan buktinya yang saat ini tersedia .
Ancaman untuk Membangun Validitas
Nilai tes adalah ukuran sempurna dari konstruksi . Hal ini
disebabkan , sebagian, untuk ketidakakuratan yang resulst dari kesalahan acak
pengukuran tetapi juga karena nilai tes adalah temeasures inadequa inheren dari
konstruksi yang seharusnya keledai . Nilai tes digambarkan sebagai "
memasuki " konstruksi atau sebagai " indicatirt , tetapi tidak usully
sebagai langsung" langkah-langkah " dari thern . Pilihan sematic hati
ini mengakui keterbatasan nilai ujian sebagai contoh dari contructs .
Uji nilai gagal untuk cukup mewakili konstruksi mereka dimaksudkan
untuk mengukur dalam dua cara dasar : tes dapat meninggalkan sesuatu yang
secara teoritis harus dimasukkan , atau mereka dapat mencakup sesuatu yang
secara teoritis tidak relevan dan , karena itu, harus ditinggalkan . Ada dua
ancaman untuk membangun validasi diberi label membangun underreprensentation
dan membangun tes relevan varians , masing-masing. Membangun underreprensentation
terjadi ketika ruang lingkup toonarrow uji dan gagal untuk menyertakan penting
construcs . Membangun - relevan tes varians mengacu pada kehadiran varian
rreliable yang merupakan tambahan konstruk yang diukur . Perhatikan bahwa kedua
konsep ini mirip dengan masalah yang kita dibesarkan di bawah judul validitas
isi .
Dua jenis utama tidak relevan konstruk uji varians adalah ( 1 )
membangun - relevan tes kesulitan dan ( 2 ) membangun - relevan tes kemudahan .
Yang pertama mengacu pada kehadiran fsctors tidak berhubungan dengan konstruk
yang dinilai yang membuat tes lebih sulit bagi beberapa individu atau gruops .
Sebuah tingkat tinggi tes kecemasan , untuk isntance , telah terbukti berdampak
negatif nilai tes wheen dibandingkan witth indikator lain pengetahuan dan
keterampilan seperti makalah yang ditulis atau homework.in kasus ini , nilai
tes examiness cemas akan sah rendah relatif terhadap berdiri yang sebenarnya
mereka pada membangun. Membangun irrelevanst uji kemudahan , di sisi lain ,
terjadi ketika sesuatu tentang tes memberikan isyarat yang memungkinkan
individu untuk merespon Catain correcstly dengan cara yang tidak berhubungan
dengan konstruk . Fenomena tsetwiseness dalam pengaturan akademik yaitu ketika
keakraban dengan jenis barang , strategi manajemen waktu yang efektif ,
pengakuan petterns antara jawaban yang benar , dan sebagainya berkontribusi
terhadap peningkatan nilai tes untuk beberapa individu adalah manfaat utama
dari jenis kontaminasi skor.
Keduanya membangun Rendahnya representasi dan membangun tes
irrelevanst varians adalah sumber konstruk invalidty . Setiap merongrong
ketahanan kesimpulan iterpretative melalui keliru dari konstruk dipanggil
sebagai abesis untuk interpretasi skor. Perawatan mengambil pada saat
konstruksi tes untuk memastikan bahwa luasnya cakupan isi pada tes mathces
luasnya konstruk dapat membantu meminimalkan membangun Rendahnya representasi .
Karena lebih mudah baik untuk underrepresent membangun dan untuk memasukkan
mencemari varians tidak relevan ketika hanya menggunakan satu indikator , maka
direkomendasikan bahwa beberapa indikator masing-masing comstruct akan ontained
sebagai bagian dari upaya membangun validetion . Shadish et al . ( 2002)
mengacu pada effecst berpotensi menyesatkan menggunakan indikator tunggal sebagai
Bias operasi mono .
Hubungan Antara Sentralisasi Of Membangun Validitas Dan Tradisional
Tpes Of Validasi Bukti .
Jika validitas konstruk adalah " seluruh validitas , "
mana yang meninggalkan dua jenis tradisional lainnya bukti validasi ? Bukti
membangun apa secara tradisional telah diberi label selalu constributed dengan
validitas konstruk kesimpulan skor berbasis meskipun dalam arti sempit istilah
tapi bagaimana itu bahwa konten dan kriteria yang terkait evedence sekarang
juga dianggap bagian dari validitas konstruk ? Jawabannya terletak pada
centrlity makna nilai dalam upaya allvalidation . Validitas konstruk saat ini
dipandang sebagai aunitary , meskipun multifaset , konsep involing yang
justtification dari interpratations tertentu skor . Oleh karena itu , informasi
apakah tentang isi tes, hubungan antara nilai tes dan kriteria , atau bukti
bahwa kita telah menyadap konstruk yang mendasari kami berusaha untuk mengukur
bahwa dampak understnding kami makna nilai dapat consedered membangun bukti .
Ingat proses validasi konstruk melibatkan integrasi semua lini yang
tersedia dari bukti yang mendukung makna skor. Arti dari ukuran , ditangkap
dalam validasi konstruk , harus dipanggil kapan saja kita mencoba untuk untuk
mendukung interpretasi tertentu skor tes atau untuk justfy penggunaan skor tes
karakteristik atau perilaku sedang sampel oleh tes . Pada saat yang sama ,
membangun teori membantu kita menilai relevansi dan keterwakilan konten
pengujian terhadap kesimpulan penafsiran atau tindakan yang diinginkan .
Hubungan kriteria uji empiris antara sifat-sifat atau domain perilaku
langkah-langkah yang dianggap mencerminkan . Membangun teori menyediakan
explastion rasional untuk setiap hubungan kriteria uji diamati , yang , pada
gilirannya , membantu untuk justfy penggunaan tes . Scpres tes dan
langkah-langkah kriteria dapat dipandang sebagai indikator dari konstruk yang
mendasari untuk mendukung pernyataan bahwa skor tes atau tindakan kriteria
actukky tekan ke dalam konstruksi yang mendasari mereka mengklaim untuk
mewakili .
Saat ini masing-masing jenis bukti isi tradisi , membangun , dan
bentuk kriteria terkait dipandang sebagai " nesessary tetapi tidak cukup
" untuk pembenaran yang memadai kesimpulan skor berbasis . Bersama-sama
mereka membangun kasus yang kuat fot keabsahan ofintrepretative atau kesimpulan
tindakan .
Fitur utama dari setiap upaya validasi adalah pembenaran kesimpulan
berdasarkan skor melalui pernyataan dan pengujian hipotesis . Proses ini harus
alwys dipandu oleh jaringan pengorganisasian konstruk dan innterrelationships
mereka yang berfungsi baik sebagai sumber hipotesis dan sebagai dasar untuk
menjelaskan pengamatan . Sebuah cambination analisis rasional impiricaland
harus digunakan dalam semua pertanyaan validasi .
Selain charactritic kunci ini , beberapa issuis penting lainnya
perlu empahsized . Firt , bukti terlepas dari sumbernya yang mengandalkan pada
makna nilai tes memberikan kontribusi , baik secara positif maupun negativerly
, kepada suatu kesimpulan . Kedua , pemeriksaan menyeluruh validitas konstruk
harus mengatasi kedua struktur internal tes dan hubungan antara nilai tes dan
lainnya , variabel exsternal sebagai didikte be teori konstruksi . Akhirnya ,
complling dukungan untuk kesimpulan skor berbasis requuires baik bukti yang menguatkan
dan putusan dari hipotesis saingan yang masuk akal .
Internal dan extenal Komponen
Setiap membangun tertanam dalam teori ( atau jaringan teori ) yang
menggambarkan kami understaning kami dari minat phenomeno od . Fremework
konseptual ini mencakup suatu meodel internal facest saling berhubungan atau
dimentiions konstruk dan model eksternal deteiling hubungan antara yang
membangun dan membangun lainnya . Membangun validasi kesimpulan skor berbasis
tradisional telah memasukkan kedua componenst .
Model internal konstruk terdiri dari allelments teori yang
diperlukan untuk mendefinisikan konstruk . Ini termasuk fitur seperti
dimentionality sebuah consturct dan pengorganisasian , serta deskripsi
prosesses berpikir untuk mendasari performence pada tes memasuki konstruksi
itu. Tertentu , secara teoritis berasal membangun charactristicsthen dapat
diterjemahkan ke dalam hipotesis testble yang , dalam tuotheses yang , pada
gilirannya , terbuka untuk konfirmasi empical atau sanggahan .
Metode untuk mengevaluasi struktur internal construt ini menjadi
semakin kompleks . Komponen internal validasi konstruk melampaui kekhawatiran
psikometri tradisional tentang struktur internal interitem korelasi tes dan
sebagainya . Isu-isu konseptual seperti sesuai atau kesesuaian differenst
format item yang relatif terhadap proses yang mendasari harus diuji dibahas
dalam pengertian ini diperluas struktur internal . Isu-isu ini tidak dapat
dengan mudah diuji dengan couffitionts korelasi sederhana . Tes teori saat ini
bergantung pada model matematika canggih teori respon item sebagai cara
evaluting hubungan internal theoriticlly speciffied .
Model eksternal membangun sebuah Rincian reiationships diharapkan
dengan konstruksi lainnya . Kerangka konseptual di yang membangun sebuah tertanam
meliputi konstruksi lainnya , serta hubungan di antara mereka . Konstruksi dan
, adalah beberapa kasus , tidak adanya hubungan antara lainnya . Spesifikasi
dari model eksternal dapat dinyatakan secara resmi sebagai hipotesis yang akan
diuji . Evaluasi model eksternal aconstruct melibatkan pengumpulan kedua
konvergen dan diskriminan bukti . Skor pada tes reffecting konstruk yang
diberikan harus berkorelasi lebih tinggi dengan indikator lain dari konstruksi
yang sama daripada yang mereka lakukan dengan langkah-langkah konstruksi
differenst .
Dalam kasus validitas konstruk kesimpulan yang berkaitan dengan
menguji penggunaan , shepard ( 1993) berpendapat untuk gagasan lebih menyeluruh
dari bagian eksternal jaringan konseptual suatu konstruksi itu . Seperti yang
kita lihat ketika membahas bukti kriteria terkait , hubungan kriteria prediktor
berkontribusi untuk menguji makna dan nilai , oleh karena itu , bagian dari
validitas konstruk . Shepard pendukung termasuk dalam model eksternal tidak
hanya componenst tradisional konvergen dan diskriminan bukti untuk referensi
membangun tetapi juga konseptualisasi teoritis dari domain performence
relevanst untuk , tindakan kriteria ultiple dan hubungan di antara konstruk dan
domain performence teori yang relevan . Messick ( 1989) sepakat , menunjukkan
bahwa kita harus mampu menghubungkan prediktor dan critarion langkah-langkah
kami conseptually ( rether dari sekedar empiris ) untuk membenarkan tes ise
tertentu .
Hipotesis Rival masuk akal
Apa separaes ilmu dari non ilmu adalah kesediaan praktisi untuk
mengekspos ide-ide mereka terhadap ancaman sanggahan . Penyelidikan ilmiah
membutuhkan lebih dari bukti konfirmasi dari keinginan interpretasi seseorang.
Jika kita mencari bukti yang konsisten dengan pandangan kami , kami mungkin
akan menemukannya. Namun, pendekatan semacam itu , hanya menunjukkan bahwa
penjelasan pilihan kami konsisten dengan pengamatan yang kita, bukan bahwa itu
adalah satu-satunya atau bahkan penjelasan terbaik yang coulsd maju . untuk
menunjukkan bahwa interpretasi disukai adalah " lebih baik" dari
alternatif yang masuk akal lainnya , kita harus merancang penelitian untuk
mengevaluasi penjelasan saingan . Hal ini berlaku untuk pengujian hipotesis
secara umum dan untuk validasi konstruk pada khususnya.
Banyak penelitian validitas saat ini dalam vena ini dimulai sebagai
aresponse kekhawatiran tentang bias dalam pengujian . Ketika kelompok porform
berbeda pada atest , pertanyaan awal adalah " mengapa " ? biasanya
salah satu penjelasan pertama maju harus dilakukan dengan " keadilan
" dari performence uji dapat ditelusuri perbedaan dalam konstruk yang
mendasari atau domain performence dan tidak untuk faktor-faktor yang tes
penempatan bahasa Inggris , kita bisa memajukan sejumlah penjelasan . Awalnya
kami dapat berspekulasi bahwa , rata-rata , fameles hanya memiliki kemampuan
bahasa yang unggul ( seperti assessedby tes ) . Ketika kami mencatat bahwa tes
penempatan dalam format esai , kita mungkin menduga bahwa perempuan memiliki
adventage pada variabel seperti kemampuan menulis , kualitas komposisi ,
kerapian , atau kejelasan tulisan tangan yang accont untuk spme ( atau semua )
tersebut yang diamati perbedaan gender . Tingkat bunga faktor Masih lain
misalnya bisa bertanggung jawab . Dalam hal mengevaluasi bias, kita perlu do
menentukan apakah atau tidak alasan untuk mengamati perbedaan yang membangun
relevan atau tidak relevan . Dalam tern membangun kasus yang baik untuk
validitas konstruk skor berdasarkan kesimpulan yang diinginkan , kita perlu
diingat bahwa selalu ada penjelasan yang mungkin counter dan bahwa mereka
hipotesis saingan perlu dieksplorasi .
Teori Messick yang diperluas dari Validitas ( 1989) bab Samuel
Messick dalam edisi ketiga dari pengukuran pendidikan saat ini yang paling
auothreative , referensi keistrian ciretd pada topik validitas , meskipun (
2006) bab kane dalam edisi keempat akhirnya dapat replece itu . Bab Messick
telah melakukan teo hal utama bagi masyarakat pengukuran . Fist , jelas
estabished validitas konstruk sebagai sinfle , dapat rah dengan kemampuan
conceptalization validitas . Idenya adalah bukan hal baru , bahkan, sebagai
shepard ( 1993) menunjukkan , bangsa telah Advenced dekade sebelumnya , tapi
bab Messick secara resmi cadified konsensus yang berkembang di masyarakat
maisuretment . Kontribusi besar The scond kerja Messick adalah bahwa memperluas
konsep validitas luar isu makna skor untuk menyertakan bukti relevansi dan
kegunaan nilai ujian , serta pertimbangan konsekuensi dari tes interpretion dan
penggunaan . Wheli yang analtsis rasional atau empiris konsekuensi sebagai
bagian dari validitas konstruk belum untuk dipeluk sepenuh hati oleh seluruh
anggota masyarakat pengujian , itu masih merupakan tonggak utama dalam
evalution teori validitas . Model Messick merupakan unifiied , namun multi-
faceted , konseptualisasi valiidity .
Messick (1989 ) mempresentasikan kerangka validitas dalam sebuah
tabel showm empat kali lipat dalam tabel 5-7 ( Tabel 2-1 dalam teks aslinya ) .
Kerangka validitas bersatu ..... dapat dibangun dengan
distingushing dua aspek yang saling berhubungan dari konsep validitas kesatuan
, satu segi adalah sumber pembenaran pengujian , yang didasarkan pada apprasial
baik bukti konsekuensi . Pada aspek lain adalah fungsi atau hasil pengujian ,
yang baik interpratation atau digunakan. Jika aspek untuk sumber pembenaran (
yaitu, baik sebagai evidentialbesis atau secara konsekuensial ) disilangkan
dengan segi funtion atau hasil ( yaitu, baik interpretasi tes atau penggunaan
test) , kita memperoleh klasifikasi empat kali lipat seperti pada tabel 2-1 (
Messick itu , 1980) .
Sebagaimana ditunjukkan dalam tabel 2-1 , dasar bukti uji
interpretationn adalah membangun validity.the dasar bukti dari est digunakan
juga validitas konstruk , tetapi sebagai ditopang oleh bukti fot relevansi tes
untuk tujuan tertentu dan diterapkan untuk kegunaan tes dalam thesetting .
Dasar konsekuensial interpretasi tes adalah apprasial dari nilai implikasi dari
label konstruk , teori interpretasi tes yang mendasari , dan implikasi teoritis
dan implikasi nilai interpretasi uji di yang sepadan , karena dasar nilai
penggunaan tes penilaian yang kedua konsekuensi sosial potetial dan aktual
pengujian diterapkan . ( hal. 20 )
tabel 5-7
Aspek Validitas
Uji Interpretasi Uji penggunaan
Bukti Dasar Membangun validitas Membangun validitas + relevansi
utilitas
Implikasi konsekuensial Dasar Nilai konsekuensi Sosial Kami telah
membahas , masalah mendasar yang berkaitan dengan dasar bukti dari interpretasi
uji dan penggunaan tes, berlabel " validitas konstruk " dan "
validitas konstruk + relefanceutility " pada tabel 5-7 . Sekarang kita
beralih ke pikiran Messick atas dasar konsekuensi dari interpretasi tes
penggunaan tes : implikasi nilai dan konsekuensi sosial , masing-masing.
Dasar konsekuensial Tes Interpretasi : Implikasi Nilai
Tidak ada lagi dabate tentang apakah nilai-nilai harus terlibat
dalam ilmu mereka clerly berada. Penilaian ilmiah adalah pertimbangan nilai .
Sebagai contoh, daripada mengandalkan pada orientasi ketat empiris untuk
validasi yang mendominasi sebelum tahun 1950-an , sekarang kita memanggil
konstruksi sebagai dasar untuk menguji hipotesis kami . Melakukan hal itu
adalah pilihan berdasarkan apa yang saat ini dianggap berharga dan penting .
Selain itu , yang kita gunakan pengujian hipotesis sama sekali adalah , itu
sendiri , pilihan. Sothe pertanyaan tidak jika nilai-nilai harus memiliki peran
dalam ilmu pengetahuan , tapi bagaimana kita bisa mengambil nilai-nilai ke
rekening perusahaan ilmiah .
( 1989) dimasukkannya Messick tentang konsekuensi dari nilai onterpretation
dalam konseptualisasi tentang validitas mensyaratkan bahwa , sebagai bagian
dari upaya validasi kami, kami secara eksplisit berurusan dengan implikasi
nilai yang terkait dengan konstruk kita memanggil . Dia berpendapat bahwa nilai
yang intrensic pertimbangan validitas karena mereka mempengaruhi skor yang
berarti melalui interpretstion konstruk skor tes . Interpratation dari setiap
peristiwa atau perilaku melibatkan metching ke beberapa skema besar untuk yang
nilainya sudah attached.any aktivitas tertentu atau perilaku dipandang sebagai
contoh dari kategori yang lebih luas mana ia berasal dan dengan demikian
diliputi dengan nilai yang terkait dengan kategorisasi tersebut. Masing-masing
categois yang lebih luas , pada gilirannya , subclass dari beberapa bahkan
lebih umum konseptualisasi dengan lapisan lain nilai ditempelkan . Dalam
konteks validasi , nilai diperkirakan berdampak makna skor pada tiga tingkatan
: melalui ( 1 ) label yang kita berikan kepada konstruksi , ( 2 ) teori-teori
yang memberikan konstruksi maknanya , dan ( 3 ) ideologi tercermin dalam
teori-teori .
Dalam hal asumsi nilai yang terkait dengan label membangun ,
mempertimbangkan perbedaan dalam arti penafsiran skor jika dan poinst pada
skala disebut " fleksibilitas terhadap kekakuan " sebagai lawan dari
" kebingungan terhadap konsistensi " ( Messick , 1989) . Apa asumsi
nilai mendasari label " krisis personal " ? Apa consept itu dilabel
ulang " kesempatan untuk pertumbuhan pribadi " ? Jika kita menganggap
sesuatu menjadi hal yang " baik" atau "buruk " , bahwa
nilai konotasi sering menemukan jalan ke label membangun dan mengarahkan skor
interpretasi dalam arah yang konsisten dan dengan asumsi kita . "
Atau" buruk " hal, bahwa nilai konotasi sering menemukan jalan ke
label membangun dan mengarahkan skor interpretasi dalam arah yang konsisten dan
dengan kebutuhan assumption.we kami berhati-hati bahwa membangun label
accuratly mencerminkan seluruh rentang nilai konotasi tersirat oleh
konseptualisasi teoritis konstruk dan referenst empiris .
Sebuah rheory adalah kategori brosder daripada membangun dan
memiliki asumsi nilai tersendiri ans terpasang . Sebuah keuntungan membangun
makna dari tempatnya witha membangun keuntungan yang berarti dari tempatnya
dalam boader kerangka teoritis . Kami migt menemukan, oleh karena itu,
differenst interpretasi skor yang sama tergantung pada perspektif teoritis
melalui mana konstruk dan indikator yang sedang efek viewed.this dapat paling
mudah dilihat dalam kasus teori yang bersaing dari fenomena yang sama . Pertimbangkan
interpratations diffrenst skor tes bakat yang sama jika , dari perspektif
teoritis ane , konstruk mengetuk bt tes dipandang sebagai relatif tetap ,
tetapi , dalam terang teori lain , konstruk dipandang sebagai jauh bisa
ditingkatkan melalui usaha . Mengingat perspektif pertama, ujian ini nilai wold
diartikan sebagai iindicative dari suatu sifat yang berada di luar kendali
individuak itu . Dari masing-masing kedua, bagaimanapun , nilai peserta ujian
dianggap sebagai indikator dari konstruk yang ditempa , dan individu mungkin bi
diselenggarakan secara pribadi bertanggung jawab ( setidaknya sebagian ) untuk
posisi mereka saat ini atau perbaikan ay yang mungkin terjadi . Tidak perlu
banyak peregangan untuk melihat bahwa perbedaan tersebut dalam penafsiran dapat
memiliki efek dramatis pada pembenaran berbagai penggunaan tes dalam pengaturan
sebagai diterapkan .
Akhirnya , implikasi nilai sourceof ketiga utama adalah edology di
mana teori yang embbedded .
No comments:
Post a Comment