Tuesday, April 1, 2014

THE VIEW OF UNIFIED VALIDITAS


PascaSarjana "PAI" UIN Maliki Malang
April 2014


Mulai sekitar 1980, lihat lagi bersatu validitas grdually muncul . Kami telah menyinggung beberapa aspek konseptualisasi baru ini sudah, tetapi sekarang kita mengeksplorasi lebih terinci. Menurut pandangan ini , uji validitas ( atau bahkan validasi test) adalah sesuatu yang keliru karena apa yang divalidasi adalah interpretasi skor tes dan penggunaan orang-orang untuk tujuan tertentu diterapkan , bukan tes isself ( Cronbach , 1988; Messick , 1989; Shepard , 1993) . Jika kita membangun tets tetapi tidak pernah mengelola itu , validasi tidak masalah . Jika kita memberikan tes untuk agroup ujian dan mengumpulkan beberapa skor tes tapi kemudian mengunci skor tersebut di lemari besi , validasi masih tidak masalah . Tapi, setelah kita mengambil nilai dari lemari besi dan menggunakannya untuk tujuan - tujuan - kita harus bertanya tentang kelayakan nilai untuk menggunakannya. Kesimpulan membutuhkan validasi terdiri dari dua jenis utama : tindakan ar interpretatif . Kesimpulan interpreative adalah pernyataan dari apa tes scors berarti bahwa adalah , penafsiran kita tentang mereka . Kesimpulan tindakan adalah klaim mengenai kesesuaian dan utilitas skor tets sebagai dasar untuk beberapa tindakan tertentu seperti pengambilan keputusan yang diterapkan .
Validasi tes ini kemudian dipandang sebagai proses pengumpulan bukti dalam supprot kesimpulan ini berdasarkan skor . Validasi infrences interpretatif cartain melibatkan menyatukan beberapa baris bukti di spport interpretasi tertentu nilai ujian sementara , pada saat yang sama , menunjukkan bahwa interpretasi othr kurang masuk akal . Validantion dari infrences tindakan membutuhkan baik bukti makna nilai dan bukti kesesuaian dan kegunaan dari skor tes untuk tujuan terapan tertentu . Tujuan dari uji validasi , oleh karena itu , untuk membangun kasus terbaik yang mungkin kita bisa untuk kesimpulan kita ingin membuat .
Sejauh ini, diskusi kita validasi tes telah difokuskan terutama pada kompilasi bukti untuk mendukung kesimpulan tindakan. Messick (1989 ) telah memperluas batas-batas validitas melampaui makna inti untuk includethe implikasi nilai interpretasi skor dan utilitas , relevansi , dan konsekuensi sosial yang terkait dengan penggunaan tets . Dia berargumen bahwa validasi harus melampaui evedence terkait dengan tets skor yang berarti untuk memasukkan konsekuensi dari nilai interprettion dan penggunaan - baik tes aktual dan potensial .
Menetapkan berarti untuk menguji Carres skor dengan itu impications nilai tertentu . Rata- dampak nilai-nilai arti pada berbagai tingkat - dari konstruk label sendiri ( itu membuat diffrences apakah kita mengacu pada tes sebagai " tets IQ , " yang merupakan istilah dimuat sosial , atau sebagai ukuran " kemampuan kognitif umum , " yang membawa jauh lebih sedikit makna kelebihan ) dengan teori di mana konstruk tertanam , dan ideologi lerger yang memunculkan teori . Becuose tidak ada interpretasi adalah bebas nilai , valueimpications makna nilai harus dimasukkan dalam setiap pembahasan tentang validitas . Selain itu, setiap keputusan yang melibatkan nilai tes memiliki konsekuensi , beberapa di antaranya mungkin tidak diinginkan . Menilai apakah atau tidak ada tes melakukan apa yang ingin kita untuk melakukan -yaitu , apakah itu berfungsi diterima dalam bukti diterapkan pengaturan - minta dari relevansi dan kegunaan nilai tes untuk penggunaan yang diusulkan dan pertimbangan dari kedua konsekuensi sosial dimaksudkan dan tidak disengaja penggunaan tersebut . Setiap kali kita menggunakan nilai ujian untuk membuat keputusan tentang orang-orang , beberapa jenis hasil dampak sosial . Kesesuaian penggunaan tes tertentu dibenarkan mengingat semua hasil yang mungkin . Pembenaran tersebut memerlukan dampak dari setiap consequencess sosial yang merugikan .
Validasi Sebagai Perusahaan Ilmiah
Menurut Angoff ( 1988) , Messick (1980 , 1988, 1989 ) , dan lain-lain , proses yang kami gunakan untuk mengumpulkan , orgenize , dan meringkas bukti untuk mendukung kesimpulan tertentu berbasis nilai adalah , untuk semua intenst dan tujuan , metode ilmu . Apa separatees ilmu dari nonsciences adalah kemauan untuk mengekspos ide-ide kita tentang sifat fenomena yang diteliti untuk theart sanggahan . Untuk diperluas secara bahwa komunitas pengujian mematuhi metode ilmiah , pengukuran dapat dianggap sebagai ilmu pengetahuan dan validasi dari penyelidikan scintific . Pada tahun 1980 Messick menyatakan bahwa validasi melibatkan " pengujian hipotesis ransum tentang hubungan teoritis yang relevan " ( p.1015 ) . dekade kemudian ia menyatakan bahwa berdasarkan - nilai " infrences adalah hipotesis dan validasi infrences adalah pengujian hipotesis " ( Messick , 1989 , p . 14 ) . Shadish , memasak , dan campbell ( 2002) memberikan analisis rinci tentang hubungan antara validitas , inferensi kausal , dan pengujian hipotesis ilmiah umumnya .
Pengujian hipotesis , pada umumnya , melibatkan membuat pernyataan tentang sifat dari beberapa fenomena yang menarik dan kemudian cheking untuk melihat apakah ide-ide yang sesuai cukup baik dengan enidene tersebut . Secara optimal , prediksi spesifik yang berasal dari kerangka teori yang relevan yang memberi makna pada prediksi sendiri , serta data terhadap yang prediksi akan betested . Jika pengamatan tidak seperti yang diharapkan . Jika data tidak konsisten dengan prediksi yang masuk akal dari pernyataan yang telah dibantah . Jika hasil yang diamati adalah sebagai perkiraan , hipotesis tetap dipertahankan dan theriad dukungan untuk anes ide-ide tentang fenomena yang diteliti telah diperoleh . Titik penting adalah bahwa hipotesis setated sedemikian rupa sehingga mereka Caan disanggah . Konfirmasi tidak cukup . Kita harus mencari bukti yang bertentangan dalam rangka untuk menantang ide-ide kami .
Langkah pertama sia-sia proses validasi , karena dengan pengujian hipotesis lebih umum , adalah untuk menyatakan exctly apa macam infrences yang diinginkan - yaitu , apa penafsiran dan penggunaan nilai ujian kami ingin membuat . Langkah selanjutnya adalah menentukan jenis bukti yang kita akan menerima sebagai garding kewajaran kesimpulan yang diinginkan . Akhirnya , penentuan dibuat mengenai kewajaran innferences sesired dalam terang bukti akumulasi .
Beberapa penjelasan dapat maju untuk hampir setiap fenomena . Untuk membenarkan infrences berbasis nilai yang diinginkan , sangat penting bahwa kita mengeksplorasi dan mengesampingkan penjelasan keluar -bersaing . Kami cannstrate yang tenabiliity hipotesis kami dengan berhasil mengekspos ke karenanya sanggahan , tetapi kenyataan bahwa hipotesis kami tidak dibenarkan tidak melakukan apapun untuk mendiskreditkan sejumlah hipotesis saingan . Oleh karena itu , dalam herefore , selain menguji hipotesis kami langsung , kami mendapatkan taksi bukti kuat untuk confrim masuk akal sebesar demonstating bahwa penjelasan bersaing didukung kurang baik .
Sampai-sampai infernces berbasis nilai kita mendapatkan makna dan impor mereka dari teori subtntive , validasi juga pengujian tehory . Jika teori mensyaratkan bahwa hasil tertentu harus terjadi dan tidak , bukti-bukti ini berdampak buruk pada teori , serta pada operasi pengukuran . Ada intraction terus-menerus antara skor yang dihasilkan oleh tes dan kerangka kerja theortical di mana tes dikembangkan . Data dan teori uji dan memodifikasi satu sama lain . Selain itu, identifikasi dan pengujian hipotesis kontra - adalah cara yang efisien untuk mengekspos setiap kerentanan dalam teori konstruk kami . Sebagai pengujian hipotesis terhubungkan , dukungan dari teori melibatkan kedua konfirmasi yhe hasil yang diharapkan dan , di samping itu, sanggahan penjelasan saingan .
Validasi kesimpulan mengenai penggunaan skor tes sebagai dasar untuk tindakan hampir selalu accurs dalam konteks sosial dan politik yang penuh konflik ( dan kadang-kadang implisit ) agenda . Setiap perusahaan ilmiah yang terjadi dalam pengaturan politik , menurut definisi , ilmu terapan . Akibatnya, pengujian hipotesis ( dan teori ) terkait dengan penggunaan - orang infernces tentang nilai tes relevane , utilitas , dan penyelidikan sosial dampak - merupakan ilmiah dalam arti diterapkan .
Meskipun ilmu pengetahuan dulunya adalah salah satu pemikiran untuk menjadi apolitis dan nilai netral , telah generlly menjadi diterima dalam komunitas ilmiah bahwa ini bukan sekarang , tidak pernah ada, kasus tersebut . Sebagai filsuf baru dari ilmu - serta menguji teori - telah menunjukkan, data kami menanggung tanda teori dan teori-teori kita mencerminkan nilai-nilai kita ( Shadish et al . , 2002) . Mengingat realitas politik yang sarat nilai penggunaan tes contemporery , tampaknya konstruktif untuk mencatat dampak potensial positif contentiousness tersebut . Cronbach ( 1988) menunjukkan bahwa kehadiran titik bertentangan pandang sering memaksa kita untuk artikulate dan hati-hati mempertimbangkan nilai-nilai yang mendasari penggunaan dimaksudkan skor tes . Messick ( 1989) ditimbang dengan pengamatan bahwa pengakuan berbagai perspektif dapat membantu mengimbangi " preemptivencess dari ( sendiri kami) nilai komitmen " ( hal. 87 ) . Selain itu, pengakuan dan dengan mempertimbangkan faktor-faktor yang telah membantu membentuk posisi kami dapat actuallty memperkuat kasus kami mencoba untuk membuat dalam mendukung inferensi aparticular .
Validitas konstruk sebagai seluruh validitas
Menurut Messick ( 1989) , validitas konstruk mencakup semua " bukti dan alasan-alasan yang mendukung kepercayaan dari interpretasi skor dalam hal konsep jelas yang menjelaskan kedua hasil tes dan hubungan dengan variabel lain ( hal.34 ) . Sebuah fitur penting dari membangun wfforts validasi adalah bahwa ada akan beberapa mengorganisir teoritis atau konseptual kerangka kerja ( Messick " konsep jelas " ) untuk melayani sebagai panduan untuk mencetak gol interpretasi .
Bukti untuk Mendukung contruct Validitas Inferensi Score Berbasis
Validitas tidak semua atau tidak sama sekali ; rether itu adalah masalah derajat . Seseorang mungkin memiliki banyak bukti , atau sangat surat , yang dapat digunakan untuk membangun sebuah kasus untuk mendukung interpretasi cartain atau penggunaan skor tes . Selanjutnya , jenis berbeda dari bukti dapat dibawa untuk menanggung pada validasi kesimpulan berbasis nilai . Sebuah argumen yang efektif untuk validitas konstruksi dari setiap inferensi berbasis nilai harus mencakup bukti rasional dan empiris , tidak memadai sendiri . Ketika inferensi tentang kelayakan dan kecukupan interpretasi skor atau kegunaan dari nilai tes untuk cartain diterapkan tujuan didukung bat oleh bukti empiris yang kuat dan alasan teoritis menarik , kesimpulan yang sama lebih parsuasive maka bila kurang ( atau lemah ) bukti disediakan . Jika , pada saat yang sama engkau , seseorang dapat menunjukkan bahwa hipotesis alternatif didukung kurang baik , kasus dalam mendukung kesimpulan seseorang yang diinginkan menjadi sangat kuat .
Justifikasi yang cukup kesimpulan membutuhkan baik reasonig dalam terang kerangka konseptual dari fenomena yang bersangkutan dan precense data yang relevan . Pernyataan kami harus diuji terhadap realitas. Namun, data tidak memiliki makna kecuali ditafsirkan dalam beberapa cotext theotical mereka tidak " Aspeak untuk diri mereka sendiri . " Selain itu, meskipun teori perilaku yang relevan secara optimal sumber kesimpulan kami , dapat memiliki sedikit bantalan pada validasi tersebut kesimpulan kecuali didasarkan pada yang measement konstruksi teoritis yang bersangkutan . Proses validasi konstruk membangun sebuah kasus yang nilai tes melakukan tap tu memang menjadi konstruk yang mendasari yang diinginkan atau skor yang relevens dan berguna untuk penggunaan yang diterapkan adalah boht perusahaan yang rasional dan empiris .
Validasi adalah proses yang tidak pernah eding pengumpulan dan penilaian bukti untuk menentukan masuk akal kesimpulan skor berbasis . Karena kita tidak pernah memiliki " semua bukti , " validasi selalu tidak lengkap . Temuan masa depan dapat memperkuat atau undemine validitas buktinya ada . Validasi , kemudian , dapat dianggap sebagai proses yang berkelanjutan membuat kasus yang paling masuk akal kita bisa untuk saat ini kesimpulan penafsiran atau actio relevan dengan buktinya yang saat ini tersedia .
Ancaman untuk Membangun Validitas
Nilai tes adalah ukuran sempurna dari konstruksi . Hal ini disebabkan , sebagian, untuk ketidakakuratan yang resulst dari kesalahan acak pengukuran tetapi juga karena nilai tes adalah temeasures inadequa inheren dari konstruksi yang seharusnya keledai . Nilai tes digambarkan sebagai " memasuki " konstruksi atau sebagai " indicatirt , tetapi tidak usully sebagai langsung" langkah-langkah " dari thern . Pilihan sematic hati ini mengakui keterbatasan nilai ujian sebagai contoh dari contructs .
Uji nilai gagal untuk cukup mewakili konstruksi mereka dimaksudkan untuk mengukur dalam dua cara dasar : tes dapat meninggalkan sesuatu yang secara teoritis harus dimasukkan , atau mereka dapat mencakup sesuatu yang secara teoritis tidak relevan dan , karena itu, harus ditinggalkan . Ada dua ancaman untuk membangun validasi diberi label membangun underreprensentation dan membangun tes relevan varians , masing-masing. Membangun underreprensentation terjadi ketika ruang lingkup toonarrow uji dan gagal untuk menyertakan penting construcs . Membangun - relevan tes varians mengacu pada kehadiran varian rreliable yang merupakan tambahan konstruk yang diukur . Perhatikan bahwa kedua konsep ini mirip dengan masalah yang kita dibesarkan di bawah judul validitas isi .
Dua jenis utama tidak relevan konstruk uji varians adalah ( 1 ) membangun - relevan tes kesulitan dan ( 2 ) membangun - relevan tes kemudahan . Yang pertama mengacu pada kehadiran fsctors tidak berhubungan dengan konstruk yang dinilai yang membuat tes lebih sulit bagi beberapa individu atau gruops . Sebuah tingkat tinggi tes kecemasan , untuk isntance , telah terbukti berdampak negatif nilai tes wheen dibandingkan witth indikator lain pengetahuan dan keterampilan seperti makalah yang ditulis atau homework.in kasus ini , nilai tes examiness cemas akan sah rendah relatif terhadap berdiri yang sebenarnya mereka pada membangun. Membangun irrelevanst uji kemudahan , di sisi lain , terjadi ketika sesuatu tentang tes memberikan isyarat yang memungkinkan individu untuk merespon Catain correcstly dengan cara yang tidak berhubungan dengan konstruk . Fenomena tsetwiseness dalam pengaturan akademik yaitu ketika keakraban dengan jenis barang , strategi manajemen waktu yang efektif , pengakuan petterns antara jawaban yang benar , dan sebagainya berkontribusi terhadap peningkatan nilai tes untuk beberapa individu adalah manfaat utama dari jenis kontaminasi skor.
Keduanya membangun Rendahnya representasi dan membangun tes irrelevanst varians adalah sumber konstruk invalidty . Setiap merongrong ketahanan kesimpulan iterpretative melalui keliru dari konstruk dipanggil sebagai abesis untuk interpretasi skor. Perawatan mengambil pada saat konstruksi tes untuk memastikan bahwa luasnya cakupan isi pada tes mathces luasnya konstruk dapat membantu meminimalkan membangun Rendahnya representasi . Karena lebih mudah baik untuk underrepresent membangun dan untuk memasukkan mencemari varians tidak relevan ketika hanya menggunakan satu indikator , maka direkomendasikan bahwa beberapa indikator masing-masing comstruct akan ontained sebagai bagian dari upaya membangun validetion . Shadish et al . ( 2002) mengacu pada effecst berpotensi menyesatkan menggunakan indikator tunggal sebagai Bias operasi mono .
Hubungan Antara Sentralisasi Of Membangun Validitas Dan Tradisional Tpes Of Validasi Bukti .
Jika validitas konstruk adalah " seluruh validitas , " mana yang meninggalkan dua jenis tradisional lainnya bukti validasi ? Bukti membangun apa secara tradisional telah diberi label selalu constributed dengan validitas konstruk kesimpulan skor berbasis meskipun dalam arti sempit istilah tapi bagaimana itu bahwa konten dan kriteria yang terkait evedence sekarang juga dianggap bagian dari validitas konstruk ? Jawabannya terletak pada centrlity makna nilai dalam upaya allvalidation . Validitas konstruk saat ini dipandang sebagai aunitary , meskipun multifaset , konsep involing yang justtification dari interpratations tertentu skor . Oleh karena itu , informasi apakah tentang isi tes, hubungan antara nilai tes dan kriteria , atau bukti bahwa kita telah menyadap konstruk yang mendasari kami berusaha untuk mengukur bahwa dampak understnding kami makna nilai dapat consedered membangun bukti .
Ingat proses validasi konstruk melibatkan integrasi semua lini yang tersedia dari bukti yang mendukung makna skor. Arti dari ukuran , ditangkap dalam validasi konstruk , harus dipanggil kapan saja kita mencoba untuk untuk mendukung interpretasi tertentu skor tes atau untuk justfy penggunaan skor tes karakteristik atau perilaku sedang sampel oleh tes . Pada saat yang sama , membangun teori membantu kita menilai relevansi dan keterwakilan konten pengujian terhadap kesimpulan penafsiran atau tindakan yang diinginkan . Hubungan kriteria uji empiris antara sifat-sifat atau domain perilaku langkah-langkah yang dianggap mencerminkan . Membangun teori menyediakan explastion rasional untuk setiap hubungan kriteria uji diamati , yang , pada gilirannya , membantu untuk justfy penggunaan tes . Scpres tes dan langkah-langkah kriteria dapat dipandang sebagai indikator dari konstruk yang mendasari untuk mendukung pernyataan bahwa skor tes atau tindakan kriteria actukky tekan ke dalam konstruksi yang mendasari mereka mengklaim untuk mewakili .
Saat ini masing-masing jenis bukti isi tradisi , membangun , dan bentuk kriteria terkait dipandang sebagai " nesessary tetapi tidak cukup " untuk pembenaran yang memadai kesimpulan skor berbasis . Bersama-sama mereka membangun kasus yang kuat fot keabsahan ofintrepretative atau kesimpulan tindakan .
Fitur utama dari setiap upaya validasi adalah pembenaran kesimpulan berdasarkan skor melalui pernyataan dan pengujian hipotesis . Proses ini harus alwys dipandu oleh jaringan pengorganisasian konstruk dan innterrelationships mereka yang berfungsi baik sebagai sumber hipotesis dan sebagai dasar untuk menjelaskan pengamatan . Sebuah cambination analisis rasional impiricaland harus digunakan dalam semua pertanyaan validasi .
Selain charactritic kunci ini , beberapa issuis penting lainnya perlu empahsized . Firt , bukti terlepas dari sumbernya yang mengandalkan pada makna nilai tes memberikan kontribusi , baik secara positif maupun negativerly , kepada suatu kesimpulan . Kedua , pemeriksaan menyeluruh validitas konstruk harus mengatasi kedua struktur internal tes dan hubungan antara nilai tes dan lainnya , variabel exsternal sebagai didikte be teori konstruksi . Akhirnya , complling dukungan untuk kesimpulan skor berbasis requuires baik bukti yang menguatkan dan putusan dari hipotesis saingan yang masuk akal .
Internal dan extenal Komponen
Setiap membangun tertanam dalam teori ( atau jaringan teori ) yang menggambarkan kami understaning kami dari minat phenomeno od . Fremework konseptual ini mencakup suatu meodel internal facest saling berhubungan atau dimentiions konstruk dan model eksternal deteiling hubungan antara yang membangun dan membangun lainnya . Membangun validasi kesimpulan skor berbasis tradisional telah memasukkan kedua componenst .
Model internal konstruk terdiri dari allelments teori yang diperlukan untuk mendefinisikan konstruk . Ini termasuk fitur seperti dimentionality sebuah consturct dan pengorganisasian , serta deskripsi prosesses berpikir untuk mendasari performence pada tes memasuki konstruksi itu. Tertentu , secara teoritis berasal membangun charactristicsthen dapat diterjemahkan ke dalam hipotesis testble yang , dalam tuotheses yang , pada gilirannya , terbuka untuk konfirmasi empical atau sanggahan .
Metode untuk mengevaluasi struktur internal construt ini menjadi semakin kompleks . Komponen internal validasi konstruk melampaui kekhawatiran psikometri tradisional tentang struktur internal interitem korelasi tes dan sebagainya . Isu-isu konseptual seperti sesuai atau kesesuaian differenst format item yang relatif terhadap proses yang mendasari harus diuji dibahas dalam pengertian ini diperluas struktur internal . Isu-isu ini tidak dapat dengan mudah diuji dengan couffitionts korelasi sederhana . Tes teori saat ini bergantung pada model matematika canggih teori respon item sebagai cara evaluting hubungan internal theoriticlly speciffied .
Model eksternal membangun sebuah Rincian reiationships diharapkan dengan konstruksi lainnya . Kerangka konseptual di yang membangun sebuah tertanam meliputi konstruksi lainnya , serta hubungan di antara mereka . Konstruksi dan , adalah beberapa kasus , tidak adanya hubungan antara lainnya . Spesifikasi dari model eksternal dapat dinyatakan secara resmi sebagai hipotesis yang akan diuji . Evaluasi model eksternal aconstruct melibatkan pengumpulan kedua konvergen dan diskriminan bukti . Skor pada tes reffecting konstruk yang diberikan harus berkorelasi lebih tinggi dengan indikator lain dari konstruksi yang sama daripada yang mereka lakukan dengan langkah-langkah konstruksi differenst .
Dalam kasus validitas konstruk kesimpulan yang berkaitan dengan menguji penggunaan , shepard ( 1993) berpendapat untuk gagasan lebih menyeluruh dari bagian eksternal jaringan konseptual suatu konstruksi itu . Seperti yang kita lihat ketika membahas bukti kriteria terkait , hubungan kriteria prediktor berkontribusi untuk menguji makna dan nilai , oleh karena itu , bagian dari validitas konstruk . Shepard pendukung termasuk dalam model eksternal tidak hanya componenst tradisional konvergen dan diskriminan bukti untuk referensi membangun tetapi juga konseptualisasi teoritis dari domain performence relevanst untuk , tindakan kriteria ultiple dan hubungan di antara konstruk dan domain performence teori yang relevan . Messick ( 1989) sepakat , menunjukkan bahwa kita harus mampu menghubungkan prediktor dan critarion langkah-langkah kami conseptually ( rether dari sekedar empiris ) untuk membenarkan tes ise tertentu .
Hipotesis Rival masuk akal
Apa separaes ilmu dari non ilmu adalah kesediaan praktisi untuk mengekspos ide-ide mereka terhadap ancaman sanggahan . Penyelidikan ilmiah membutuhkan lebih dari bukti konfirmasi dari keinginan interpretasi seseorang. Jika kita mencari bukti yang konsisten dengan pandangan kami , kami mungkin akan menemukannya. Namun, pendekatan semacam itu , hanya menunjukkan bahwa penjelasan pilihan kami konsisten dengan pengamatan yang kita, bukan bahwa itu adalah satu-satunya atau bahkan penjelasan terbaik yang coulsd maju . untuk menunjukkan bahwa interpretasi disukai adalah " lebih baik" dari alternatif yang masuk akal lainnya , kita harus merancang penelitian untuk mengevaluasi penjelasan saingan . Hal ini berlaku untuk pengujian hipotesis secara umum dan untuk validasi konstruk pada khususnya.
Banyak penelitian validitas saat ini dalam vena ini dimulai sebagai aresponse kekhawatiran tentang bias dalam pengujian . Ketika kelompok porform berbeda pada atest , pertanyaan awal adalah " mengapa " ? biasanya salah satu penjelasan pertama maju harus dilakukan dengan " keadilan " dari performence uji dapat ditelusuri perbedaan dalam konstruk yang mendasari atau domain performence dan tidak untuk faktor-faktor yang tes penempatan bahasa Inggris , kita bisa memajukan sejumlah penjelasan . Awalnya kami dapat berspekulasi bahwa , rata-rata , fameles hanya memiliki kemampuan bahasa yang unggul ( seperti assessedby tes ) . Ketika kami mencatat bahwa tes penempatan dalam format esai , kita mungkin menduga bahwa perempuan memiliki adventage pada variabel seperti kemampuan menulis , kualitas komposisi , kerapian , atau kejelasan tulisan tangan yang accont untuk spme ( atau semua ) tersebut yang diamati perbedaan gender . Tingkat bunga faktor Masih lain misalnya bisa bertanggung jawab . Dalam hal mengevaluasi bias, kita perlu do menentukan apakah atau tidak alasan untuk mengamati perbedaan yang membangun relevan atau tidak relevan . Dalam tern membangun kasus yang baik untuk validitas konstruk skor berdasarkan kesimpulan yang diinginkan , kita perlu diingat bahwa selalu ada penjelasan yang mungkin counter dan bahwa mereka hipotesis saingan perlu dieksplorasi .
Teori Messick yang diperluas dari Validitas ( 1989) bab Samuel Messick dalam edisi ketiga dari pengukuran pendidikan saat ini yang paling auothreative , referensi keistrian ciretd pada topik validitas , meskipun ( 2006) bab kane dalam edisi keempat akhirnya dapat replece itu . Bab Messick telah melakukan teo hal utama bagi masyarakat pengukuran . Fist , jelas estabished validitas konstruk sebagai sinfle , dapat rah dengan kemampuan conceptalization validitas . Idenya adalah bukan hal baru , bahkan, sebagai shepard ( 1993) menunjukkan , bangsa telah Advenced dekade sebelumnya , tapi bab Messick secara resmi cadified konsensus yang berkembang di masyarakat maisuretment . Kontribusi besar The scond kerja Messick adalah bahwa memperluas konsep validitas luar isu makna skor untuk menyertakan bukti relevansi dan kegunaan nilai ujian , serta pertimbangan konsekuensi dari tes interpretion dan penggunaan . Wheli yang analtsis rasional atau empiris konsekuensi sebagai bagian dari validitas konstruk belum untuk dipeluk sepenuh hati oleh seluruh anggota masyarakat pengujian , itu masih merupakan tonggak utama dalam evalution teori validitas . Model Messick merupakan unifiied , namun multi- faceted , konseptualisasi valiidity .
Messick (1989 ) mempresentasikan kerangka validitas dalam sebuah tabel showm empat kali lipat dalam tabel 5-7 ( Tabel 2-1 dalam teks aslinya ) .
Kerangka validitas bersatu ..... dapat dibangun dengan distingushing dua aspek yang saling berhubungan dari konsep validitas kesatuan , satu segi adalah sumber pembenaran pengujian , yang didasarkan pada apprasial baik bukti konsekuensi . Pada aspek lain adalah fungsi atau hasil pengujian , yang baik interpratation atau digunakan. Jika aspek untuk sumber pembenaran ( yaitu, baik sebagai evidentialbesis atau secara konsekuensial ) disilangkan dengan segi funtion atau hasil ( yaitu, baik interpretasi tes atau penggunaan test) , kita memperoleh klasifikasi empat kali lipat seperti pada tabel 2-1 ( Messick itu , 1980) .
Sebagaimana ditunjukkan dalam tabel 2-1 , dasar bukti uji interpretationn adalah membangun validity.the dasar bukti dari est digunakan juga validitas konstruk , tetapi sebagai ditopang oleh bukti fot relevansi tes untuk tujuan tertentu dan diterapkan untuk kegunaan tes dalam thesetting . Dasar konsekuensial interpretasi tes adalah apprasial dari nilai implikasi dari label konstruk , teori interpretasi tes yang mendasari , dan implikasi teoritis dan implikasi nilai interpretasi uji di yang sepadan , karena dasar nilai penggunaan tes penilaian yang kedua konsekuensi sosial potetial dan aktual pengujian diterapkan . ( hal. 20 )
tabel 5-7
Aspek Validitas
Uji Interpretasi Uji penggunaan
Bukti Dasar Membangun validitas Membangun validitas + relevansi utilitas
Implikasi konsekuensial Dasar Nilai konsekuensi Sosial Kami telah membahas , masalah mendasar yang berkaitan dengan dasar bukti dari interpretasi uji dan penggunaan tes, berlabel " validitas konstruk " dan " validitas konstruk + relefanceutility " pada tabel 5-7 . Sekarang kita beralih ke pikiran Messick atas dasar konsekuensi dari interpretasi tes penggunaan tes : implikasi nilai dan konsekuensi sosial , masing-masing.
Dasar konsekuensial Tes Interpretasi : Implikasi Nilai
Tidak ada lagi dabate tentang apakah nilai-nilai harus terlibat dalam ilmu mereka clerly berada. Penilaian ilmiah adalah pertimbangan nilai . Sebagai contoh, daripada mengandalkan pada orientasi ketat empiris untuk validasi yang mendominasi sebelum tahun 1950-an , sekarang kita memanggil konstruksi sebagai dasar untuk menguji hipotesis kami . Melakukan hal itu adalah pilihan berdasarkan apa yang saat ini dianggap berharga dan penting . Selain itu , yang kita gunakan pengujian hipotesis sama sekali adalah , itu sendiri , pilihan. Sothe pertanyaan tidak jika nilai-nilai harus memiliki peran dalam ilmu pengetahuan , tapi bagaimana kita bisa mengambil nilai-nilai ke rekening perusahaan ilmiah .
( 1989) dimasukkannya Messick tentang konsekuensi dari nilai onterpretation dalam konseptualisasi tentang validitas mensyaratkan bahwa , sebagai bagian dari upaya validasi kami, kami secara eksplisit berurusan dengan implikasi nilai yang terkait dengan konstruk kita memanggil . Dia berpendapat bahwa nilai yang intrensic pertimbangan validitas karena mereka mempengaruhi skor yang berarti melalui interpretstion konstruk skor tes . Interpratation dari setiap peristiwa atau perilaku melibatkan metching ke beberapa skema besar untuk yang nilainya sudah attached.any aktivitas tertentu atau perilaku dipandang sebagai contoh dari kategori yang lebih luas mana ia berasal dan dengan demikian diliputi dengan nilai yang terkait dengan kategorisasi tersebut. Masing-masing categois yang lebih luas , pada gilirannya , subclass dari beberapa bahkan lebih umum konseptualisasi dengan lapisan lain nilai ditempelkan . Dalam konteks validasi , nilai diperkirakan berdampak makna skor pada tiga tingkatan : melalui ( 1 ) label yang kita berikan kepada konstruksi , ( 2 ) teori-teori yang memberikan konstruksi maknanya , dan ( 3 ) ideologi tercermin dalam teori-teori .
Dalam hal asumsi nilai yang terkait dengan label membangun , mempertimbangkan perbedaan dalam arti penafsiran skor jika dan poinst pada skala disebut " fleksibilitas terhadap kekakuan " sebagai lawan dari " kebingungan terhadap konsistensi " ( Messick , 1989) . Apa asumsi nilai mendasari label " krisis personal " ? Apa consept itu dilabel ulang " kesempatan untuk pertumbuhan pribadi " ? Jika kita menganggap sesuatu menjadi hal yang " baik" atau "buruk " , bahwa nilai konotasi sering menemukan jalan ke label membangun dan mengarahkan skor interpretasi dalam arah yang konsisten dan dengan asumsi kita . " Atau" buruk " hal, bahwa nilai konotasi sering menemukan jalan ke label membangun dan mengarahkan skor interpretasi dalam arah yang konsisten dan dengan kebutuhan assumption.we kami berhati-hati bahwa membangun label accuratly mencerminkan seluruh rentang nilai konotasi tersirat oleh konseptualisasi teoritis konstruk dan referenst empiris .
Sebuah rheory adalah kategori brosder daripada membangun dan memiliki asumsi nilai tersendiri ans terpasang . Sebuah keuntungan membangun makna dari tempatnya witha membangun keuntungan yang berarti dari tempatnya dalam boader kerangka teoritis . Kami migt menemukan, oleh karena itu, differenst interpretasi skor yang sama tergantung pada perspektif teoritis melalui mana konstruk dan indikator yang sedang efek viewed.this dapat paling mudah dilihat dalam kasus teori yang bersaing dari fenomena yang sama . Pertimbangkan interpratations diffrenst skor tes bakat yang sama jika , dari perspektif teoritis ane , konstruk mengetuk bt tes dipandang sebagai relatif tetap , tetapi , dalam terang teori lain , konstruk dipandang sebagai jauh bisa ditingkatkan melalui usaha . Mengingat perspektif pertama, ujian ini nilai wold diartikan sebagai iindicative dari suatu sifat yang berada di luar kendali individuak itu . Dari masing-masing kedua, bagaimanapun , nilai peserta ujian dianggap sebagai indikator dari konstruk yang ditempa , dan individu mungkin bi diselenggarakan secara pribadi bertanggung jawab ( setidaknya sebagian ) untuk posisi mereka saat ini atau perbaikan ay yang mungkin terjadi . Tidak perlu banyak peregangan untuk melihat bahwa perbedaan tersebut dalam penafsiran dapat memiliki efek dramatis pada pembenaran berbagai penggunaan tes dalam pengaturan sebagai diterapkan .
Akhirnya , implikasi nilai sourceof ketiga utama adalah edology di mana teori yang embbedded .

No comments:

Post a Comment