Mutiara Marwah: EVALUASI PENDIDIKAN Analisis Reliabilitas Essay Dan obyektif

A. Pengertian Reliabilitas

Kata reliabillitas dalam bahasa Indonesia di ambil dari reliability dalam bahasa inggris, berasal dari kata, reliable yang artinya dapat di percaya. “reliabilitas” merupakan kata benda, sedangkan “reliable” merupakan kata sifat atau keadaan. Reliabilitas merupakan penerjemahan dari kata reliability yang mempunyai asal kata rely dan ability. Pengukuran yang memiliki reliabilitas tinggi disebut sebagai pengukuran yang reliabel (reliable).Walaupun reliabilitas mempunyai berbagai arti seperti kepercayaan, keterandalan, keajegan, kestabilan dan konsistensi, namun ide pokok yang terkandung dalam konsep reliabilitas adalah sejauh mana hasil pengukuran dapat dipercaya.

Dari beberapa pengertian di atas jadi reliabilitas tes marupakan suatu alat ukur yang digunakan untuk mengetahui konsistensi pengukuran tes yang hasilnya menunjukan keajegan.Seorang dikatakan dapat di percaya apabila orang tersebut berbicara ajeg, tidak berubah-ubah pembicaraannya dari waktu ke waktu.Dalam sebuah tes pentingnya diamati keajegan dan kepastian tes tersebut dilihat dari hasil tes yang didapat.

B. Faktor-Faktor Yang Mempengaruhi Reliabilitas Tes Hasil Belajar Obyektif

a. Konstruksi item yang tidak tepat, sehingga tidak dapat mempunyai daya pembeda yang kuat.

b. Panjang/pendeknya suatu instrument

c. Evaluasi yang surjektif akan menurunkan reliabilitas

d. Ketidaktepatan waktu yang diberikan

e. Kemampuan yang ada dalam kelompok

f. Luas/tidaknya sampel yang diambil.

1. Konsep Dasar

a. Pengukuran

Sebelum seorang evaluator menilai tentang proses sebuah pendidikan, maka langkah awal yang dilakukan adalah melakukan sebuah pengukuran. Dalam penilaian pendidikan, evaluator harus mengatahui standar penilain yang telah telah ditetapkan oleh pemerintah sebagai acuan dasar, sehingga dari situ evaluator mampu melakukan pengukuran sesuai dengan apa yang seharusnya diakur dalam bidang pendidikan. Umumnya sebuah pengukuran, akan dapat dilakukan dengan baik apabila evaluator mengetahui dengan pasti objek apa yang akan diukur, dengan begitu evaluator dapat menentukan instrument yang digunakan dalam pengukuran.Pengukuran merupakan proses yang mendeskripsikan performance siswa dengan menggunakan suatu skala kuantitatif (system angka) sedemikian rupa sehingga sifat kualitatif dari performance siswa tersebut dinyatakan dengan angka-angka.

a. Menurt Masidjo (1995) pengukuran sifat suatu objek adalah suatu kegiatan menentukan kuantitas suatu objek melalui aturan-aturan tertentu sehingga kuantitas yang diperoleh benar-benar mewakili sifat dari suatu objek yang dimaksud.

b. Pengertian yang lebih luas mengenai pengukuran dikemukakan oleh Wiersma & Jurs (1990) bahwa pengukuran adalah penilaian numeric pada fakta-fakta dari objek yang hendak diukur menurut criteria atau satuan-satuan tertentu. Jadi pengukuran bisa diartikan sebagai proses memasangkan fakta-fakta suatu objek dengan fakta-fakta satuan tertentu.

b . Penilaian

Penilaian dalam Bahasa Inggris dikenal dengan istilah Assessment yang berarti menilai sesuatu. Menilai itu sendiri bararti mengambil keputusan terhadap sesuatu dengan mengacu pada ukuran tertentu seperti menilai baik atau buruk, sehat atau sakit, pandai atau bodoh, tinggi atau rendah, dan sebagainya (Djaali & Pudji Muljono, 2007).Istilah asesmen (assessment) diartikan oleh Stiggins (1994) sebagai penilaian proses, kemajuan, dan hasil belajar siswa (outcomes). Menurut Endang Purwanti (2008: 3) Secara umum, asesmen dapat diartikan sebagai proses untuk mendapatkan informasi dalam bentuk apapun yang dapat digunakan untuk dasar pengambilan keputusan tentang siswa baik yang menyangkut kurikulumnya, program pembelajarannya, iklim sekolah maupun kebijakan-kebijakan sekolah. Dari beberapa pengertian menurut para ahli diatas dapat disipulkan bahwa penilaian adalah suatu kegiatan membandingkan atau menerapkan hasil pengukuran untuk memberikan nilai terhadap objek penilaian.

c . Evaluasi

Evaluasi dalam bahasa Inggris dikenal dengan istila Evaluation. Gronlund (1985) berpendapat evaluaasi adalah suatu proses yang sistematis untuk menentukan atau membuat keputusan, sampai sejauh mana tujuan proram telah tercapai. Pendapat yang sama juga dikemukakan oleh Wrightstone, dkk (1956) yang mengemukakan bahwa evaluasi pendidikan adalah penaksiran terhadap pertumbuhan dan kemajuan siswa kearah tujuan atau nilai-nilai yang telah ditetapkan dalam kurikulum. Sedangkan Endang Purwanti (2008: 6) Berpendapat bahwa evaluasi adalah proses pemberian makna atau penetapan kualitas hasil pengukuran dengan cara membandingkan angka hasil pengukuran tersebut dengan kriteria tertentu.Dari pengertian diatas istilah evaluasi dan penilaian hampir sama, bedanya dalam evaluasi berakhir dg pengambilan keputusan sedangkan penilaian hanya sebatas memberikan nilai saja. Berdasarkan pengertian antara istilah pengukuran, penilaian dan evaluasi yang dikemukakan diatas, maka jelaslah sudah bahwa pengukuran, penilaian dan evaluasi merupakan tiga konsep yang berbeda. Namun demikian, dalam prakteknya dalam dunia pendidikan, ketiga konsep tersebut sering dipraktikkan dalam satu rangkaian kegiatan.

Beberapa perbedaan pengukuran, penilaian dan evaluasi

N0	Pengukuran	Penilaian	Evaluas
1	Dilakukan pertama kali sebelum melakukan proses selanjutnya	Dilakukan sebagai tindak lanjut dari hasil pengukuran (pengumpulan informasi) sebelum membuat keputusan	Kegiatan yang lebih kompleks, dimana mencakup pengukuran, penilaian dan membandingkan
2	Hasil berupa angka	Hasil berupa kriteria dengan parameter tertentu	Hasil berupa pengambilan keputusan atas suatu hasil penilaian
3	Berinteraksi langsung dengan obyek yang diukur.	Berinteraksi dengan informasi yang telah dikumpulkn untuk diolah	Berinteraksi dengan proses pengambilan keputusan terhadap suatu obyek.

2. Tingkat Kesukaran

Tingkat kesukaran soal adalah peluang untuk menjawab benar suatu soal pada tingkat kemampuan tertentu yang biasanya dinyatakan dalam bentuk indeks. Indeks tingkat kesukaran ini pada umumnya dinyatakan dalam bentuk proporsi yang besarnya berkisar 0,00 - 1,00. Semakin besar indeks tingkat kesukaran yang diperoleh dari hasil hitungan, berarti semakin mudah soal itu. Suatu soal memiliki TK= 0,00 artinya bahwa tidak ada siswa yang menjawab benar dan bila memiliki TK= 1,00 artinya bahwa siswa menjawab benar. Perhitungan indeks tingkat kesukaran ini dilakukan untuk setiap nomor soal. Pada prinsipnya, skor rata-rata yang diperoleh peserta didik pada butir soal yang bersangkutan dinamakan tingkat kesukaran butir soal itu. Rumus ini dipergunakan untuk soal obyektif. Rumusnya adalah seperti berikut ini.

Fungsi tingkat kesukaran butir soal biasanya dikaitkan dengan tujuan tes. Misalnya untuk keperluan ujian semester digunakan butir soal yang memiliki tingkat kesukaran sedang, untuk keperluan seleksi digunakan butir soal yang memiliki tingkat kesukaran tinggi/sukar, dan untuk keperluan diagnostik biasanya digunakan butir soal yang memiliki tingkat kesukaran rendah/mudah. Hasil perhitungan dengan menggunakan rumus di atas menggambarkan tingkat kesukaran soal itu. Klasifikasi tingkat kesukaran soal dapat dicontohkan seperti berikut ini.

1. 0,00 - 0,30 soal tergolong sukar

2. 0,31 - 0,70 soal tergolong sedang

3. 0,71 - 1,00 soal tergolong mudah

Tingkat kesukaran butir soal dapat mempengaruhi bentuk distribusi total skor tes. Untuk tes yang sangat sukar (TK= < 0,25) distribusinya berbentuk positif skewed, sedangkan tes yang mudah dengan TK= >0,80) distribusinya berbentuk negatif skewed. Tingkat kesukaran butir soal memiliki 2 kegunaan, yaitu kegunaan bagi guru dan kegunaan bagi pengujian dan pengajaran. Kegunaannya bagi guru adalah:

(1) sebagai pengenalan konsep terhadap pembelajaran ulang dan memberi masukan kepada siswa tentang hasil belajar mereka,

(2) memperoleh informasi tentang penekanan kurikulum atau mencurigai terhadap butir soal yang biasa.

Adapun kegunaannya bagi pengujian dan pengajaran adalah:

(a) pengenalan konsep yang diperlukan untuk diajarkan ulang,

(b) tanda-tanda terhadap kelebihan dan kelemahan pada kurikulum sekolah,

(d) tanda-tanda kemungkinan adanya butir soal yang bias,

(e) merakit tes yang memiliki ketepatan data soal.

Di samping kedua kegunaan di atas, dalam konstruksi tes, tingkat kesukaran butir soal sangat penting karena tingkat kesukaran butir dapat:

(1) mempengaruhi karakteristik distribusi skor (mempengaruhi bentuk dan penyebaran skor tes atau jumlah soal dan korelasi antarsoal),

(2) berhubungan dengan reliabilitas. Menurut koefisien alfa clan KR-20, semakin tinggi korelasi antar soal, semakin tinggi reliabilitas.

Tingkat kesukaran butir soal juga dapat digunakan untuk mempredikst alat ukur itu sendiri (soal) dan kemampuan peserta didik dalam memahami materi yang diajarkan guru. Misalnya satu butir soal termasuk kategori mudah, maka prediksi terhadap informasi ini adalah seperti berikut.

1) Pengecoh butir soal itu tidak berfungsi.

2) Sebagian besar siswa menjawab benar butir soal itu; artinya bahwa sebagian besar siswa telah memahami materi yang ditanyakan.

Bila suatu butir soal termasuk kategori sukar, maka prediksi terhadap informasi ini adalah seperti berikut.

1) Butir soal itu "mungkin" salah kunci jawaban.

2) Butir soal itu mempunyai 2 atau lebih jawaban yang benar.

3) Materi yang ditanyakan belum diajarkan atau belum tuntas pembelajarannya, sehingga kompetensi minimum yang harus dikuasai siswa belum tercapai.

4) Materi yang diukur tidak cocok ditanyakan dengan menggunakan bentuk soal yang diberikan (misalnya meringkas cerita atau mengarang ditanyakan dalam bentuk pilihan ganda).

5) Pernyataan atau kalimat soal terlalu kompleks dan panjang.

Namun, analisis secara klasik ini memang memiliki keterbatasan, yaitu bahwa tingkat kesukaran sangat sulit untuk mengestimasi secara tepat karena estimasi tingkat kesukaran dibiaskan oleh sampel (Haladyna, 1994: 145). Jika sampel berkemampuan tinggi, maka soal akan sangat mudah (TK= >0,90). Jika sampel berkemampuan rendah, maka soal akan sangat sulit (TK = < 0,40). Oleh karena itu memang merupakan kelebihan analisis secara IRT, karena 1RT dapat mengestimasi tingkat kesukaran soal tanpa menentukan siapa peserta tesnya (invariance). Dalam IRT, komposisi sampel dapat mengestimasi parameter dan tingkat kesukaran soal tanpa bias.

3. Daya Pembeda (DP)

Daya pembeda soal adalah kemampuan suatu butir soal dapat membedakan antara warga belajar/siswa yang telah menguasai materi yang ditanyakan dan warga belajar/siswa yang tidak/kurang/belum menguasai materi yang ditanyakan. Manfaat daya pembeda butir soal adalah seperti berikut ini.

1) Untuk meningkatkan mutu setiap butir soal melalui data empiriknya. Berdasarkan indeks daya pembeda, setiap butir soal dapat diketahui apakah butir soal itu baik, direvisi, atau ditolak.

2) Untuk mengetahui seberapa jauh setiap butir soal dapat mendeteksi/membedakan kemampuan siswa, yaitu siswa yang telah memahami atau belum memahami materi yang diajarkan guru. Apabila suatu butir soal tidak dapat membedakan kedua kemampuan siswa itu, maka butir soal itu dapat dicurigai "kemungkinannya" seperti berikut ini.

• Kunci jawaban butir soal itu tidak tepat.

• Butir soal itu memiliki 2 atau lebih kunci jawaban yang benar

• Kompetensi yang diukur tidak jelas

• Pengecoh tidak berfungsi

• Materi yang ditanyakan terlalu sulit, schingga banyak siswa yang menebak

• Sebagian besar siswa yang memahami materi yang ditanyakan berpikir ada yang salah informasi dalam butir soalnya

Indeks daya pembeda setiap butir soal biasanya juga dinyatakan dalam bentuk proporsi. Semakin tinggi indeks daya pembeda soal berarti semakin mampu soal yang bersangkutan membedakan warga belajar/siswa yang telah memahami materi dengan warga belajar/peserta didik yang belum memahami materi. Indeks daya pembeda berkisar antara -1,00 sampai dengan +1,00. Semakin tinggi daya pembeda suatu soal, maka semakin kuat/baik soal itu. Jika daya pembeda negatif (<0) berarti lebih banyak kelompok bawah (warga belajar/peserta didik yang tidak memahami materi) menjawab benar soal dibanding dengan kelompok atas (warga belajar/peserta didik yang memahami materi yang diajarkan guru).

Untuk mengetahui daya pembeda soal bentuk pilihan ganda adalah dengan menggunakan rumus berikut ini.

DP = daya pembeda soal,

BA = jumlah jawaban benar pada kelompok atas,

BB = jumlah jawaban benar pada kelompok bawah,

N =jumlah siswa yang mengerjakan tes.

Hasil perhitungan dengan menggunakan rumus di atas dapat menggambarkan tingkat kemampuan soal dalam membedakan antar peserta didik yang sudah memahami materi yang diujikan dengan peserta didik yang belum/tidak memahami materi yang diujikan. Adapun klasifikasinya adalah seperti berikut ini (Crocker dan Algina, 1986: 315).

0,40 - 1,00 soal diterima baik

0,30 - 0,39 soal diterima tetapi perlu diperbaiki

0,20 - 0,29 soal diperbaiki

0,19 - 0,00 soal tidak dipakai/dibuang

4. Beda Distraktor

Setiap tes pilihan ganda memiliki satu pertanyaan serta beberapa pilihan jawaban. Diantara pilihan jawaban yang ada, hanya satu yang benar. Selain jawaban yang benar tersebut, adalah jawaban yang salah. Jawaban yang salah itulah yang dikenal dengan distractor (pengecoh). Dengan demikian, efektifitas distraktor adalah seberapa baik pilihan yang salah tersebut dapat mengecoh peserta tes yang memang tidak mengetahui kunci jawaban yang tersedia. Semakin banyak peserta tes yang memilih distraktor tersebut, maka distaktor itu dapat menjalankan fungsinya dengan baik. Cara menganalisis fungsi distraktor dapat dilakukan dengan menganalisis pola penyebaran jawaban butir. Pola penyebaran jawaban sebagaimana dikatakan :

a. Sudijono (2005) adalah suatu pola yang dapat menggambarkan bagaimana peserta tes dapat menentukan pilihan jawabannya terhadap kemungkinan-kemungkinan jawaban yang telah dipasangkan pada setiap butir.

b. Depdikbud (1993) sebuah distraktor dapat dikatakan berfungsi dengan baik jika dipilih oleh paling sedikit 5% untuk 4 pilihan jawaban dan 3% untuk 5 pilihan jawaban.

c. Fernandes (1984) distraktor dikatakan baik jika dipilih oleh minimal 2% dari seluruh peserta. Distraktor yang tidak memenuhi kriteria tersebut sebaiknya diganti dengan distraktor lain yang mungkin lebih menarik minat peserta tes untuk memilihnya.

Sesuatu distraktor dapat diperlakukan dengan tiga cara:

a. Diterima, karena sudah baik

b. Ditolak, karena tidak baik

c. Ditulis kembali, karena kurang baik

5.      Penentuan Nilai Akhir
            Dalam menentukan nilai akhir, bobot nilai-nilai yang merupakan komponennya perlu ditentukan dan diberitahukan kepada siswa. Sistem penilaian yang sesuai dengan maksud dan tujuan yang telah disebutkan di atas adalah sistem penilaian relatif, yaitu sistem yang digunakan untuk menilai kemampuan siswa yang lain dalam kelasnya.
1. Definisi Nilai Akhir
            Nilai akhir sering juga dikenal dengan istilah nilai final adalah, nilai baik berupa angka atau huruf yang melambangkan tingkat keberhasilan peserta didik setelah mereka mengikuti program pendidikan pada jenjang pendidikan tertentu, dalam jangka waktu yang telah ditentukan.Merupakan pemberian dan penentuan pendapat pendidik terhadap peserta didiknya, terutama mengenai perkembangan, kemajuan dan hasil-hasil yang telah dicapai oleh peserta didik yang berada dibawah asuhannya, setelah mereka menempuh proses pembelajaran dalam jangka waktu tertentu.
2. Fungsi Nilai Akhir
            Penentuan nilai akhir secara garis besar memiliki empat macam fungsi yaitu sebagai berikut :
a. Fungsi Intruksional
            Tidak ada tujuan yang lebih penting dalam proses belajar mengajar kecuali mengusahakan agar perkembangan dan belajar siswa mencapai tingkat optimal. Pemberian nilai merupakan salah satu cara dalam usaha ke arah tujuan itu, asal dilakukan dengan hati-hati dan bijaksana.Pemberian nilai merupakan suatu pekerjaan yang bertujuan untuk memberikan suatu balikan (feed back / umpan balik) yang mencerminkan seberapa jauh seorang siswa telah mencapai tujuan yang ditetapkan dalam pengajaran atau system instruksional.
b. Fungsi Informatif
            Memberikan nilai siswa kepada orang tuanya mempunyai arti bahwa orang tua tersebut menjadi tahu akan kemajuan dan prestasi putranya di sekolah. Catatan ini akan sangat berpengaruh, terutama bagi orang tua yang ikut serta menyadari tujuan sekolah dan perkembangan putranya. Dengan catatan ini orang tua akan:
1. Sadar terhadap keadaan putranya, untuk kemudian lebih baik memberi bantuan berupa perhatian, dorongan ataupun bimbingan, dan

2. Hubungan orang tua dengan sekolah semakin lebih baik.
c . Fungsi Bimbingan
            Pemberian nilai kepada siswa akan mempunyai arti besar bagi pekerjaan bimbingan. Dengan perincian gambaran nilai siswa, petugas bimbingan akan segera tahu bagian-bagian mana dari usaha siswa disekolah yang masih memerlukan bantuan. Catatan lengkap yang juga mencakup tingkat (rating) dalam kepribadian siswa serta sifat-sifat yang berhubungan denga rasa sosial akan sangat membantu siswa dalam mengarahkannya sebagai pribadi yang seutuhnya.
d. Fungsi Administratif
            Secara administratif pemberian nilai akhir oleh seorang pendidik terhadap peserta didiknya itu memiliki fungsi sebagai berikut:
1) Menentukan kenaikan dan kelulusan siswa.
2) Memindahkan atau menempatkan siswa.
3) Memberikan beasiswa.
4) Memberikan rekomendasi untuk melanjutkan belajar.
5) Memberi gambaran tentang prestasi siswa/lulusan kepada para calon pemakai tenaga kerja.
1. Beberapa contoh cara penentuan nilai akhir
            Sebelum dibicarakan lebih lanjut mengenai cara-cara yang dapat ditempuh dalam rangka menentukan nilai akhir perlu diingatkan tentang adanya dua bentuk penilaian, yaitu penilaian dalam bentuk formatif dan penilaian dalam bentuk sumatif.
Penilaian yang diberikan oleh pendidik dalam bentuk tes-tes formatif sebenarnya dimaksudkan untuk memperbaiki proses belajar mengajar dan untuk mengetahui sampai dimana tingkat pencapaian peserta didik terhadap tujuan instruksional yang telah dirumuskan dalam setiapsatuan pelajaran. Adapun tes sumatif bertujuan untuk menilai prestasi peserta didik terhadap penguasaan bahan pelajaran yang telah diberikan kepada mereka selama jangka waktu tertentu. Akan tetapi oleh karena tes sumatif itu pada umumnya tidak sering dilakukan, maka untuk dapat menjaga kesinambunganpenilaian dan hasil penilaian yang dipandang lebih mantap bagi setiap peserta didik, maka penentuan nilai akhir pada umumnya dilaksanakan dengan jalan menggabungkan nilai-nilai hasil tes formatif dengan nilai hasil tes sumatif.
Berikut ini dikemukakan dua macam contoh cara yang sering dipergunakan dalam penentuan nilai akhir.

Nilai akhir diperoleh dengan jalan memperhitungkan nilai hasil tes formatif, yaitu nilai hasil rata-rata ulangan harian, dengan nilau hasil tes sumatif, yaitu nilai hasil ulangan umum yang dikali 2 kemudian dibagi 3. Dengan rumus :
(F1 + F2 + F3 …………..Fn)
+ 2S
n
NA =
3

NA = Nilai akhir
F1 = Nilai hasil tes formatif ke -1
F2 = Nilai hasil tes formatif ke-2
F3 = Nilai hasil tes formatif ke-3
F4 = Nilai hasil tes formatif ke –n
n = Banayknya kali tesformatif dilaksanakan
2&3 = bilangan konstan (2 bobot formatif, 3 bobot tes secara keseluruhan

Dapat disimpulkan bahwa dalam menentukan nilai akhir dan dalam penyusunan rangking seorang pendidik (pengajar) harus dapat mengetahui teknik-tekniknya guna mempermudah dalam pembuatannya. Dengan menentukan nilai akhir dan rangking seorang pendidik dapat mengetahui kemampuan atau kecerdasan peserta didik dalam mengikuti proses belajar mengajar, sehingga dapat memberikan motivasi kepada peserta didik dalam mengikuti pelajaran. Dari berbagai macam teknik pendidik dapat memilih teknik yang mudah digunakan dapat dimengerti oleh peserta didik.

Laman

Saturday, 8 October 2016

EVALUASI PENDIDIKAN Analisis Reliabilitas Essay Dan obyektif

No comments:

Post a Comment