Mengukur dan Mengawasi Outcome Program

Secara umum program selalu bertujuan untuk merubah atau memberikan perbedaan signifikan ke arah yang positif, seperti misalnya: efektifitas, efisiensi, dan peningkatan nilai-nilai dan taraf hidup manusia. Tujuan program biasanya berupa pernyataan yang abstrak dan sulit diamati dan diukur sehingga dapat menyulitkan evaluasi program. Oleh karenanya tujuan program harus dinyatakan dalam outcome yang nantinya akan lebih diperjelas dengan indikator-indikator yang dapat diamati dan diukur. Pembahasan berikut ini berkenaan dengan konsep outcome program, identifikasi outcome yang relevan, mengukur outcome program, dan mengawasi outcome program.

Apa itu Outcome Program?

Outcome merupakan pernyataan populasi sasaran atau kondisi sosial yang diharapkan akan berhasil dicapai oleh suatu program. Contohnya, berkurangnya jumlah siswa yang merokok setelah mendapatkan penyuluhan anti-merokok di sekolah merupakan outcome. Sikap siswa untuk tetap tidak merokok bagi yang belum pernah merokok merupakan outcome juga. Contoh lain, “kesiapan bersekolah” bagi anak setelah mengikuti program pra-sekolah dapat dilihat sebagai outcome. Begitu juga berkurangnya jumlah berat badan setelah mengikuti program diet, peningkatan kemampuan manajemen bisnis pegawai setelah mengikuti program pelatihan manajemen, dan jumlah polutan di sungai setelah tindakan keras oleh penjaga lingkungan (Rossi, Lipsey, & Freeman, 2004:205). Contoh yang telah disajikan mengandung dua hal, yakni:

1. Outcome

Outcome merupakan karakteristik dari populasi sasaran atau kondisi sosial, bukan dari program, dan pengertian dari suatu outcome tidak langsung mengacu pada tindakan program. Contoh: menyediakan makanan bagi 100 orang jompo bukanlah termasuk outcome program, namun lebih pada pernyataan penyampaian layanan sebagai salah satu aspek dari proses program. Manfaat dari nutrisi yang terkandung dalam makanan bagi kesehatan orang jompo, merupakan outcome, selain juga untuk meningkatkan moral, merasakan kualitas hidup yang baik, dan menghindarkan mereka dari resiko kecelakaan apabila mereka (orang jompo) memasak sendiri. Dalam cara pandang yang berbeda, outcome selalu merujuk pada karakteristik yang pada prinsipnya dapat diamati dari individu atau situasi yang tidak menerima layanan program. Contoh, kita dapat menilai jumlah orang yang merokok, kesiapan bersekolah, berat badan, kemampuan manajemen, dan polusi air pada situasi yang relevan di mana tidak mendapatkan campur tangan program.

2. Konsep Outcome

Konsep tidak perlu berarti bahwa sasaran program telah benar-benar berubah atau bahwa program telah menyebabkan suatu perubahan di segala arah. Contoh: Jumlah perokok remaja di sekolah bisa saja tidak berubah sejak penyuluhan anti-merokok dimulai, dan tak seorangpun berkurang berat badannya selama keikutsertaannya dalam program diet. Alternatif lain yang bisa disampaikan, mungkin ada perubahan namun sebaliknya berlawanan dengan tujuan yang diharapkan. Maka dari itu, apapun yang terjadi kemungkinan dapat disebabkan hal lain di luar pengaruh program. Mungkin program diet dilaksanakan selama liburan musim dingin ketika orang-orang cenderung menurutkan keinginannya pada gula. Atau bisa jadi para remaja mengurangi merokok sebagai reaksi atas berita kematian perokok yang merupakan artis musik rock papan atas.

Lebih lanjut, outcome dapat dijelaskan sebagai: Outcome level (tingkat outcome), outcome change (perubahan outcome), dan program effect (pengaruh program).

  • Outcome level (tingkat outcome) : status outcome pada suatu waktu yang sama (jumlah perokok remaja, berat badan (BB) yang berkurang, jumlah polutan air).
  • Outcome change (perubahan outcome) : merupakan selisih antar tingkat outcome pada rentang waktu yang berbeda (perbedaan jumlah perokok sebelum dan sesudah program).
  • Program effect (pengaruh program) : porsi perubahan outcome yang murni terjadi karena program dan bukan karena pengaruh faktor lain.
Gambar 1. Tingkat Outcome, Perubahan Outcome, dan Pengaruh Program

Variabel outcome merupakan karakteristik atau kondisi yang dapat diukur dari populasi sasaran program yang disebabkan oleh tindakan program. Misalnya jumlah perokok, berat badan, kesiapan bersekolah, kandungan polusi air, dan sebagainya. Rerata tingkat outcome grup dari individu yang menerima layanan program selalu berfluktuasi yang menandakan bahwa merokok, kesiapan bersekolah, dan kemampuan manajemen, tidak diharapkan selalu konstan/tetap, namun berubah sebagai hasil dari banyak sebab dan keadaan alami yang tidak ada hubungannya dengan program, misalnya tingkat polusi air yang dapat berfluktuasi tergantung aktivitas industri di daerah itu dan kondisi cuaca, seperti curah hujan yang tinggi melarutkan konsentrasi polutan dalam air.

Tingkat outcome tidak banyak memberi tahu seberapa efektif program yang telah berjalan. Tingkat outcome sendiri tidak dapat diinterpretasikan sebagai indikator gagal atau suksesnya suatu program. Mengukur tingkat outcome sebelum dan sesudah program dapat melihat perbedaan terhadap perubahan outcome. Contoh sebelum program kesiapan bersekolah anak masih rendah, setelah program menjadi lebih baik walaupun tidak tinggi, namun telah menunjukkan adanya peningkatan. Tetapi apakah peningkatan itu benar-benar disebabkan karena program pra-sekolah? Bisa jadi faktor lain seperti usia pra-sekolah yang memang berada pada periode perkembangan kognitif dan motorik yang lebih cepat dibanding proses kedewasaan normal, atau orang tuanya di rumah membantu perkembangan intelektualnya dan penyiapan masuk sekolah, yang kesemuanya dihitung sebagai bagian dalam perkembangannya.

Mengidentifikasi Outcome yang Relevan

Untuk mengidentifikasi outcome secara benar, tentu harus dilakukan beberapa cara agar identifikasi yang dilakukan menghasilkan indikator yang tepat untuk mengukur outcome. Rossi, et.al (2004:208-210) menjelaskan yakni dengan mengidentifikasi secara sangat spesifik outcome apa yang relevan dalam pengukuran, sebagai berikut:

1. Evaluator harus menyelaraskan perspektif stakeholder terkait outcome yang diharapkan

Untuk dapat menyelaraskan perspektif stakeholder, evaluator setidaknya harus mempunyai:

  • Pernyataan tujuan, cita-cita, dan misi program.
  • Proposal pendanaan dan bantuan atau kontrak layanan dari sponsor luar.

Kesulitan umum informasi dari sumber ini yakni ketiadaan pengkhususan dan kebutuhan konkret untuk secara jelas mengidentifikasi ukuran outcome yang khusus. Hal ini sering menyebabkan kegagalan evaluator dalam menuangkan gagasan-gagasan umum ke dalam format kerja dan bernegosiasi dengan stakeholder untuk meyakinkan hasil pengukuran outcome dapat memenuhi harapannya. Untuk tujuan ini outcome haruslah mengindikasikan keterlibatan karakteristik, perilaku, atau kondisi yang diharapkan berubah oleh program.

2. Outcome khusus yang ditetapkan dalam Teori Dampak Program

Suatu teori dampak menggambarkan outcome program sosial sebagai bagian dari model logis yang menghubungkan kegiatan program dengan outcome proksimal (terdekat), yang pengaruhnya mendahului outcome distal (terjauh). Bagi kebanyakan program sosial, outcome proksimal (terdekat)psikologi – sikap, kepedulian, kemampuan, motivasi, perilaku disengaja, dan banyak kondisi lain yang rentan berpengaruh langsung terhadap proses dan layanan program. Outcome proksimal jarang menjadi outcome akhir yang diharapkan program. Outcome proksimal secara umum menjadi yang termudah untuk diukur dan disematkan sebagai usaha dari program. Outcome distal (terjauh) lebih sulit diukur dan disematkan sebagai usaha dari program, karena kemungkinan terdapat hasil yang ambigu, apakah benar terjadi karena program, ataukah faktor lain di luar kontrol program.

Gambar 2. Contoh Teori Dampak Program

3. Review penelitian terdahulu yang relevan

Dalam mengidentifikasi dan mendefinisikan outcome, evaluator hendaknya mengkaji penelitian sebelumnya terhadap isu-isu terkait dengan program yang sedang dievaluasi, khususnya penelitian evaluasi pada program serupa. Dalam beberapa kasus terdapat pengertian ukuran dan standar yang relatif signifikan terhadap penetapan kebijakan. Dalam kasus lain evaluator harus mengetahui masalah dengan beberapa ukuran dan pengertian tertentu yang mungkin dibutuhkan oleh evaluator.

4. Menghindari outcome yang tidak diharapkan

Terdapat kemungkinan sebuah program mempunyai outcome yang tidak diharapkan muncul pada proses yang bukan bagian rencana dan maksud langsung dari program. Untuk itu evaluator sebaiknya juga berhubungan dengan personalia, peserta, ataupun juga informan kunci pada suatu program.

Mengukur Outcome Program

Tidak semua outcome yang telah diidentifikasi akan sama pentingnya atau sama relevannya, sehingga terkadang evaluator tidak perlu mengukur semuanya. Beberapa pilihan kadang mudah dan wajar, namun terkadang sulit dan mahal untuk diukur, yang konsekuensinya tidak dimasukkan dalam evaluasi. Sekali evaluator telah menetapkan outcome yang relevan dan memusatkan perhatiannya secara penuh, evaluator harus menghadapi persoalan bagaimana mengukurnya. Pengukuran outcome mewakili keadaan yang didefinisikan sebagai outcome dari suatu indikator yang dapat diamati, yang secara sistem sangat beragam dengan perubahan atau perbedaan yang saling terkait.

Mendefinisikan dan menjabarkan outcome

Beberapa outcome program dapat diukur dengan relatif sederhana dan mudah diamati terkait dengan satu dimensi. Untuk merepresentasikan outcome secara lengkap perlu melihat dimensi yang berbeda dari aspek yang relevan dengan efek yang dihasilkan program. Contoh outcome yang didefinisikan lebih jelas:

  • Pelepasan Buangan Zat Beracun: Pelepasan zat-zat berbahaya dari fasilitas industri ke lingkungan terbuka yang dapat mencemari manusia dan makhluk hidup lain.
  • Sikap Positif terhadap Sekolah: Seorang anak menyukai sekolah, mempunyai perasaan yang positif untuk mengikuti dan berpartisipasi dengan suka rela dalam kegiatan sekolah.

Outcome yang telah didefinisikan selanjutnya diuraikan lebih spesifik, sebagai berikut:

Pelepasan Buangan Zat Beracun

  • Jenis buangan: kimia, biologi, zat beracun tertentu
  • Tingkat keracunan, membahayakan dan substansi buangan
  • Jumlah zat beracun dibuang selama periode yang ditentukan
  • Frekuensi buangan
  • Kedekatan buangan dengan daerah populasi
  • Rerata penyebaran zat beracun terhadap lapisan tanah, atmosfer, rantai makanan, dan sejenisnya

Sikap Positif  terhadap Sekolah

  • Menyukai guru
  • Menyukai rekan sekelas
  • Menyukai kegiatan sekolah
  • Kerelaan berangkat sekolah
  • Partisipasi sukarela dalam kegiatan sekolah

Membuat variasi pengukuran

Membuat variasi pengukuran merupakan langkah aman sebagai antisipasi kurang tepatnya pengukuran yang dilakukan. Salah satunya dengan menempatkan lebih dari seorang pengamat untuk menghindari bias (jika yang dipilih adalah observasi/pengamatan). Misalnya evaluator yang menilai perilaku agresif anak terhadap teman sebaya, mungkin perlu juga melakukan pengamatan orang tua, pengamatan guru, dan orang lain dalam posisinya menentukan porsi yang signifikan terhadap perilaku siswa (Rossi, et.al, 2004:216). Pengukuran ganda terhadap outcome penting dapat membantu menyediakan konsep yang lengkap dan utuh serta memungkinkan pemaduan kekuatan salah satu pengukuran untuk melengkapi kelemahan pengukuran yang lain.

Mengukur varibel dan prosedur

Data dalam outcome program mempunyai beberapa sumber dasar seperti; hasil pengamatan, rekaman, tanggapan wawancara dan kuesioner, tes terstandar, pengukuran peralatan fisik, dan sejenisnya. Informasi dari suatu sumber menjadi ukuran ketika dioperasional-kan, yakni dimasukkan dalam seperangkat khusus operasi atau prosedur yang sistematis. Pengukuran banyak variabel outcome dalam evaluasi menggunakan prosedur dan instrumen yang telah disiapkan untuk tujuan tertentu dalam jangkauan area program. Contoh; kemampuan akademik telah disepakati diukur dengan tes pencapaian standar dan rata-rata nilai lulus.

Bagi outcome lain, ragam instrumen atau prosedur pengukuran mungkin disiapkan, namun dengan sedikit kesepakatan mengenai mana yang lebih cocok untuk tujuan evaluasi. Khususnya untuk outcome psikologis seperti depresi, harga diri, sikap, kemampuan kognitif, dan kecemasan. Dalam situasi ini tugas seorang evaluator pada umumnya membuat pemilihan yang tepat dari beberapa pilihan yang tersedia. Pertimbangan praktis, seperti bagaimana instrumen dijalankan dan seberapa lama waktunya, harus dipertimbangkan dalam keputusan ini. Bagaimana caranya? Dengan memberikan definisi yang cermat outcome yang akan diukur, juga dengan membedakan dimensi outcome yang relevan. Mengembangkan pengukuran sehingga dapat mengukur apa yang harus diukur secara konsisten tidaklah mudah. Membutuhkan prosedur pengembangan pengukuran yang melibatkan pertimbangan teknik dan umumnya memerlukan sejumlah pengujian awal, analisa, revisi, dan validasi sebelum pengukuran yang baru dikembangkan dapat yakin digunakan. Agar instrumen pengukuran layak haruslah memenuhi beberapa kriteria, sebagai berikut:

1. Realibility (Kehandalan/reabilitas)

Reliabilitas merujuk pada kehandalan, kestabilan, dan konsistensi hasil pengukuran dari suatu instrumen. Artinya bagaimana hasil pengukuran konsisten dengan pengukuran yang satu ke lainnya (Kusaeri & Suprananto, 2012:82). Contohnya timbangan amplop di kantor pos reliabel dalam memberikan skor yang tetap sama dalam berbagai kesempatan (apakah itu ditimbang pada pagi, siang, malam; atau ditimbang dengan cara miring, tengkurap, dsb). Konsistensi instrumen biasanya dinyatakan dalam bentuk koefisien reliabilitas dan kesalahan pengukuran (standard eror of measurement). Secara umum koefisien reliabilitas dapat diklasifikasikan dalam tiga kategori (Kusaeri & Suprananto, 2012:83): 1) Koefisien reliabilitas yang diperoleh dari memberikan tes yang sama dengan waktu yang berbeda (misalnya tes – retes); 2) Koefisien reliabilitas yang diperoleh dari memberikan bentuk tes yang paralel (bentuk ekuivalen); 3) Koefisien reliabilitas yang diperoleh dari memberikan tes secara tunggal (konsistensi internal).

Terdapat beberapa metode yang digunakan untuk mengestimasi reliabilitas skor tes, yakni dengan metode tes-retes, bentuk ekuivalen, tes-retes bentuk ekuivalen, belah dua (splithalf), Kuder Richardson atau Koefisien Alpha, dan Inter-rater. Secara ringkas dapat dilihat pada tabel berikut ini (Kusaeri & Suprananto, 2012:84):

MetodeTujuanBanyak Format TesBanyak Administrasi TesProsedur
Tes-retesMengukur kestabilanSatu format tesSekali diujikanMemberikan tes yang sama dua kali pada kelompok yang sama dengan jeda waktu tertentu antar dua tes. Jeda antara kedua penyelenggaraan tes perlu dipertimbangkan
Bentuk ekuivalenMengukur ekuivalensiDua format tesSekali diujikanMemberikan dua bentuk tes berbeda, tetapi paralel pada sekelompok siswa yang sama, dengan waktu yang sama pula
Tes-retes dengan bentuk ekuivalenMengukur kestabilan dan ekuivalensiDua format tesDua kali diujikanMemberikan dua bentuk tes yang paralel pada sekelompok siswa yang sama dengan jeda waktu yang agak lama antar kedua jenis tes tersebut
Belah dua (split half)Mengukur konsistensi internalSatu format tesSekali diujikanMemberikan tes sekali. Tes dibagi menjadi dua (misalkan butir tes genap dan ganjil), skor dikorelasikan dengan rumus Spearman-Brown
Koefisien alpha atau Kuder RichardsonMengukur konsistensi internalSatu format tesSekali diujikanMemberikan tes sekali. Skor total tes dikorelasikan dengan rumus Kuder-Richardson
Inter-raterMengukur konsistensi penyekoran, bila sebuah tes diskor dua orang atau lebihSatu format tesSekali diujikanMenyelenggarakan tes pada sekelompok siswa dalam sekali waktu. Dua atau lebih rater/penilai menyekor tes secara independen

2. Validity (Keabsahan data/validitas)

Validitas berkenaan dengan mengukur apa yang dimaksudkan hendak diukur. Validitas merujuk pada ketepatan, kebermaknaan, dan kebermanfaatan kesimpulan yang didapatkan dari interpretasi skor tes. Berdasarkan pengertian ini validitas memiliki karakteristik berikut sebagaimana disampaikan Kusaeri & Suprananto, (2012:75-76), yakni; 1) validitas merujuk pada ketepatan interpretasi/kesimpulan terhadap suatu hasil instrumen bukan merujuk pada instrumen itu sendiri; 2) validitas berkaitan dengan derajat (degree) tertentu, seperti validitasnya tinggi, sedang, dan rendah; 3) validitas senantiasa berkaitan dengan kondisi khusus. Artinya tidak ada suatu instrumen yang valid untuk semua tujuan.

Dapat terjadi instrumen A mempunyai derajat validitas tinggi untuk mengukur A, tetapi mempunyai derajat validitas rendah untuk mengukur B, dan derajat validitas sedang untuk mengukur C. Sebagai contoh, hasil tes tertentu dalam aritmatika mungkin memiliki validitas yang tinggi dalam hal kemampuan berhitung. Namun, tes tersebut memiliki validitas rendah dalam hal penalaran aritmatika, dan memiliki validitas sedang untuk memprediksi keberhasilan dalam mengikuti pelajaran matematika di masa depannya. Sangat mungkin tes itu juga tidak valid untuk memprediksi keberhasilan anak dalam bidang musik dan seni.

Jadi, ketika mendeskripsikan validitas, penting untuk mempertimbangkan penafsiran khusus tentang hasil yang didapatkan dari penggunaan instumen. Hasil tidak pernah dikatakan valid saja, akan tetapi memiliki derajat validitas yang berbeda pada setiap penafsiran yang dibuat. Apa saja yang mempengaruhi validitas, khususnya dalam pembelajaran? Kusaeri & Suprananto (2012:75-77), menjelaskannya sebagai berikut:

  • Karakteristik peserta/responden. Kondisi siswa yang lapar, cemas, sakit, mempengaruhi hasil pengukuran.
  • Pelaksanaan pengukuran dan prosedur penyekoran. Pelaksanaan yang berbeda, ada yang diberikan waktu lebih lama, yang lain relatif pendek. Prosedur penyekoran, bias dan tidak reliabel, misalnya pada soal yang menuntut jawaban uraian.
  • Proses pembelajaran. Cara guru menyampaikan materi. Jika selama pembelajaran siswa banyak dibimbing menyelesaikan soal-soal (khususnya soal-soal yang akan diujikan) maka validitas hasil pengukuran itu akan dipertaruhkan. Masalah utama adalah guru “mengajar tes” dan bukan mengajar materi.

Pendekatan dalam menentukan validitas instrumen sebagai berikut (Kusaeri & Suprananto, 2012:79-81) :

  • Validitas terkait isi (content-related validity). Berkaitan dengan derajat kemampuan instrumen mengukur cakupan substansi yang ingin diukur.
  • Validitas terkait kriteria (criterion-related validity). Berkaitan dengan penggunaannya untuk memprediksi kemampuan anak di masa mendatang atau mengestimasi kemampuan anak saat ini dengan membandingkannya dengan hasil dari pengukuran instrumen yang lain.
  • Validitas terkait konstruk (construct-related validity). Berkaitan dengan proses menentukan derajat kemampuan instrumen diinterpretasikan ke dalam satu atau lebih konstruk psikologi. Konstruk merupakan sifat psikologis yang diasumsikan ada, diperlukan untuk menjelaskan beberapa aspek tingkah laku. Penalaran matematika merupakan sebuah konstruk, demikian pula kecerdasan, kreativitas, kemampuan membaca dan karakteristik kepdibadian (seperti kejujuran dan kecemasan). Dikatakan konstruk karena semuanya merupakan konstruksi teoretik yang digunakan untuk menjelaskan tingkah laku. Validitas ini dilakukan selama pengembangandan uji coba instrumen didasarkan pada sekumpulan bukti dari berbagaimacam sumber yang berbeda.

Prosedur yang secara umum dilakukan terkait validitas kontruk:

  • Mengidentifikasi dan mendeskripsikan (melalui kerangka teoretik) makna konstruk yang diukur.
  • Menyusun dugaan (hipotesis) dengan mengacu pada teori yang mendasari konstruk.
  • Menguji kebenaran dugaan secara logis dan empiris.

3. Sensitivity (Kepekaan/sensitivitas)

Bila suatu instrumen mempunyai derajat validitas dan realibilitas yang tinggi, maka instrumen tersebut sensitif dalam mempertajam perbedaan derajat variasi karakteristik yang diukur. Rossi, et.al (2004:220) menjelaskan fungsi prinsip dari pengukuran outcome yakni untuk mendeteksi perubahan atau perbedaan yang terjadi pada outcome sebagai representasi dari pengaruh program. Karenanya pengukuran haruslah sensitif terhadap perubahan yang telah terjadi sekecil apapun itu. Misalnya dalam mengukur berat badan sebagai outcome program diet. Harus ditentukan timbangan dengan skala yang akurat untuk dapat mendeteksi perubahan/perbedaan berat badan yang telah terjadi sekecil apapun itu yang nantinya akan dikaji sebagai pengaruh dari program atau faktor lain. Review penelitian sebelumnya dapat menjadi dasar yang baik untuk menentukan skala yang presisi.

Mengawasi Outcome Program

Mengawasi outcome berarti menyediakan informasi yang relatif berguna dan berharga terhadap pengaruh program dalam jangka waktu yang proporsional. Berbeda dengan penilaian dampak, yang membutuhkan waktu bertahun-tahun, hasil pengawasan outcome dapat tersedia dalam hitungan bulan. Karena penilaian dampak melibatkan cakupan yang lebih luas dibandingkan dengan lingkup pengawasan outcome. Pembatasan ini menjadikan pengawasan hanya berhubungan dengan teknik mendapatkan umpan balik untuk membantu manajer dalam mengadministrasi dan memperbaiki program (Rossi, et.al, 2004:224). Skema pengawasan yang baik akan melibatkan indikator yang baik, yakni dapat menunjukkan pengaruh penting suatu program. Indikator pengawasan outcome hendaknya memenuhi ketentuan sebagai berikut :

  • Indikator outcome hendaknya hanya mengukur satu populasi sasaran yang benar-benar menerima layanan program.
  • Indikator outcome mengandung variabel yang dapat ditafsirkan cukup baik sebagai pengaruh layanan program, bukan karena faktor lain.
  • Indikator outcome termudah untuk langsung mengetahui kegiatan program berkenaan dengan kebermanfaatannya adalah kepuasan pelanggan.

Selain itu perlu diperhatikan jebakan yang seringkali terjadi dalam pengawasan outcome, yakni:

  • Pendiri program atau pembuat kebijakan memberi perhatian yang berlebihan terhadap salah satu indikator outcome.
  • Kecenderungan alami dari responden yang sedang dievaluasi (Corruptibility of indicators).
  • Penafsiran hasil dari indikator outcome.

Dalam menafsirkan data outcome yang telah dikumpulkan sebagai bagian dari pengawasan rutin harus dilengkapi dengan:

  • Informasi mengenai perubahan komposisi responden/peserta, demografi atau tren ekonomi yang relevan, dan sejenisnya.
  • Informasi mengenai proses dan pemanfaatan layanan.
  • Informasi mengenai kerangka kerja pengembangan yang meliputi standar dalam menilai baik atau buruknya suatu outcome yang dicapai.
  • Informasi hasil dari pengawasan variabel outcome program, atau perubahan pada beberapa variabel, secara umum harus diterjemahkan dalam basis pertimbangan para pengurus program, stakeholder, atau para ahli yang berhubungan dengan harapan baik dan buruk.

Outcome merupakan pernyataan populasi sasaran atau kondisi sosial yang diharapkan akan berhasil dicapai oleh suatu program. Agar dapat dievaluasi dengan baik maka outcome hendaknya dijabarkan dalam indikator yang lebih jelas, dapat diamati dan dapat diukur. Pengukuran yang dilakukan menggunakan jenis instrumen yang sesuai dengan memperhatikan realibilitas, validitas, dan sensitifitas instrumen yang nantinya akan sangat mempengaruhi interpretasi hasil pengukuran. Selain itu juga perlu diperhatikan faktor lain yang berpotensi mempengaruhi tingkat outcome sehingga perubahan yang terjadi benar-benar dapat diketahui sebagai pengaruh dari program.

Daftar Referensi

Kusaeri., Suprananto. (2012). Pengukuran dan penilaian pendidikan. Yogyakarta: Graha Ilmu.

Rossi, P. H., Lipsey, M. W., & Freeman, H. E. (2004). Evaluation: a Systematic Approach (7th ed.). California: Sage Publications.

Please follow and like us:

Tinggalkan Komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Suka dengan artikel ini? Please like and follow