Konsultan Obginsos sebagai Arsitek Sistem Evaluasi yang Berdampak
Semester 3 | Periode 2 | MK Evaluasi Program Kesehatan Reproduksi (4 SKS) | Sesi 2 | Modul 10
Dr.dr. Budi Siswanto, Sp.OG., Subsp.Obginsos., SH., S.Kom.
November 2025. Kantor Dr. Farid, Sulawesi Tenggara.
Satu tahun telah berlalu sejak rapat pertama di Jakarta yang membuatnya menyadari bahwa program KR senilai Rp 340 miliar berjalan tanpa data outcome yang sistematis.
Di mejanya kini ada: laporan evaluasi efektivitas 87 halaman, protokol pengumpulan data yang digunakan tim lapangan, analisis ekonomi yang meyakinkan Kepala Bappeda, rancangan evaluasi partisipatif yang lahir dari percakapan dengan Ibu Yati, dan laporan scaling readiness yang dipresentasikan di Kemenkes Jakarta.
Tapi yang paling ia perhatikan adalah sesuatu yang lebih kecil: sebuah WhatsApp dari Rini, bidan di Kabupaten A. "Pak Dokter, kami sekarang sudah bisa monitor sendiri pakai dashboard yang tim buat. Minggu lalu kami temukan Puskesmas X cakupannya turun drastis β kami langsung intervensi sebelum Dinkes tahu. Terima kasih sudah ajari kami cara baca data."
Dr. Farid membaca pesan itu dua kali.
Ini, pikirnya. Inilah yang sebenarnya berhasil. Bukan laporan 87 halamannya. Bukan presentasi di Jakarta. Tapi bidan di lapangan yang kini memiliki kapasitas dan kepercayaan diri untuk menggunakan data untuk keputusan mereka sendiri.
Ia membuka laptop dan mulai menulis β bukan laporan, tapi sebuah refleksi: Apa yang telah saya pelajari tentang menjadi evaluator program KR yang sesungguhnya berguna?
Modul penutup ini bukan ringkasan β semua konsep teknis sudah dibangun dalam modul-modul sebelumnya. Modul ini adalah sintesis: mengintegrasikan seluruh perjalanan evaluasi yang telah ditempuh, merefleksikan bagaimana semua elemen bekerja bersama sebagai suatu sistem, dan memproyeksikan ke depan β bagaimana lanskap evaluasi program KR akan berubah, dan apa artinya menjadi Subspesialis Obginsos yang tidak hanya mampu melakukan evaluasi, tetapi mampu membangun budaya evaluasi yang berkelanjutan dalam sistem kesehatan.
Setelah menyelesaikan modul ini, peserta didik mampu:
FONDASI (MODUL 1β2):
IMPLEMENTASI (MODUL 3β4):
UTILISASI (MODUL 5):
KEDALAMAN (MODUL 6β9):
Konteks: Proliferasi smartphone dan konektivitas internet memungkinkan pengumpulan data real-time dari fasilitas terpencil. Platform digital (ODK, KoBoToolbox, DHIS2) sudah banyak digunakan di Indonesia
Potensi:
Tantangan:
Potensi:
Keterbatasan Kritis:
Konteks: Program KR beroperasi dalam sistem adaptif kompleks β sistem yang memiliki banyak aktor yang saling berinteraksi, non-linear, dan berubah sebagai respons terhadap intervensi
Masalah: Evaluasi konvensional yang mengasumsikan hubungan linier antara intervensi dan outcome sering tidak cukup untuk sistem yang kompleks
Pendekatan evaluasi yang lebih sesuai untuk kompleksitas:
Konteks: Tekanan global yang meningkat untuk memastikan bahwa program KR tidak hanya efektif secara rata-rata, tetapi mengurangi ketidaksetaraan
Equity-focused evaluation secara eksplisit menilai:
Memerlukan: disaggregated data yang konsisten, analisis interseksionalitas, dan keterlibatan aktif kelompok yang paling terpinggirkan
Konteks: Gerakan global untuk open data dan transparansi dalam penelitian kesehatan semakin kuat
Praktik yang berkembang:
Memiliki kombinasi yang langka:
Risiko: terperangkap dalam peran klinis yang sempit dan tidak pernah mengaktualisasikan potensi kepemimpinan sistem ini
Modul 10 diikuti oleh Quiz 2 Sesi 2 pada Minggu ke-10 dan Examination pada Minggu ke-11. Thread diskusi di bawah ini adalah refleksi penutup seluruh mata kuliah.
Pertanyaan 1: Rini, bidan yang memodifikasi program dengan grup WhatsApp, kini mampu memonitor data program secara mandiri dan mengintervensi masalah sebelum eskalasi. Dr. Farid menyimpulkan bahwa "ini yang sebenarnya berhasil" β kapasitas lokal yang terbangun, bukan laporan 87 halaman. (a) Apakah Anda setuju dengan kesimpulan Dr. Farid? Apa argumen yang mendukung dan menentangnya? (b) Implikasi apa yang ditarik dari ini untuk cara Anda akan merancang evaluasi program KR di masa depan β khususnya tentang siapa yang harus menjadi pemilik data dan proses M&E? (c) Bagaimana Anda akan mengukur keberhasilan "membangun kapasitas evaluasi lokal" sebagai outcome program evaluasi itu sendiri?
Pertanyaan 2: Anda diminta merancang sistem M&E untuk program KR baru di kabupaten Anda dengan anggaran M&E Rp 150 juta per tahun untuk 5 tahun. Program mencakup tiga komponen: layanan KB pasca persalinan di Puskesmas, peer education remaja di sekolah, dan konseling pasangan pra-nikah di KUA. (a) Rancang results framework dengan tidak lebih dari 12 indikator total (4 per komponen) yang mencakup semua level dari output hingga impact. (b) Alokasikan Rp 150 juta ke aktivitas M&E yang berbeda β monitoring rutin, evaluasi mid-term, evaluasi summative, dan capacity building β dengan justifikasi untuk setiap alokasi. (c) Identifikasikan satu inovasi dari tren evaluasi masa depan yang akan Anda integrasikan ke dalam sistem M&E ini, dan jelaskan bagaimana ia akan meningkatkan kualitas atau efisiensi M&E.
Mata Kuliah: Evaluasi Program Kesehatan Reproduksi
Semester 3 | Periode 2 | Sesi 2
| Petunjuk Teknis | Detail |
|---|---|
| Jenis Penilaian | Quiz Kedua β Sesi 2 |
| Minggu | Minggu ke-10 |
| Cakupan Materi | Modul 6β10 (Sesi 2) |
| Jumlah Soal | 10 soal pilihan ganda |
| Bobot Nilai | 10% dari nilai akhir mata kuliah |
| Waktu Pengerjaan | 30 menit |
| Pengerjaan | Individual, closed book |
| Format Jawaban | Pilih satu jawaban yang paling tepat (A/B/C/D) |
Program peer education KR remaja terbukti efektif dalam RCT yang dilaksanakan di satu kota besar di Jawa. Ketika direplikasi di 80 Puskesmas seluruh Indonesia, efektivitasnya turun drastis. Fenomena ini paling tepat dijelaskan oleh konsep:
Evaluasi implementasi di 12 Puskesmas menemukan bahwa skor fidelity rata-rata adalah 71% β namun tiga Puskesmas dengan skor fidelity tertinggi (>85%) menunjukkan outcome yang tidak lebih baik dari Puskesmas dengan skor fidelity 65β75%. Interpretasi yang paling tepat adalah:
Analisis biaya program KB menunjukkan: Strategi A (konseling klinik) biaya per klien Rp 220.000, proporsi akseptor 48%. Strategi B (konseling komunitas mobile) biaya per klien Rp 145.000, proporsi akseptor 55%. ICER Strategi B vs. A adalah:
Seorang evaluator menggunakan Photovoice dengan remaja perempuan peserta program KR. Salah satu peserta memfoto pintu masuk Puskesmas yang sempit dan gelap, dengan keterangan: "Di sinilah kami berhenti. Bukan karena tidak mau masuk, tapi karena malu dilihat orang-orang yang lewat." Kontribusi data ini untuk evaluasi program yang paling tepat adalah:
Evaluasi gender-responsive menemukan bahwa program KB pasca persalinan memiliki cakupan 68% β tetapi analisis lebih lanjut mengungkapkan bahwa 41% akseptor KB memilih metode IUD bukan karena preferensi mereka sendiri, melainkan karena tekanan halus dari bidan yang ingin memenuhi target program. Dari perspektif evaluasi KR yang komprehensif, temuan ini menunjukkan bahwa:
Sebuah program KR remaja memiliki bukti efektivitas yang kuat (RCT, Cohen's d = 0.68) tetapi Sustainability Scorecard menunjukkan skor 1/4 untuk "stabilitas pendanaan" (78% bergantung pada satu donor internasional yang kontraknya berakhir dalam 18 bulan) dan skor 1/4 untuk "kapasitas organisasi" (dua dari tiga staf kunci sedang dalam proses resign). Rekomendasi yang paling tepat adalah:
Evaluator menggunakan realist evaluation (CMO framework) untuk menilai transferabilitas program peer education KR dari Jawa ke Papua. CMO yang diidentifikasikan: "Ketika remaja memiliki peer group yang kohesif dan kepercayaan tinggi antar anggota [Context], pengaruh normatif dari peer educator mengubah intensi perilaku [Mechanism], menghasilkan peningkatan utilisasi layanan KR [Outcome]." Data etnografis awal dari target komunitas di Papua menunjukkan bahwa peer group remaja sangat kohesif tetapi kepercayaan terhadap outsider (termasuk peer educator yang dikirim dari program) sangat rendah. Implikasi untuk transferabilitas adalah:
Dr. Farid merefleksikan bahwa pencapaian terpenting dari satu tahun evaluasi bukan laporan 87 halamannya, tetapi bidan Rini yang kini mampu memonitor data secara mandiri. Jenis utilisasi evaluasi yang paling tepat menggambarkan dampak pada Rini adalah:
Sebuah NGO mengklaim bahwa AI dapat sepenuhnya menggantikan thematic analysis manual dalam evaluasi kualitatif program KR karena lebih cepat, lebih konsisten, dan tidak memiliki bias subjektif evaluator. Kelemahan paling fundamental dari klaim ini adalah:
Seorang Subspesialis Obginsos baru diangkat sebagai Kepala Bidang Kesehatan Masyarakat di Dinkes Provinsi. Ia ingin membangun budaya evaluasi dalam sistem. Dari perspektif "evaluation champion", tindakan yang paling strategis dan berdampak jangka panjang adalah:
(Untuk Dosen β Tidak Didistribusikan kepada Peserta Didik)
Soal 1 β Jawaban: B
Voltage drop adalah fenomena di mana program yang efektif dalam pilot kehilangan efektivitas ketika diperbesar karena kondisi pilot yang tidak terduplikasi: tim champion, supervisi intensif, sumber daya berlebih, dan fokus perhatian yang tinggi. Scaling ke 80 Puskesmas berarti program diimplementasikan oleh staf yang berbeda, dengan supervisi minimal, dalam kondisi sistem yang jauh lebih heterogen. Selection bias (A) relevan untuk validitas internal RCT, bukan untuk fenomena voltage drop dalam scaling. History threat (C) dan attrition bias (D) adalah ancaman validitas yang tidak menjelaskan penurunan efektivitas sistematis dalam scaling.
Soal 2 β Jawaban: B
Temuan ini konsisten dengan threshold effect β ada level fidelity minimum yang diperlukan agar program bekerja, tetapi di atas threshold itu, peningkatan fidelity lebih lanjut tidak meningkatkan outcome karena faktor lain (kualitas fasilitator, konteks komunitas, dukungan keluarga) lebih menentukan. Ini adalah temuan yang sangat berguna: bukan "maximalism fidelity" yang menjadi tujuan, tetapi "sufficient fidelity" yang disertai perhatian pada faktor kontekstual. Opsi A mungkin perlu dipertimbangkan tetapi kesimpulan berdasarkan pola data yang ada adalah B. Opsi C adalah spekulasi tanpa bukti. Opsi D adalah penolakan temuan yang tidak berdasar.
Soal 3 β Jawaban: A
ICER = (Biaya B - Biaya A) / (Efek B - Efek A) = (145.000 - 220.000) / (0.55 - 0.48) = -75.000 / 0.07 = -Rp 1.071.429. ICER negatif karena Strategi B lebih murah DAN lebih efektif β ini adalah dominance (Kuadran 2 dalam four-quadrant framework). Strategi B menghemat Rp 75.000 per klien sekaligus menghasilkan 7% lebih banyak akseptor. Rekomendasi jelas: pilih Strategi B.
Soal 4 β Jawaban: B
Foto dan keterangan Ibu remaja ini adalah data kualitatif yang valid dan sangat informatif β mengungkapkan hambatan akses yang bersifat fisik (pintu sempit, gelap) sekaligus sosial (rasa malu karena terlihat masuk fasilitas KR). Ini menjelaskan gap antara ketersediaan layanan dan utilisasi yang tidak dapat ditangkap oleh survei cakupan. Opsi A salah β representativitas statistik bukan kriteria validitas untuk data kualitatif partisipatif. Opsi C salah β konfirmasi kuantitatif tidak selalu diperlukan untuk data kualitatif yang valid. Opsi D salah β data yang diproduksi oleh komunitas adalah inti dari Photovoice.
Soal 5 β Jawaban: A
Evaluasi KR yang komprehensif harus mengukur bukan hanya cakupan tetapi kualitas consent dan otonomi reproduktif. Cakupan 68% dengan consent yang bermasalah bukan keberhasilan yang sama dengan 68% dengan consent yang benar-benar informed. Kedua dimensi harus dilaporkan secara jelas. Opsi B mengabaikan dimensi hak yang fundamental. Opsi C adalah respons yang tidak sesuai dengan peran evaluator (bukan investigator hukum). Opsi D menunda kesimpulan yang sudah dapat ditarik dari data yang ada.
Soal 6 β Jawaban: B
Program dengan dua dimensi keberlanjutan yang sangat rendah (pendanaan dan kapasitas) berisiko kolaps bahkan sebelum scaling selesai dilaksanakan. Scaling program yang tidak berkelanjutan hanya memperbesar skala kegagalan yang akan terjadi. Investasi dalam memperkuat keberlanjutan sebelum scaling adalah keputusan yang bertanggung jawab. Opsi A mengabaikan risiko keberlanjutan yang nyata. Opsi C terlalu ekstrim β masalah keberlanjutan dapat diatasi. Opsi D adalah kompromi yang tidak realistis karena dua masalah kritis tidak dapat diselesaikan secara paralel dengan scaling yang memerlukan perhatian dan sumber daya yang sama.
Soal 7 β Jawaban: B
CMO mengidentifikasikan bahwa mekanisme (pengaruh normatif) bergantung pada kepercayaan antara peer educator dan target β bukan hanya kohesivitas dalam kelompok. Jika peer educator adalah outsider yang tidak dipercaya, mekanisme tidak akan bekerja meskipun peer group kohesif. Solusinya adalah adaptasi: rekrut peer educator dari dalam komunitas itu sendiri. Ini adalah contoh modifikasi adaptable element (siapa peer educator) yang mempertahankan core component (mekanisme pengaruh normatif). Opsi A terlalu pesimistik β masalah dapat diatasi dengan adaptasi. Opsi C tidak diperlukan karena CMO analysis sudah memberikan arah yang jelas. Opsi D salah β kepercayaan terhadap peer educator adalah bagian dari context yang mengaktifkan mechanism.
Soal 8 β Jawaban: B
Process use adalah jenis utilisasi di mana manfaat terjadi karena keterlibatan dalam proses evaluasi, bukan dari temuan evaluasi itu sendiri. Rini membangun kapasitas dan kepercayaan dirinya melalui proses bekerja bersama tim evaluasi β bukan karena membaca laporan 87 halaman. Ini sering merupakan dampak yang paling berkelanjutan dari evaluasi partisipatif. Instrumental use (A) adalah perubahan keputusan langsung berdasarkan temuan. Conceptual use (C) adalah perubahan cara berpikir berdasarkan temuan. Symbolic use (D) tentang legitimasi program, bukan kapasitas individu.
Soal 9 β Jawaban: B
Kelemahan fundamental AI dalam evaluasi kualitatif adalah bahwa thematic analysis yang baik bukan sekadar pattern recognition dalam teks β ini adalah proses interpretif yang melibatkan pemahaman konteks sosial-budaya, relasi kekuasaan, dan implikasi kebijakan yang memerlukan judgment manusia. AI dapat membantu coding awal, tetapi interpretasi makna dan relevansi kebijakan memerlukan evaluator manusia yang memahami konteks. Opsi A tentang bahasa Indonesia mungkin relevan tapi bukan kelemahan "paling fundamental." Opsi C dan D tidak relevan dengan pertanyaan tentang validitas metodologis.
Soal 10 β Jawaban: B
Evaluation champion yang paling berdampak adalah yang membangun sistem di mana staf di semua level memiliki kapasitas dan rasa kepemilikan terhadap data, dan menggunakannya untuk keputusan nyata sehari-hari. Ini jauh lebih berkelanjutan dari evaluasi oleh konsultan eksternal (A) yang tidak membangun kapasitas lokal. Publikasi (C) penting untuk diseminasi tetapi bukan strategi budaya evaluasi. Kebijakan anggaran (D) adalah enabling condition yang berguna tetapi tidak cukup tanpa perubahan budaya yang aktif dibangun.
Malang, Maret 2026
Penyusun
Mata Kuliah: Evaluasi Program Kesehatan Reproduksi
Semester 3 | Periode 2 | Sesi 2
| Petunjuk Teknis | Detail |
|---|---|
| Jenis Penilaian | Ujian Akhir β Sesi 2 (Examination) |
| Minggu | Minggu ke-11 |
| Cakupan Materi | Modul 1β10 (Seluruh Mata Kuliah) |
| Jumlah Soal | 3 soal esai analitik |
| Bobot Nilai | 30% dari nilai akhir mata kuliah |
| Waktu Pengerjaan | 180 menit (3 jam) |
| Pengerjaan | Individual, open book terbatas (catatan pribadi dan modul β tidak boleh menggunakan internet atau berkomunikasi dengan sesama peserta) |
| Format Luaran | Essay Word atau PDF, dikumpulkan melalui LMS |
| Panjang | Total 2.500β3.500 kata untuk ketiga soal |
Anda adalah Subspesialis Obginsos yang baru dilantik sebagai Direktur Program Kesehatan Reproduksi di sebuah provinsi kepulauan dengan 22 kabupaten β 7 kabupaten relatif urban dan terhubung baik, 15 kabupaten rural dan terpencil dengan akses terbatas. AKI provinsi 287/100.000 KH (di atas rata-rata nasional 183). Angka kehamilan remaja 42/1.000 perempuan 15-19 tahun (dua kali rata-rata nasional). Cakupan KB modern 41% (jauh di bawah target nasional 63%).
Gubernur baru memberikan Anda mandat yang jelas: "Turunkan AKI dan tingkatkan cakupan KB dalam 5 tahun." Anggaran program KR provinsi: Rp 28 miliar per tahun. Anda memiliki tim 8 orang di provinsi dan berkoordinasi dengan 22 Dinas Kesehatan kabupaten.
Tiga bulan pertama, Anda melakukan rapid assessment dan menemukan:
(Target panjang: 900β1.100 kata)
Berdasarkan skenario di atas, rancang sistem evaluasi program KR provinsi untuk 5 tahun ke depan.
Jawaban Anda harus mencakup:
1a. Prioritisasi Evaluasi (Β±200 kata)
Dari empat program yang berjalan, Anda tidak memiliki sumber daya untuk mengevaluasi semuanya secara mendalam dalam tahun pertama. Gunakan kerangka analitik yang dipelajari dalam MK ini untuk memprioritaskan program mana yang harus dievaluasi pertama, dan program mana yang dapat menunggu. Berikan justifikasi berbasis bukti β bukan berdasarkan preferensi atau popularitas program.
1b. Desain Evaluasi untuk Program Prioritas (Β±400 kata)
Untuk program yang Anda pilih sebagai prioritas pertama:
1c. Sistem M&E Terintegrasi (Β±400 kata)
Rancang kerangka sistem M&E provinsi yang akan diterapkan di semua 22 kabupaten:
(Target panjang: 900β1.100 kata)
Dua kabupaten terpencil menolak kunjungan tim program KR dengan alasan nilai lokal. Sementara itu, NGO internasional yang mengelola program KR dalam situasi bencana di kabupaten pesisir mengklaim program mereka "evidence-based" berdasarkan RCT dari Bangladesh β dan meminta Anda untuk mengadopsinya di semua kabupaten sebagai program unggulan.
2a. Strategi Keterlibatan Dua Kabupaten yang Menolak (Β±350 kata)
Gunakan konsep dari Modul 8 (evaluasi partisipatif, gender-responsive, dan power dynamics) dan Modul 9 (transferabilitas dan konteks) untuk merancang strategi keterlibatan yang:
2b. Penilaian Kritis terhadap Klaim NGO (Β±400 kata)
Program KR dalam situasi bencana dari Bangladesh diklaim efektif berdasarkan RCT yang kuat. Menggunakan kerangka transferabilitas (CMO framework dari Modul 9):
2c. Mengelola Tekanan Eksternal (Β±250 kata)
NGO internasional tersebut juga menjadi donor utama untuk dua program KR lain di provinsi Anda. Mereka menyampaikan secara tidak langsung bahwa dukungan finansial mereka bergantung pada adopsi program mereka sebagai unggulan. Bagaimana Anda mengelola situasi ini sebagai Direktur Program yang berkomitmen pada integritas evaluasi dan kepentingan terbaik perempuan di provinsi Anda? Berikan respons yang konkret, etis, dan realistis β bukan hanya prinsipil.
(Target panjang: 700β900 kata)
Lima tahun telah berlalu. Mandat Gubernur hampir berakhir. AKI turun dari 287 menjadi 231/100.000 KH. Cakupan KB modern naik dari 41% menjadi 57%. Angka kehamilan remaja turun dari 42 menjadi 29/1.000.
Namun dalam pertemuan tim, seorang staf muda mengajukan pertanyaan yang mengganggu: "Pak/Bu Direktur, apakah kita bisa klaim bahwa perubahan ini karena program kita? Atau mungkin karena program JKN yang diperluas, atau karena media sosial yang mengubah pengetahuan remaja, atau karena bencana alam yang memaksa konsolidasi layanan kesehatan? Kita tidak punya kelompok kontrol."
3a. Menjawab Pertanyaan Staf dengan Jujur (Β±300 kata)
Berikan jawaban yang jujur, metodologis kuat, dan dapat digunakan untuk komunikasi kebijakan kepada Gubernur. Jawaban Anda harus:
3b. Refleksi Pembelajaran (Β±250 kata)
Dari seluruh perjalanan 5 tahun ini, identifikasikan:
3c. Mewariskan Sistem (Β±250 kata)
Masa jabatan Anda akan berakhir dalam 6 bulan. Pengganti Anda belum ditentukan. Apa yang akan Anda lakukan dalam 6 bulan terakhir untuk memastikan bahwa kapasitas evaluasi yang telah dibangun tidak hilang bersama kepergian Anda? Rancang tiga tindakan prioritas yang konkret, dengan justifikasi mengapa ketiga tindakan itu β dan bukan tindakan lain β yang paling kritis untuk keberlanjutan sistem evaluasi.
| Soal | Komponen | Indikator Penilaian | Bobot |
|---|---|---|---|
| Soal 1 | 1a β Prioritisasi | Ketajaman argumen; penggunaan kerangka yang tepat; keberanian membuat prioritas yang jelas | 8% |
| 1b β Desain | Koherensi pertanyaan-desain-data; ketepatan pertimbangan etis; realisme konteks | 15% | |
| 1c β Sistem M&E | Ketepatan indikator; realisme pengelolaan variasi kapasitas; konkretnya mekanisme feedback; realisme alokasi anggaran | 12% | |
| Soal 2 | 2a β Strategi keterlibatan | Keseimbangan penghormatan nilai lokal dan tanggung jawab kesehatan; ketepatan entry points; kejujuran tentang keterbatasan | 12% |
| 2b β Penilaian klaim NGO | Ketepatan konstruksi CMO; kedalaman penilaian konteks; keberanian dan kejernihan rekomendasi | 15% | |
| 2c β Tekanan eksternal | Realisme respons; integritas etis; konkretnya tindakan | 8% | |
| Soal 3 | 3a β Kontribusi vs. atribusi | Kejujuran metodologis; kekuatan argumen contribution analysis; ketepatan confidence statement | 12% |
| 3b β Refleksi | Kedalaman dan kejujuran refleksi; spesifisitas pembelajaran | 8% | |
| 3c β Mewariskan sistem | Prioritisasi yang tepat; konkretnya tindakan; justifikasi yang kuat | 10% |
Examination ini dirancang sebagai ujian sintesis komprehensif yang mengintegrasikan semua Modul 1β10. Tidak ada kunci jawaban tunggal yang benar β rubrik penilaian menggunakan indikator kualitatif yang menilai kualitas argumentasi, kedalaman analisis, dan kejujuran intelektual. Direkomendasikan untuk menggunakan blind scoring: penilai tidak mengetahui identitas peserta saat menilai. Diskrepansi antar penilai yang lebih dari satu level (misal: satu penilai memberi A dan penilai lain memberi C untuk soal yang sama) perlu didiskusikan dalam tim sebelum nilai final ditetapkan.
Malang, Maret 2026
Penyusun