Modul 10: Integrasi dan Masa Depan Evaluasi Program Kesehatan Reproduksi

📋 Daftar Isi Modul

A. Deskripsi Modul
B. Capaian Pembelajaran
C. Materi Inti
D. Pertanyaan Diskusi
E. Rangkuman
F. Referensi
Quiz 2 — Sesi 2
Examination — Sesi 2

A. Deskripsi Modul

November 2025. Kantor Dr. Farid, Sulawesi Tenggara.

Satu tahun telah berlalu sejak rapat pertama di Jakarta yang membuatnya menyadari bahwa program KR senilai Rp 340 miliar berjalan tanpa data outcome yang sistematis.

Di mejanya kini ada: laporan evaluasi efektivitas 87 halaman, protokol pengumpulan data yang digunakan tim lapangan, analisis ekonomi yang meyakinkan Kepala Bappeda, rancangan evaluasi partisipatif yang lahir dari percakapan dengan Ibu Yati, dan laporan scaling readiness yang dipresentasikan di Kemenkes Jakarta.

Tapi yang paling ia perhatikan adalah sesuatu yang lebih kecil: sebuah WhatsApp dari Rini, bidan di Kabupaten A. "Pak Dokter, kami sekarang sudah bisa monitor sendiri pakai dashboard yang tim buat. Minggu lalu kami temukan Puskesmas X cakupannya turun drastis — kami langsung intervensi sebelum Dinkes tahu. Terima kasih sudah ajari kami cara baca data."

Dr. Farid membaca pesan itu dua kali.

Ini, pikirnya. Inilah yang sebenarnya berhasil. Bukan laporan 87 halamannya. Bukan presentasi di Jakarta. Tapi bidan di lapangan yang kini memiliki kapasitas dan kepercayaan diri untuk menggunakan data untuk keputusan mereka sendiri.

Ia membuka laptop dan mulai menulis — bukan laporan, tapi sebuah refleksi: Apa yang telah saya pelajari tentang menjadi evaluator program KR yang sesungguhnya berguna?

Modul penutup ini bukan ringkasan — semua konsep teknis sudah dibangun dalam modul-modul sebelumnya. Modul ini adalah sintesis: mengintegrasikan seluruh perjalanan evaluasi yang telah ditempuh, merefleksikan bagaimana semua elemen bekerja bersama sebagai suatu sistem, dan memproyeksikan ke depan — bagaimana lanskap evaluasi program KR akan berubah, dan apa artinya menjadi Subspesialis Obginsos yang tidak hanya mampu melakukan evaluasi, tetapi mampu membangun budaya evaluasi yang berkelanjutan dalam sistem kesehatan.

B. Capaian Pembelajaran Modul

Setelah menyelesaikan modul ini, peserta didik mampu:

Mengintegrasikan seluruh kompetensi evaluasi yang dibangun dalam MK ini menjadi kerangka kerja evaluasi yang kohesif
Merancang sistem monitoring dan evaluasi yang berkelanjutan untuk program KR yang dipimpinnya
Mengidentifikasi tren dan inovasi dalam evaluasi program KR yang relevan untuk praktik masa depan
Merefleksikan peran Subspesialis Obginsos sebagai pemimpin evaluasi dalam sistem kesehatan Indonesia
Mengembangkan rencana pengembangan kapasitas evaluasi pribadi yang konkret dan berbasis konteks

C. Materi Inti

C.1. Integrasi: Evaluasi sebagai Sistem, Bukan Kumpulan Teknik

C.1.1. Peta Perjalanan Evaluasi yang Telah Ditempuh

🗺️ SEMBILAN MODUL, SATU SISTEM:

FONDASI (MODUL 1–2):

Modul 1: Evaluasi bukan sekadar pengumpulan data — ia adalah proses terstruktur untuk menghasilkan pengetahuan yang berguna untuk keputusan
Modul 2: Desain adalah keputusan paling fundamental — pertanyaan yang salah menghasilkan data yang tidak berguna betapapun rigornya pengumpulan

IMPLEMENTASI (MODUL 3–4):

Modul 3: Data yang baik memerlukan instrumen yang valid, sampling yang tepat, dan prosedur yang konsisten
Modul 4: Analisis yang rigoros memerlukan rencana yang dibuat sebelum menyentuh data, effect size di samping p-value, dan integrasi kuantitatif-kualitatif yang sejati

UTILISASI (MODUL 5):

Modul 5: Evaluasi yang tidak digunakan adalah evaluasi yang gagal — laporan, policy brief, dan strategi utilisasi adalah bagian integral dari evaluasi, bukan afterthought

KEDALAMAN (MODUL 6–9):

Modul 6: Implementasi adalah jembatan antara desain dan dampak — fidelity, adaptasi, dan konteks menentukan apakah program yang efektif dalam teori menjadi efektif dalam praktik
Modul 7: Nilai ekonomi adalah bahasa yang harus dikuasai untuk advokasi kebijakan yang efektif
Modul 8: Legitimasi evaluasi bergantung pada siapa yang terlibat dan apakah relasi kekuasaan diperhatikan
Modul 9: Dampak jangka panjang memerlukan perhatian eksplisit pada skalabilitas, keberlanjutan, dan transferabilitas

🔗 BAGAIMANA SEMUA INI BEKERJA BERSAMA:

💡 Evaluasi yang benar-benar berguna bukan tentang menguasai setiap teknik secara terpisah — tetapi tentang mengorkestrasi semua elemen menjadi satu proses yang kohesif

📋 URUTAN KEPUTUSAN:

🔍 SEBELUM EVALUASI

Siapa pengguna evaluasi dan apa keputusan yang akan diinformasikan?
Pertanyaan evaluasi mana yang paling penting dan feasible?
Desain apa yang paling tepat untuk pertanyaan tersebut?
Bagaimana komunitas akan dilibatkan?
Bagaimana dimensi gender akan diperhatikan?

⚙️ SELAMA EVALUASI

Apakah instrumen mengukur apa yang dimaksud?
Apakah prosedur lapangan menjaga kualitas data?
Apakah analisis mengikuti rencana yang ditetapkan sebelumnya?
Apakah temuan kuantitatif dan kualitatif benar-benar diintegrasikan?

📤 SETELAH EVALUASI

Apakah laporan menjawab pertanyaan yang ditetapkan di awal?
Apakah rekomendasi spesifik, actionable, dan diprioritaskan?
Apakah strategi utilisasi aktif dijalankan?
Apakah evaluasi membangun kapasitas lokal — bukan hanya menghasilkan laporan?

C.1.2. Monitoring dan Evaluasi sebagai Sistem Terpadu

📊 PERBEDAAN MONITORING DAN EVALUASI:

📈 MONITORING

Pengumpulan data rutin dan berkelanjutan tentang implementasi dan output
Pertanyaan: "Apakah program berjalan sesuai rencana?"
Frekuensi: bulanan atau kuartalan
Pengguna utama: manajer program untuk koreksi kursus real-time
Sumber data: sistem informasi rutin, laporan staf

🔍 EVALUASI

Penilaian periodik yang lebih mendalam tentang efektivitas, efisiensi, dan relevansi
Pertanyaan: "Apakah program menghasilkan dampak yang diinginkan dan mengapa?"
Frekuensi: mid-term (2–3 tahun) dan summative (akhir program)
Pengguna utama: pembuat kebijakan dan donor untuk keputusan strategis
Sumber data: data monitoring + pengumpulan data primer khusus

🔄 INTEGRATED M&E SYSTEM

Sistem M&E yang baik tidak memisahkan kedua fungsi ini secara kaku
Data monitoring yang berkualitas tinggi adalah fondasi evaluasi yang efisien
Evaluasi menghasilkan pembelajaran yang memperbaiki indikator monitoring

🛠️ MERANCANG SISTEM M&E PROGRAM KR:

RESULTS FRAMEWORK: Visualisasi hierarki hasil: input → aktivitas → output → outcome jangka pendek → outcome jangka menengah → impact. Setiap level memiliki indikator yang dapat diukur. Asumsi antar level harus eksplisit (ini adalah ToC yang divisualisasikan)
INDICATOR SELECTION: Untuk setiap level hasil: pilih indikator yang SMART (Specific, Measurable, Achievable, Relevant, Time-bound). Prioritaskan: tidak lebih dari 3–5 indikator per level. Gunakan indikator standar internasional jika tersedia (MEASURE Evaluation indicators for reproductive health). Pastikan ada keseimbangan: indikator kuantitatif DAN kualitatif, indikator proses DAN outcome, indikator disaggregated berdasarkan gender dan wilayah
DATA COLLECTION PLAN: Untuk setiap indikator: sumber data, frekuensi pengumpulan, siapa yang bertanggung jawab, metode verifikasi. Prioritaskan data yang sudah ada dalam sistem sebelum membuat sistem baru. Pertimbangkan beban pelaporan pada staf lapangan
DATA USE MECHANISMS: Review meeting bulanan: staf program mereview data monitoring dan membuat keputusan koreksi. Quarterly dashboard: visualisasi progress terhadap target untuk semua stakeholder. Annual learning review: lebih mendalam, melibatkan komunitas dan mitra. Mid-term dan summative evaluation: dilakukan oleh evaluator independen
ADAPTIVE MANAGEMENT: M&E bukan hanya untuk akuntabilitas — tapi untuk pembelajaran dan adaptasi. Adaptive management: menggunakan data secara reguler untuk menyesuaikan program berdasarkan apa yang berhasil dan tidak berhasil. Memerlukan: culture of learning (bukan culture of compliance), fleksibilitas anggaran untuk adaptasi, dan kepemimpinan yang menoleransi dan belajar dari kegagalan

C.2. Inovasi dan Masa Depan Evaluasi Program KR

C.2.1. Tren yang Akan Membentuk Evaluasi KR di Masa Depan

📱 TREN 1 — DIGITAL DATA DAN REAL-TIME MONITORING

Konteks: Proliferasi smartphone dan konektivitas internet memungkinkan pengumpulan data real-time dari fasilitas terpencil. Platform digital (ODK, KoBoToolbox, DHIS2) sudah banyak digunakan di Indonesia

Potensi:

Eliminasi data entry manual yang rawan error
Feedback loop yang jauh lebih cepat dari sistem pelaporan kertas
Geo-tagging untuk analisis spasial
Passive data collection: data dari interaksi rutin (mis. penggunaan aplikasi kesehatan)

Tantangan:

Digital divide: tidak semua fasilitas dan petugas memiliki akses dan kapasitas digital yang memadai
Data security: data kesehatan reproduksi yang sensitif dalam sistem digital memerlukan perlindungan yang kuat
Garbage in, garbage out: digitalisasi sistem yang buruk menghasilkan data buruk lebih cepat

🤖 TREN 2 — MACHINE LEARNING DAN AI DALAM EVALUASI

Potensi:

AI dapat menganalisis dataset besar untuk mengidentifikasikan pola yang tidak terlihat oleh analisis konvensional
Natural Language Processing (NLP) untuk analisis data kualitatif dalam skala besar
Predictive analytics: mengidentifikasikan area atau populasi dengan risiko tinggi sebelum masalah terjadi

Keterbatasan Kritis:

AI tidak dapat menggantikan judgment evaluator tentang makna dan implikasi
Bias dalam data training akan direplikasi dan diperbesar oleh AI
Explainability: "black box" model sulit dikomunikasikan kepada pembuat kebijakan
Untuk evaluasi KR: dimensi etis, kekuasaan, dan hak yang tidak terukur tidak dapat ditangkap oleh AI

🕸️ TREN 3 — COMPLEXITY-AWARE EVALUATION

Konteks: Program KR beroperasi dalam sistem adaptif kompleks — sistem yang memiliki banyak aktor yang saling berinteraksi, non-linear, dan berubah sebagai respons terhadap intervensi

Masalah: Evaluasi konvensional yang mengasumsikan hubungan linier antara intervensi dan outcome sering tidak cukup untuk sistem yang kompleks

Pendekatan evaluasi yang lebih sesuai untuk kompleksitas:

Developmental evaluation (Patton): evaluasi yang belajar dan beradaptasi bersama program yang masih berkembang
Systems evaluation: menilai perubahan dalam sistem secara keseluruhan, bukan hanya output program
Contribution analysis: membangun argumen tentang kontribusi dalam sistem yang kompleks di mana attribution murni tidak mungkin

⚖️ TREN 4 — EQUITY-FOCUSED EVALUATION

Konteks: Tekanan global yang meningkat untuk memastikan bahwa program KR tidak hanya efektif secara rata-rata, tetapi mengurangi ketidaksetaraan

Equity-focused evaluation secara eksplisit menilai:

Siapa yang mendapat manfaat dan siapa yang tidak?
Apakah gap antar kelompok mengecil atau membesar?
Apakah program memperkuat atau melemahkan posisi kelompok yang paling rentan?

Memerlukan: disaggregated data yang konsisten, analisis interseksionalitas, dan keterlibatan aktif kelompok yang paling terpinggirkan

🌐 TREN 5 — OPEN EVALUATION DAN TRANSPARANSI DATA

Konteks: Gerakan global untuk open data dan transparansi dalam penelitian kesehatan semakin kuat

Praktik yang berkembang:

Pre-registration evaluasi: mendaftarkan pertanyaan evaluasi dan metode analisis sebelum pengumpulan data dimulai untuk mencegah fishing for significance
Open access publication: temuan evaluasi program publik seharusnya dapat diakses publik
Data sharing: data evaluasi yang di-anonymize dapat digunakan ulang oleh peneliti lain untuk analisis sekunder

C.3. Peran Subspesialis Obginsos sebagai Pemimpin Evaluasi

C.3.1. Melampaui Kompetensi Teknis: Kepemimpinan Evaluasi

🎯 MENGAPA SUBSP. OBGINSOS ADALAH EVALUATOR YANG UNIK

Memiliki kombinasi yang langka:

Kompetensi klinis yang mendalam tentang kesehatan reproduksi
Pemahaman sistem kesehatan dari perspektif yang komprehensif
Posisi dalam sistem yang memungkinkan akses ke data, pengambil keputusan, dan komunitas
Legitimasi profesional yang membuat temuan evaluasi lebih dipercaya

Risiko: terperangkap dalam peran klinis yang sempit dan tidak pernah mengaktualisasikan potensi kepemimpinan sistem ini

👑 TIGA PERAN KEPEMIMPINAN EVALUASI:

🩺 PERAN 1 — EVALUATOR LANGSUNG

Merancang dan melaksanakan evaluasi program KR secara langsung
Kompetensi teknis dari MK ini diperlukan
Paling sering dalam konteks: evaluasi program rumah sakit, evaluasi program wilayah sebagai ketua tim

📋 PERAN 2 — COMMISSIONER DAN MANAJER EVALUASI

Menugaskan dan mengelola evaluator eksternal
Kompetensi yang diperlukan: mampu merumuskan Terms of Reference yang baik, menilai kualitas proposal metodologis, dan memberikan feedback kritis terhadap laporan evaluasi
Paling sering dalam konteks: sebagai Kepala Bidang Dinkes, direktur program, atau posisi manajerial lain

🚀 PERAN 3 — EVALUATION CHAMPION

Membangun budaya evaluasi dalam institusi dan sistem
Kompetensi yang diperlukan: kemampuan advokasi, komunikasi, dan kepemimpinan perubahan
Paling berdampak jangka panjang: satu evaluator yang terampil berdampak pada satu program; satu evaluation champion yang membangun sistem M&E yang berkelanjutan berdampak pada seluruh sistem kesehatan reproduksi di wilayahnya

🏗️ MEMBANGUN BUDAYA EVALUASI:

💡 APA ITU BUDAYA EVALUASI

Norma organisasi di mana pertanyaan tentang efektivitas dan bukti dianggap sebagai bagian normal dari pekerjaan — bukan ancaman atau audit
Data digunakan untuk pembelajaran dan perbaikan, bukan hanya untuk pelaporan dan pembenaran
Kegagalan diakui dan dipelajari, bukan disembunyikan
Staf di semua level merasa memiliki data dan menggunakannya dalam keputusan sehari-hari

🛠️ STRATEGI MEMBANGUN BUDAYA EVALUASI:

🪞 MULAI DARI DIRI SENDIRI

Tanyakan secara reguler tentang semua program yang Anda pimpin: "Apa bukti bahwa ini berhasil?"
Jadikan pertanyaan ini sebagai pertanyaan yang aman, bukan mengancam
Akui ketika program tidak berjalan sesuai rencana — dan tunjukkan bahwa Anda belajar dari itu

🎓 INVESTASIKAN DALAM KAPASITAS STAF

Pelatihan M&E dasar untuk semua staf program
Mentoring individual untuk staf yang menunjukkan minat dan bakat evaluasi
Kirimkan staf untuk magang dalam evaluasi — tidak ada pengganti pengalaman langsung

💬 CIPTAKAN RUANG UNTUK PEMBELAJARAN

Monthly data review meeting yang berfokus pada pembelajaran, bukan hanya pelaporan
Annual learning event yang melibatkan seluruh tim dan komunitas
Failure forum: ruang aman untuk mendiskusikan apa yang tidak berhasil dan mengapa
Rayakan penggunaan data untuk keputusan yang baik — tidak hanya temuan positif

📢 ADVOKASIKAN SISTEM

Dukung reformasi sistem informasi yang menghasilkan data yang berguna (bukan hanya data yang memenuhi persyaratan pelaporan)
Perjuangkan anggaran M&E yang memadai: 5–10% dari anggaran program adalah investasi, bukan overhead
Jadilah suara untuk integrasi M&E dalam siklus perencanaan daerah — data evaluasi seharusnya menginformasikan RPJMD dan Renstra secara sistematik

C.3.2. Rencana Pengembangan Kapasitas Evaluasi Pribadi

📊 SELF-ASSESSMENT KOMPETENSI EVALUASI:

DOMAIN 1 — DESAIN EVALUASI:
□ Dapat merumuskan pertanyaan evaluasi yang tajam
□ Memahami spektrum desain evaluasi dan trade-off-nya
□ Dapat mengembangkan Theory of Change yang eksplisit
□ Memahami ancaman validitas dan strategi mengatasinya

DOMAIN 2 — PENGUMPULAN DATA:
□ Dapat mengembangkan instrumen survei yang valid
□ Memahami prinsip sampling kuantitatif dan kualitatif
□ Familiar dengan platform digital pengumpulan data
□ Memahami prosedur etika pengumpulan data KR

DOMAIN 3 — ANALISIS:
□ Dapat melakukan analisis deskriptif dan inferensial dasar
□ Dapat melakukan thematic analysis data kualitatif
□ Dapat mengintegrasikan temuan mixed methods
□ Familiar dengan setidaknya satu software statistik (SPSS/R/Stata) dan satu software kualitatif (NVivo/Atlas.ti)

DOMAIN 4 — PELAPORAN DAN UTILISASI:
□ Dapat menulis executive summary yang efektif
□ Dapat menulis policy brief untuk audiens kebijakan
□ Dapat mempresentasikan temuan kritis dengan diplomasi tanpa mengorbankan integritas
□ Memahami strategi utilisasi hasil evaluasi

DOMAIN 5 — EKONOMI DAN KEBIJAKAN:
□ Dapat melakukan analisis biaya dasar
□ Dapat menginterpretasikan CEA dan ICER
□ Dapat membangun investment case untuk program KR
□ Memahami lanskap kebijakan kesehatan Indonesia

DOMAIN 6 — PARTISIPASI DAN GENDER:
□ Familiar dengan metode evaluasi partisipatif
□ Dapat melakukan gender analysis dasar
□ Memahami dimensi kekuasaan dalam proses evaluasi
□ Mampu memfasilitasi proses partisipatif dengan komunitas yang beragam

DOMAIN 7 — SISTEM DAN KEPEMIMPINAN:
□ Dapat menilai skalabilitas dan keberlanjutan program
□ Memahami prinsip realist evaluation untuk transferabilitas
□ Dapat merancang sistem M&E yang terintegrasi
□ Mampu membangun budaya evaluasi dalam tim

🗺️ LEARNING PATHWAY UNTUK PENGEMBANGAN LANJUTAN:

⏱️ JANGKA PENDEK (6–12 BULAN)

Terapkan satu komponen evaluasi dari MK ini dalam program nyata yang Anda pimpin
Ikuti workshop atau short course tentang software analisis (R atau NVivo)
Bergabung dengan komunitas praktisi evaluasi: IOCE (International Organisation for Cooperation in Evaluation), IDEAS Indonesia, atau jaringan evaluasi regional

📅 JANGKA MENENGAH (1–3 TAHUN)

Pimpin atau co-lead satu evaluasi program KR secara penuh sebagai evaluator utama
Publikasikan satu temuan evaluasi dalam jurnal peer-reviewed
Mentor satu staf junior dalam kompetensi M&E

🎯 JANGKA PANJANG (3–5 TAHUN)

Bangun sistem M&E yang terintegrasi di institusi atau wilayah kerja Anda
Berkontribusi pada pengembangan standar evaluasi program KR nasional
Menjadi resource person untuk pengembangan kapasitas evaluasi bagi Subsp. Obginsos lainnya

D. Pertanyaan Diskusi (Thread Dosen — Minggu 10)

Modul 10 diikuti oleh Quiz 2 Sesi 2 pada Minggu ke-10 dan Examination pada Minggu ke-11. Thread diskusi di bawah ini adalah refleksi penutup seluruh mata kuliah.

Pertanyaan 1: Rini, bidan yang memodifikasi program dengan grup WhatsApp, kini mampu memonitor data program secara mandiri dan mengintervensi masalah sebelum eskalasi. Dr. Farid menyimpulkan bahwa "ini yang sebenarnya berhasil" — kapasitas lokal yang terbangun, bukan laporan 87 halaman. (a) Apakah Anda setuju dengan kesimpulan Dr. Farid? Apa argumen yang mendukung dan menentangnya? (b) Implikasi apa yang ditarik dari ini untuk cara Anda akan merancang evaluasi program KR di masa depan — khususnya tentang siapa yang harus menjadi pemilik data dan proses M&E? (c) Bagaimana Anda akan mengukur keberhasilan "membangun kapasitas evaluasi lokal" sebagai outcome program evaluasi itu sendiri?

Pertanyaan 2: Anda diminta merancang sistem M&E untuk program KR baru di kabupaten Anda dengan anggaran M&E Rp 150 juta per tahun untuk 5 tahun. Program mencakup tiga komponen: layanan KB pasca persalinan di Puskesmas, peer education remaja di sekolah, dan konseling pasangan pra-nikah di KUA. (a) Rancang results framework dengan tidak lebih dari 12 indikator total (4 per komponen) yang mencakup semua level dari output hingga impact. (b) Alokasikan Rp 150 juta ke aktivitas M&E yang berbeda — monitoring rutin, evaluasi mid-term, evaluasi summative, dan capacity building — dengan justifikasi untuk setiap alokasi. (c) Identifikasikan satu inovasi dari tren evaluasi masa depan yang akan Anda integrasikan ke dalam sistem M&E ini, dan jelaskan bagaimana ia akan meningkatkan kualitas atau efisiensi M&E.

E. Rangkuman

Evaluasi program KR yang benar-benar berguna bukan tentang menguasai teknik secara terpisah — melainkan tentang mengorkestrasi semua elemen dalam urutan keputusan yang kohesif: dari identifikasi pengguna dan pertanyaan evaluasi, melalui desain dan pengumpulan data yang tepat, analisis yang rigoros dan terintegrasi, hingga pelaporan yang dikomunikasikan secara efektif dan strategi utilisasi yang aktif dijalankan
Sistem M&E yang terintegrasi menggabungkan monitoring rutin untuk koreksi kursus real-time dengan evaluasi periodik untuk penilaian dampak yang lebih mendalam; adaptive management menggunakan data secara reguler untuk menyesuaikan program berdasarkan pembelajaran, memerlukan budaya organisasi yang menoleransi dan belajar dari kegagalan di samping merayakan keberhasilan
Lanskap evaluasi program KR sedang dibentuk oleh lima tren yang saling memperkuat: digitalisasi data dan real-time monitoring, machine learning dan AI, complexity-aware evaluation, equity-focused evaluation, dan gerakan open evaluation serta transparansi data; setiap tren membawa peluang dan tantangan yang memerlukan adaptasi aktif, bukan adopsi pasif
Subspesialis Obginsos memiliki kombinasi kompetensi klinis, pemahaman sistem, posisi kelembagaan, dan legitimasi profesional yang unik untuk berperan sebagai evaluator langsung, komisioner evaluasi yang cerdas, dan yang paling berdampak jangka panjang — sebagai evaluation champion yang membangun budaya evaluasi dalam sistem kesehatan reproduksi di wilayahnya
Evaluasi yang paling bermakna bukan diukur dari ketebalan laporan atau rigornya metodologi, tetapi dari apakah ia menghasilkan perubahan nyata: program yang lebih efektif, sistem yang lebih akuntabel, staf yang lebih berdaya dengan data, dan — pada akhirnya — perempuan dan remaja yang mendapat layanan kesehatan reproduksi yang berkualitas lebih baik karena keputusan program dipandu oleh bukti yang jujur dan relevan

F. Referensi

Patton MQ. Developmental Evaluation: Applying Complexity Concepts to Enhance Innovation and Use. New York: Guilford Press; 2010.
Bamberger M, Rugh J, Mabry L. RealWorld Evaluation: Working Under Budget, Time, Data, and Political Constraints. 3rd ed. Thousand Oaks: SAGE; 2019.
MEASURE Evaluation. Performance Monitoring and Evaluation TIPS: Selecting Performance Indicators. Chapel Hill: USAID; 2013. URL: https://www.measureevaluation.org/resources/publications/tip-13
Stame N. Theory-based evaluation and types of complexity. Evaluation. 2004;10(1):58-76. DOI: https://doi.org/10.1177/1356389004043135
Wallerstein N, Duran B. Community-based participatory research contributions to intervention research. American Journal of Public Health. 2010;100(S1):S40-S46. DOI: https://doi.org/10.2105/AJPH.2009.184036
Funnell SC, Rogers PJ. Purposeful Program Theory: Effective Use of Theories of Change and Logic Models. San Francisco: Jossey-Bass; 2011.
WHO. WHO Recommendations on Health Promotion Interventions for Maternal and Newborn Health. Geneva: WHO; 2015. URL: https://www.who.int/publications/i/item/9789241508742
Preskill H, Torres RT. Evaluative Inquiry for Learning in Organizations. Thousand Oaks: SAGE; 1999.
Forss K, Marra M, Schwartz R, eds. Evaluating the Complex: Attribution, Contribution, and Beyond. New Brunswick: Transaction Publishers; 2011.
Rao N, Rodgers YvdM. Gender-responsive evaluation of reproductive health programs. Journal of Development Effectiveness. 2019;11(2):109-127. DOI: https://doi.org/10.1080/19439342.2019.1625205

QUIZ 2 — SESI 2 (MINGGU 10)

Mata Kuliah: Evaluasi Program Kesehatan Reproduksi
Semester 3 | Periode 2 | Sesi 2

Petunjuk Teknis	Detail
Jenis Penilaian	Quiz Kedua — Sesi 2
Minggu	Minggu ke-10
Cakupan Materi	Modul 6–10 (Sesi 2)
Jumlah Soal	10 soal pilihan ganda
Bobot Nilai	10% dari nilai akhir mata kuliah
Waktu Pengerjaan	30 menit
Pengerjaan	Individual, closed book
Format Jawaban	Pilih satu jawaban yang paling tepat (A/B/C/D)

SOAL QUIZ 2

Soal 1

Program peer education KR remaja terbukti efektif dalam RCT yang dilaksanakan di satu kota besar di Jawa. Ketika direplikasi di 80 Puskesmas seluruh Indonesia, efektivitasnya turun drastis. Fenomena ini paling tepat dijelaskan oleh konsep:

A. Selection bias — peserta di replikasi berbeda karakteristiknya dari peserta RCT original
B. Voltage drop — program kehilangan efektivitas ketika diperbesar karena kondisi pilot yang tidak terduplikasi dalam scaling
C. History threat — peristiwa eksternal yang terjadi bersamaan dengan replikasi mengurangi efektivitas
D. Attrition bias — peserta yang dropout dalam replikasi berbeda dari yang bertahan

Soal 2

Evaluasi implementasi di 12 Puskesmas menemukan bahwa skor fidelity rata-rata adalah 71% — namun tiga Puskesmas dengan skor fidelity tertinggi (>85%) menunjukkan outcome yang tidak lebih baik dari Puskesmas dengan skor fidelity 65–75%. Interpretasi yang paling tepat adalah:

A. Instrumen fidelity tidak valid dan perlu direvisi
B. Ada threshold fidelity minimum (~65%) di atas mana peningkatan fidelity lebih lanjut tidak meningkatkan outcome — faktor lain lebih menentukan
C. Puskesmas dengan fidelity tinggi mengimplementasikan program terlalu kaku sehingga tidak relevan dengan konteks lokal
D. Data outcome di Puskesmas fidelity tinggi kemungkinan mengandung error pengukuran

Soal 3

Analisis biaya program KB menunjukkan: Strategi A (konseling klinik) biaya per klien Rp 220.000, proporsi akseptor 48%. Strategi B (konseling komunitas mobile) biaya per klien Rp 145.000, proporsi akseptor 55%. ICER Strategi B vs. A adalah:

A. -Rp 1.071.429 per akseptor tambahan — Strategi B dominan (lebih murah dan lebih efektif)
B. +Rp 535.714 per akseptor tambahan — Strategi B lebih mahal per akseptor
C. -Rp 535.714 per akseptor tambahan — Strategi A dominan
D. ICER tidak dapat dihitung karena kedua strategi melayani populasi yang berbeda

Soal 4

Seorang evaluator menggunakan Photovoice dengan remaja perempuan peserta program KR. Salah satu peserta memfoto pintu masuk Puskesmas yang sempit dan gelap, dengan keterangan: "Di sinilah kami berhenti. Bukan karena tidak mau masuk, tapi karena malu dilihat orang-orang yang lewat." Kontribusi data ini untuk evaluasi program yang paling tepat adalah:

A. Data anekdotal yang tidak dapat digunakan dalam evaluasi karena tidak representatif secara statistik
B. Bukti kualitatif tentang hambatan akses fisik dan sosial yang tidak terukur oleh indikator cakupan — menjelaskan mengapa utilisasi rendah meskipun fasilitas tersedia
C. Data yang harus dikonfirmasi dengan survei kuantitatif sebelum dapat dimasukkan dalam laporan evaluasi
D. Ilustrasi yang berguna untuk laporan tetapi bukan data evaluasi yang sah karena diproduksi oleh peserta, bukan evaluator

Soal 5

Evaluasi gender-responsive menemukan bahwa program KB pasca persalinan memiliki cakupan 68% — tetapi analisis lebih lanjut mengungkapkan bahwa 41% akseptor KB memilih metode IUD bukan karena preferensi mereka sendiri, melainkan karena tekanan halus dari bidan yang ingin memenuhi target program. Dari perspektif evaluasi KR yang komprehensif, temuan ini menunjukkan bahwa:

A. Program berhasil dari segi cakupan tetapi gagal dari segi kualitas consent — kedua dimensi harus dilaporkan
B. Temuan ini tidak relevan untuk evaluasi cakupan karena akseptor tetap terhitung sebagai akseptor aktif
C. Bidan perlu mendapat sanksi karena melanggar informed consent
D. Evaluasi harus mengulangi survei dengan instrumen yang lebih sensitif sebelum menarik kesimpulan

Soal 6

Sebuah program KR remaja memiliki bukti efektivitas yang kuat (RCT, Cohen's d = 0.68) tetapi Sustainability Scorecard menunjukkan skor 1/4 untuk "stabilitas pendanaan" (78% bergantung pada satu donor internasional yang kontraknya berakhir dalam 18 bulan) dan skor 1/4 untuk "kapasitas organisasi" (dua dari tiga staf kunci sedang dalam proses resign). Rekomendasi yang paling tepat adalah:

A. Scale up segera karena bukti efektivitas sangat kuat
B. Tunda scaling; investasikan dalam memperkuat stabilitas pendanaan dan kapasitas organisasi dulu; re-asesmen dalam 12 bulan
C. Hentikan program karena risiko keberlanjutan terlalu tinggi
D. Scale up dengan monitoring ketat sambil secara paralel mencari donor pengganti

Soal 7

Evaluator menggunakan realist evaluation (CMO framework) untuk menilai transferabilitas program peer education KR dari Jawa ke Papua. CMO yang diidentifikasikan: "Ketika remaja memiliki peer group yang kohesif dan kepercayaan tinggi antar anggota [Context], pengaruh normatif dari peer educator mengubah intensi perilaku [Mechanism], menghasilkan peningkatan utilisasi layanan KR [Outcome]." Data etnografis awal dari target komunitas di Papua menunjukkan bahwa peer group remaja sangat kohesif tetapi kepercayaan terhadap outsider (termasuk peer educator yang dikirim dari program) sangat rendah. Implikasi untuk transferabilitas adalah:

A. Program tidak dapat ditransfer ke Papua karena konteks tidak mendukung mekanisme
B. Program dapat ditransfer tetapi mekanisme tidak akan bekerja kecuali peer educator direkrut dari dalam komunitas itu sendiri — bukan dikirim dari luar
C. Data etnografis tidak cukup untuk menilai transferabilitas — diperlukan pilot RCT di Papua
D. Kohesivitas peer group yang tinggi sudah cukup untuk memastikan mekanisme bekerja, kepercayaan terhadap outsider tidak relevan

Soal 8

Dr. Farid merefleksikan bahwa pencapaian terpenting dari satu tahun evaluasi bukan laporan 87 halamannya, tetapi bidan Rini yang kini mampu memonitor data secara mandiri. Jenis utilisasi evaluasi yang paling tepat menggambarkan dampak pada Rini adalah:

A. Instrumental use — monitoring mandiri Rini adalah perubahan keputusan langsung yang dihasilkan dari temuan evaluasi
B. Process use — Rini membangun kapasitas analitik dan kepercayaan diri menggunakan data melalui keterlibatannya dalam proses evaluasi itu sendiri
C. Conceptual use — Rini mengubah cara berpikirnya tentang program berdasarkan temuan evaluasi
D. Symbolic use — keterlibatan Rini dalam evaluasi melegitimasi program di mata komunitas

Soal 9

Sebuah NGO mengklaim bahwa AI dapat sepenuhnya menggantikan thematic analysis manual dalam evaluasi kualitatif program KR karena lebih cepat, lebih konsisten, dan tidak memiliki bias subjektif evaluator. Kelemahan paling fundamental dari klaim ini adalah:

A. AI belum cukup akurat dalam memproses bahasa Indonesia
B. Thematic analysis yang baik bukan hanya tentang mengidentifikasikan pola teks — tetapi tentang interpretasi makna, konteks kekuasaan, dan implikasi kebijakan yang memerlukan judgment manusia yang tidak dapat direplikasi oleh AI
C. AI lebih mahal dari thematic analysis manual untuk dataset yang ukurannya tipikal dalam evaluasi program KR
D. Evaluasi yang menggunakan AI tidak akan diterima oleh jurnal peer-reviewed

Soal 10

Seorang Subspesialis Obginsos baru diangkat sebagai Kepala Bidang Kesehatan Masyarakat di Dinkes Provinsi. Ia ingin membangun budaya evaluasi dalam sistem. Dari perspektif "evaluation champion", tindakan yang paling strategis dan berdampak jangka panjang adalah:

A. Menugaskan evaluasi tahunan untuk semua program KR di provinsi menggunakan konsultan eksternal
B. Membangun sistem M&E terintegrasi yang menempatkan staf Puskesmas sebagai pemilik dan pengguna data primer, didukung pelatihan berkelanjutan dan mekanisme review reguler yang menggunakan data untuk keputusan nyata
C. Mempublikasikan temuan evaluasi program KR provinsi dalam jurnal nasional untuk meningkatkan visibilitas dan akuntabilitas
D. Membuat kebijakan bahwa semua program KR baru harus menyertakan komponen evaluasi dengan anggaran minimal 10%

KUNCI JAWABAN DAN PEMBAHASAN

(Untuk Dosen — Tidak Didistribusikan kepada Peserta Didik)

Soal 1 — Jawaban: B
Voltage drop adalah fenomena di mana program yang efektif dalam pilot kehilangan efektivitas ketika diperbesar karena kondisi pilot yang tidak terduplikasi: tim champion, supervisi intensif, sumber daya berlebih, dan fokus perhatian yang tinggi. Scaling ke 80 Puskesmas berarti program diimplementasikan oleh staf yang berbeda, dengan supervisi minimal, dalam kondisi sistem yang jauh lebih heterogen. Selection bias (A) relevan untuk validitas internal RCT, bukan untuk fenomena voltage drop dalam scaling. History threat (C) dan attrition bias (D) adalah ancaman validitas yang tidak menjelaskan penurunan efektivitas sistematis dalam scaling.

Soal 2 — Jawaban: B
Temuan ini konsisten dengan threshold effect — ada level fidelity minimum yang diperlukan agar program bekerja, tetapi di atas threshold itu, peningkatan fidelity lebih lanjut tidak meningkatkan outcome karena faktor lain (kualitas fasilitator, konteks komunitas, dukungan keluarga) lebih menentukan. Ini adalah temuan yang sangat berguna: bukan "maximalism fidelity" yang menjadi tujuan, tetapi "sufficient fidelity" yang disertai perhatian pada faktor kontekstual. Opsi A mungkin perlu dipertimbangkan tetapi kesimpulan berdasarkan pola data yang ada adalah B. Opsi C adalah spekulasi tanpa bukti. Opsi D adalah penolakan temuan yang tidak berdasar.

Soal 3 — Jawaban: A
ICER = (Biaya B - Biaya A) / (Efek B - Efek A) = (145.000 - 220.000) / (0.55 - 0.48) = -75.000 / 0.07 = -Rp 1.071.429. ICER negatif karena Strategi B lebih murah DAN lebih efektif — ini adalah dominance (Kuadran 2 dalam four-quadrant framework). Strategi B menghemat Rp 75.000 per klien sekaligus menghasilkan 7% lebih banyak akseptor. Rekomendasi jelas: pilih Strategi B.

Soal 4 — Jawaban: B
Foto dan keterangan Ibu remaja ini adalah data kualitatif yang valid dan sangat informatif — mengungkapkan hambatan akses yang bersifat fisik (pintu sempit, gelap) sekaligus sosial (rasa malu karena terlihat masuk fasilitas KR). Ini menjelaskan gap antara ketersediaan layanan dan utilisasi yang tidak dapat ditangkap oleh survei cakupan. Opsi A salah — representativitas statistik bukan kriteria validitas untuk data kualitatif partisipatif. Opsi C salah — konfirmasi kuantitatif tidak selalu diperlukan untuk data kualitatif yang valid. Opsi D salah — data yang diproduksi oleh komunitas adalah inti dari Photovoice.

Soal 5 — Jawaban: A
Evaluasi KR yang komprehensif harus mengukur bukan hanya cakupan tetapi kualitas consent dan otonomi reproduktif. Cakupan 68% dengan consent yang bermasalah bukan keberhasilan yang sama dengan 68% dengan consent yang benar-benar informed. Kedua dimensi harus dilaporkan secara jelas. Opsi B mengabaikan dimensi hak yang fundamental. Opsi C adalah respons yang tidak sesuai dengan peran evaluator (bukan investigator hukum). Opsi D menunda kesimpulan yang sudah dapat ditarik dari data yang ada.

Soal 6 — Jawaban: B
Program dengan dua dimensi keberlanjutan yang sangat rendah (pendanaan dan kapasitas) berisiko kolaps bahkan sebelum scaling selesai dilaksanakan. Scaling program yang tidak berkelanjutan hanya memperbesar skala kegagalan yang akan terjadi. Investasi dalam memperkuat keberlanjutan sebelum scaling adalah keputusan yang bertanggung jawab. Opsi A mengabaikan risiko keberlanjutan yang nyata. Opsi C terlalu ekstrim — masalah keberlanjutan dapat diatasi. Opsi D adalah kompromi yang tidak realistis karena dua masalah kritis tidak dapat diselesaikan secara paralel dengan scaling yang memerlukan perhatian dan sumber daya yang sama.

Soal 7 — Jawaban: B
CMO mengidentifikasikan bahwa mekanisme (pengaruh normatif) bergantung pada kepercayaan antara peer educator dan target — bukan hanya kohesivitas dalam kelompok. Jika peer educator adalah outsider yang tidak dipercaya, mekanisme tidak akan bekerja meskipun peer group kohesif. Solusinya adalah adaptasi: rekrut peer educator dari dalam komunitas itu sendiri. Ini adalah contoh modifikasi adaptable element (siapa peer educator) yang mempertahankan core component (mekanisme pengaruh normatif). Opsi A terlalu pesimistik — masalah dapat diatasi dengan adaptasi. Opsi C tidak diperlukan karena CMO analysis sudah memberikan arah yang jelas. Opsi D salah — kepercayaan terhadap peer educator adalah bagian dari context yang mengaktifkan mechanism.

Soal 8 — Jawaban: B
Process use adalah jenis utilisasi di mana manfaat terjadi karena keterlibatan dalam proses evaluasi, bukan dari temuan evaluasi itu sendiri. Rini membangun kapasitas dan kepercayaan dirinya melalui proses bekerja bersama tim evaluasi — bukan karena membaca laporan 87 halaman. Ini sering merupakan dampak yang paling berkelanjutan dari evaluasi partisipatif. Instrumental use (A) adalah perubahan keputusan langsung berdasarkan temuan. Conceptual use (C) adalah perubahan cara berpikir berdasarkan temuan. Symbolic use (D) tentang legitimasi program, bukan kapasitas individu.

Soal 9 — Jawaban: B
Kelemahan fundamental AI dalam evaluasi kualitatif adalah bahwa thematic analysis yang baik bukan sekadar pattern recognition dalam teks — ini adalah proses interpretif yang melibatkan pemahaman konteks sosial-budaya, relasi kekuasaan, dan implikasi kebijakan yang memerlukan judgment manusia. AI dapat membantu coding awal, tetapi interpretasi makna dan relevansi kebijakan memerlukan evaluator manusia yang memahami konteks. Opsi A tentang bahasa Indonesia mungkin relevan tapi bukan kelemahan "paling fundamental." Opsi C dan D tidak relevan dengan pertanyaan tentang validitas metodologis.

Soal 10 — Jawaban: B
Evaluation champion yang paling berdampak adalah yang membangun sistem di mana staf di semua level memiliki kapasitas dan rasa kepemilikan terhadap data, dan menggunakannya untuk keputusan nyata sehari-hari. Ini jauh lebih berkelanjutan dari evaluasi oleh konsultan eksternal (A) yang tidak membangun kapasitas lokal. Publikasi (C) penting untuk diseminasi tetapi bukan strategi budaya evaluasi. Kebijakan anggaran (D) adalah enabling condition yang berguna tetapi tidak cukup tanpa perubahan budaya yang aktif dibangun.

Malang, Maret 2026
Penyusun

EXAMINATION — SESI 2 (MINGGU 11)

Mata Kuliah: Evaluasi Program Kesehatan Reproduksi
Semester 3 | Periode 2 | Sesi 2

Petunjuk Teknis	Detail
Jenis Penilaian	Ujian Akhir — Sesi 2 (Examination)
Minggu	Minggu ke-11
Cakupan Materi	Modul 1–10 (Seluruh Mata Kuliah)
Jumlah Soal	3 soal esai analitik
Bobot Nilai	30% dari nilai akhir mata kuliah
Waktu Pengerjaan	180 menit (3 jam)
Pengerjaan	Individual, open book terbatas (catatan pribadi dan modul — tidak boleh menggunakan internet atau berkomunikasi dengan sesama peserta)
Format Luaran	Essay Word atau PDF, dikumpulkan melalui LMS
Panjang	Total 2.500–3.500 kata untuk ketiga soal

PETUNJUK PENGERJAAN

Examination ini menguji kemampuan sintesis dan aplikasi — bukan reproduksi konten modul; peserta yang hanya merangkum teori tanpa mengaplikasikan ke skenario akan mendapat nilai rendah
Semua soal menggunakan skenario yang terhubung — baca ketiganya sebelum mulai menulis untuk memahami arsitektur keseluruhan
Kejujuran intelektual dinilai: mengakui keterbatasan dan ambiguitas analitis mendapat nilai lebih tinggi dari klaim yang berlebihan
Tidak ada jawaban yang sepenuhnya benar atau salah untuk banyak elemen soal — kualitas argumentasi dan koherensi logis adalah yang paling dinilai

🗺️ SKENARIO UTAMA

Anda adalah Subspesialis Obginsos yang baru dilantik sebagai Direktur Program Kesehatan Reproduksi di sebuah provinsi kepulauan dengan 22 kabupaten — 7 kabupaten relatif urban dan terhubung baik, 15 kabupaten rural dan terpencil dengan akses terbatas. AKI provinsi 287/100.000 KH (di atas rata-rata nasional 183). Angka kehamilan remaja 42/1.000 perempuan 15-19 tahun (dua kali rata-rata nasional). Cakupan KB modern 41% (jauh di bawah target nasional 63%).

Gubernur baru memberikan Anda mandat yang jelas: "Turunkan AKI dan tingkatkan cakupan KB dalam 5 tahun." Anggaran program KR provinsi: Rp 28 miliar per tahun. Anda memiliki tim 8 orang di provinsi dan berkoordinasi dengan 22 Dinas Kesehatan kabupaten.

Tiga bulan pertama, Anda melakukan rapid assessment dan menemukan:

Tidak ada sistem M&E yang terintegrasi — setiap kabupaten melaporkan dengan format berbeda
Terdapat 4 program KR yang berjalan: (1) program KB pasca persalinan di Puskesmas, (2) program kesehatan remaja berbasis sekolah, (3) program bidan desa, dan (4) program KR dalam situasi bencana yang baru diluncurkan NGO internasional
Tidak ada satu pun program yang pernah dievaluasi secara sistematis
Dua kabupaten terpencil menolak kunjungan tim — kepala daerahnya menyatakan program KR "bertentangan dengan nilai lokal"

SOAL EXAMINATION

SOAL 1 — Merancang Sistem Evaluasi Komprehensif (35%)

(Target panjang: 900–1.100 kata)

Berdasarkan skenario di atas, rancang sistem evaluasi program KR provinsi untuk 5 tahun ke depan.

Jawaban Anda harus mencakup:

1a. Prioritisasi Evaluasi (±200 kata)
Dari empat program yang berjalan, Anda tidak memiliki sumber daya untuk mengevaluasi semuanya secara mendalam dalam tahun pertama. Gunakan kerangka analitik yang dipelajari dalam MK ini untuk memprioritaskan program mana yang harus dievaluasi pertama, dan program mana yang dapat menunggu. Berikan justifikasi berbasis bukti — bukan berdasarkan preferensi atau popularitas program.

1b. Desain Evaluasi untuk Program Prioritas (±400 kata)
Untuk program yang Anda pilih sebagai prioritas pertama:

Rumuskan dua pertanyaan evaluasi utama yang mencerminkan kebutuhan informasi paling kritis untuk keputusan provinsi
Pilih desain evaluasi yang paling tepat dan justifikasikan mengapa desain lain kurang sesuai dalam konteks Anda
Identifikasikan dua sumber data sekunder yang sudah tersedia dan dua komponen data primer yang perlu dikumpulkan
Tetapkan satu pertimbangan etis yang paling kritis untuk evaluasi ini dan bagaimana Anda akan mengatasinya

1c. Sistem M&E Terintegrasi (±400 kata)
Rancang kerangka sistem M&E provinsi yang akan diterapkan di semua 22 kabupaten:

Tetapkan tidak lebih dari 6 indikator inti yang akan dimonitor secara seragam di semua kabupaten (pilih dari level output, outcome jangka pendek, dan outcome jangka menengah)
Jelaskan bagaimana sistem ini akan mengelola variasi kapasitas antara 7 kabupaten urban dan 15 kabupaten terpencil
Rancang mekanisme feedback loop: bagaimana data yang dikumpulkan akan dikembalikan kepada pengelola program di kabupaten dalam format yang berguna untuk keputusan mereka
Alokasikan anggaran M&E dalam kisaran yang realistis dari total Rp 28 miliar, dengan justifikasi

SOAL 2 — Mengelola Kompleksitas Politik dan Kontekstual (35%)

(Target panjang: 900–1.100 kata)

Dua kabupaten terpencil menolak kunjungan tim program KR dengan alasan nilai lokal. Sementara itu, NGO internasional yang mengelola program KR dalam situasi bencana di kabupaten pesisir mengklaim program mereka "evidence-based" berdasarkan RCT dari Bangladesh — dan meminta Anda untuk mengadopsinya di semua kabupaten sebagai program unggulan.

2a. Strategi Keterlibatan Dua Kabupaten yang Menolak (±350 kata)
Gunakan konsep dari Modul 8 (evaluasi partisipatif, gender-responsive, dan power dynamics) dan Modul 9 (transferabilitas dan konteks) untuk merancang strategi keterlibatan yang:

Menghormati otonomi komunitas dan nilai lokal tanpa meninggalkan tanggung jawab terhadap kesehatan reproduksi perempuan di kabupaten tersebut
Mengidentifikasikan entry points yang mungkin: siapa yang perlu dilibatkan, dalam urutan apa, dan dengan pendekatan apa
Jujur tentang keterbatasan: situasi mana yang mungkin tidak dapat diselesaikan dalam mandat 5 tahun Anda

2b. Penilaian Kritis terhadap Klaim NGO (±400 kata)
Program KR dalam situasi bencana dari Bangladesh diklaim efektif berdasarkan RCT yang kuat. Menggunakan kerangka transferabilitas (CMO framework dari Modul 9):

Identifikasikan dua CMO configuration kritis dari program ini
Nilai apakah konteks provinsi kepulauan Anda mendukung atau tidak mendukung setiap mekanisme
Berikan rekomendasi kepada Gubernur: apakah program ini layak diadopsi sebagai program unggulan, diadopsi dengan modifikasi, atau tidak diadopsi — dengan justifikasi yang jelas
Identifikasikan satu kondisi minimum yang harus dipenuhi sebelum program ini dapat dipertimbangkan untuk scaling di semua 22 kabupaten

2c. Mengelola Tekanan Eksternal (±250 kata)
NGO internasional tersebut juga menjadi donor utama untuk dua program KR lain di provinsi Anda. Mereka menyampaikan secara tidak langsung bahwa dukungan finansial mereka bergantung pada adopsi program mereka sebagai unggulan. Bagaimana Anda mengelola situasi ini sebagai Direktur Program yang berkomitmen pada integritas evaluasi dan kepentingan terbaik perempuan di provinsi Anda? Berikan respons yang konkret, etis, dan realistis — bukan hanya prinsipil.

SOAL 3 — Sintesis dan Kepemimpinan Evaluasi (30%)

(Target panjang: 700–900 kata)

Lima tahun telah berlalu. Mandat Gubernur hampir berakhir. AKI turun dari 287 menjadi 231/100.000 KH. Cakupan KB modern naik dari 41% menjadi 57%. Angka kehamilan remaja turun dari 42 menjadi 29/1.000.

Namun dalam pertemuan tim, seorang staf muda mengajukan pertanyaan yang mengganggu: "Pak/Bu Direktur, apakah kita bisa klaim bahwa perubahan ini karena program kita? Atau mungkin karena program JKN yang diperluas, atau karena media sosial yang mengubah pengetahuan remaja, atau karena bencana alam yang memaksa konsolidasi layanan kesehatan? Kita tidak punya kelompok kontrol."

3a. Menjawab Pertanyaan Staf dengan Jujur (±300 kata)
Berikan jawaban yang jujur, metodologis kuat, dan dapat digunakan untuk komunikasi kebijakan kepada Gubernur. Jawaban Anda harus:

Mengakui keterbatasan kausal yang diajukan staf secara jujur
Menggunakan konsep contribution analysis untuk membangun argumen yang defensible meskipun tanpa kelompok kontrol
Mengidentifikasikan bukti mekanistik spesifik yang mendukung kontribusi program (berdasarkan data implementasi dan evaluasi yang Anda lakukan)
Memberikan confidence statement yang tepat: seberapa kuat klaim kontribusi yang dapat Anda buat?

3b. Refleksi Pembelajaran (±250 kata)
Dari seluruh perjalanan 5 tahun ini, identifikasikan:

Satu keputusan evaluasi yang terbukti paling tepat dan mengapa
Satu keputusan yang Anda sesali dan yang akan Anda lakukan berbeda jika mengulang dari awal
Satu hal yang Anda pelajari tentang peran Subspesialis Obginsos sebagai pemimpin evaluasi yang tidak dapat diajarkan hanya melalui teori

3c. Mewariskan Sistem (±250 kata)
Masa jabatan Anda akan berakhir dalam 6 bulan. Pengganti Anda belum ditentukan. Apa yang akan Anda lakukan dalam 6 bulan terakhir untuk memastikan bahwa kapasitas evaluasi yang telah dibangun tidak hilang bersama kepergian Anda? Rancang tiga tindakan prioritas yang konkret, dengan justifikasi mengapa ketiga tindakan itu — dan bukan tindakan lain — yang paling kritis untuk keberlanjutan sistem evaluasi.

RUBRIK PENILAIAN EXAMINATION

Soal	Komponen	Indikator Penilaian	Bobot
Soal 1	1a — Prioritisasi	Ketajaman argumen; penggunaan kerangka yang tepat; keberanian membuat prioritas yang jelas	8%
	1b — Desain	Koherensi pertanyaan-desain-data; ketepatan pertimbangan etis; realisme konteks	15%
	1c — Sistem M&E	Ketepatan indikator; realisme pengelolaan variasi kapasitas; konkretnya mekanisme feedback; realisme alokasi anggaran	12%
Soal 2	2a — Strategi keterlibatan	Keseimbangan penghormatan nilai lokal dan tanggung jawab kesehatan; ketepatan entry points; kejujuran tentang keterbatasan	12%
	2b — Penilaian klaim NGO	Ketepatan konstruksi CMO; kedalaman penilaian konteks; keberanian dan kejernihan rekomendasi	15%
	2c — Tekanan eksternal	Realisme respons; integritas etis; konkretnya tindakan	8%
Soal 3	3a — Kontribusi vs. atribusi	Kejujuran metodologis; kekuatan argumen contribution analysis; ketepatan confidence statement	12%
	3b — Refleksi	Kedalaman dan kejujuran refleksi; spesifisitas pembelajaran	8%
	3c — Mewariskan sistem	Prioritisasi yang tepat; konkretnya tindakan; justifikasi yang kuat	10%

📝 CATATAN UNTUK DOSEN

Examination ini dirancang sebagai ujian sintesis komprehensif yang mengintegrasikan semua Modul 1–10. Tidak ada kunci jawaban tunggal yang benar — rubrik penilaian menggunakan indikator kualitatif yang menilai kualitas argumentasi, kedalaman analisis, dan kejujuran intelektual. Direkomendasikan untuk menggunakan blind scoring: penilai tidak mengetahui identitas peserta saat menilai. Diskrepansi antar penilai yang lebih dari satu level (misal: satu penilai memberi A dan penilai lain memberi C untuk soal yang sama) perlu didiskusikan dalam tim sebelum nilai final ditetapkan.

Malang, Maret 2026
Penyusun