Fondasi, Kerangka, dan Relevansi dalam Sistem Kesehatan Indonesia
Semester 3 | Periode 2 | MK Evaluasi Program Kesehatan Reproduksi (4 SKS) | Sesi 1 | Modul 1
Dr.dr. Budi Siswanto, Sp.OG., Subsp.Obginsos., SH., S.Kom.
Februari 2025. Ruang Rapat Kemenkes, Jakarta.
Dr. Farid, SpOG., Subsp.Obginsos., duduk di ujung meja panjang bersama dua belas orang lainnya — campuran pejabat Kemenkes, peneliti dari universitas, dan konsultan dari lembaga donor internasional. Di layar proyektor: slide terakhir dari presentasi program Kesehatan Reproduksi Remaja Nasional yang telah berjalan empat tahun dengan anggaran kumulatif Rp 340 miliar.
Direktur program membuka diskusi: "Kita sudah mencapai target cakupan. Lebih dari 2,3 juta remaja terjangkau program konseling. Layanan ramah remaja sudah ada di 847 Puskesmas. Ini pencapaian yang luar biasa."
Seorang peneliti dari Universitas Indonesia mengangkat tangan: "Izin, Pak. Cakupan memang luar biasa. Tapi boleh saya tanya — apakah angka kehamilan tidak diinginkan pada remaja turun? Apakah pengetahuan remaja tentang kesehatan reproduksi meningkat? Apakah layanan yang tersedia benar-benar digunakan?"
Hening sejenak.
Direktur menjawab hati-hati: "Untuk indikator-indikator itu... kami masih dalam proses pengumpulan data."
Dr. Farid menuliskan sesuatu di catatannya: Program 340 miliar. Empat tahun. Tidak ada data outcome. Kita tidak tahu apakah ini berhasil.
Kemudian satu pertanyaan lebih besar muncul di benaknya: Bukan hanya program ini. Berapa banyak program kesehatan reproduksi di Indonesia yang sesungguhnya tidak pernah dievaluasi dengan benar — bukan karena tidak ada yang peduli, tetapi karena kita tidak tahu caranya?
Evaluasi program adalah salah satu kapasitas yang paling kurang dikembangkan dalam sistem kesehatan Indonesia, sekaligus salah satu yang paling dibutuhkan. Di tengah tekanan untuk menunjukkan "cakupan" dan "aktivitas," pertanyaan yang sesungguhnya penting — apakah program ini menghasilkan perubahan yang bermakna bagi kesehatan reproduksi masyarakat? — sering tidak terjawab, atau bahkan tidak ditanyakan.
Modul pembuka ini membangun fondasi konseptual yang akan menopang seluruh mata kuliah: apa evaluasi program sesungguhnya, mengapa ia berbeda dari monitoring, bagaimana ia digunakan dalam konteks program kesehatan reproduksi Indonesia, dan mengapa Subsp.Obginsos perlu memiliki kompetensi ini.
Setelah menyelesaikan modul ini, peserta didik mampu:
CDC (Centers for Disease Control and Prevention):
"Evaluasi program adalah pengumpulan informasi yang sistematis tentang aktivitas, karakteristik, dan outcome program untuk membuat penilaian tentang program, meningkatkan efektivitasnya, dan/atau menginformasikan keputusan tentang pemrograman di masa depan"
WHO:
"Penilaian sistematis tentang desain, implementasi, dan hasil suatu program — dimaksudkan untuk digunakan dalam meningkatkan program dan menginformasikan kebijakan"
Dana publik untuk program kesehatan reproduksi berasal dari pajak masyarakat atau donor. Pertanyaan yang sah: apakah dana ini menghasilkan perubahan yang dijanjikan? Tanpa evaluasi: tidak ada akuntabilitas yang bermakna.
Program yang tidak dievaluasi tidak dapat diperbaiki secara sistematis. Kegagalan yang tidak diidentifikasi tidak dapat dihindari di program berikutnya. Keberhasilan yang tidak dipahami mekanismenya tidak dapat direplikasi.
Sumber daya kesehatan di Indonesia selalu terbatas. Evaluasi membantu menjawab: program mana yang memberikan nilai terbaik per rupiah? Tanpa evaluasi: keputusan alokasi bergantung pada politik dan kepentingan, bukan bukti.
Kebijakan kesehatan reproduksi seharusnya berbasis bukti tentang apa yang berhasil. Evaluasi adalah mekanisme utama untuk menghasilkan bukti ini dari konteks lokal.
Kondisi evaluasi program kesehatan reproduksi di Indonesia saat ini:
✅ YANG SUDAH BAIK:
❌ YANG MASIH LEMAH:
IMPLIKASI: Program dengan anggaran besar dapat berjalan bertahun-tahun tanpa tahu apakah efektif. Seperti situasi Dr. Farid: 340 miliar rupiah, 4 tahun, tanpa data outcome yang sistematis.
HUBUNGAN KEDUANYA:
AREA ABU-ABU: Evaluasi yang menggunakan metode penelitian yang ketat dapat memenuhi standar untuk keduanya. Di Indonesia: batas ini sering tidak jelas dalam praktik.
IMPLIKASI: Audit yang baik tidak menggantikan evaluasi. Program dapat lulus audit tetapi gagal dalam evaluasi (mematuhi prosedur tetapi tidak menghasilkan dampak). Program dapat berhasil dalam evaluasi tetapi memiliki masalah audit (menghasilkan dampak tetapi dengan pengelolaan keuangan yang bermasalah).
Dilakukan: selama program berjalan
Tujuan: memperbaiki program secara real-time
Pertanyaan: "Bagaimana program dapat diperbaiki?"
Pengguna hasil: manajer dan staf program
Karakteristik: lebih cepat, lebih pragmatis, lebih toleran terhadap kesempurnaan metodologis
Contoh kesehatan reproduksi: evaluasi formatif konseling KB setelah 6 bulan implementasi — menemukan bahwa konselor kewalahan dengan beban administrasi → segera sederhanakan formulir
Dilakukan: pada akhir program atau fase program
Tujuan: menilai keberhasilan keseluruhan dan membuat keputusan tentang masa depan program
Pertanyaan: "Apakah program berhasil?"
Pengguna hasil: pengambil keputusan, donor, pembuat kebijakan
Karakteristik: lebih ketat secara metodologis, lebih komprehensif
Contoh: evaluasi akhir program PKRE (Paket Kesehatan Reproduksi Esensial) untuk memutuskan apakah dilanjutkan, diperluas, atau dihentikan
Dilakukan: sebelum program dimulai
Tujuan: menilai apakah program yang diusulkan layak dan relevan
Pertanyaan: "Apakah program ini seharusnya dijalankan?"
Juga dikenal sebagai: needs assessment, feasibility study
Dilakukan: beberapa tahun setelah program selesai
Tujuan: menilai dampak jangka panjang dan keberlanjutan
Pertanyaan: "Apakah perubahan yang dihasilkan program bertahan?"
Dilakukan oleh: staf program itu sendiri
Keunggulan: pengetahuan konteks yang mendalam, biaya lebih rendah, lebih mudah digunakan
Kelemahan: risiko bias, kepentingan untuk menunjukkan keberhasilan, kurang kredibel di mata pihak eksternal
Dilakukan oleh: evaluator independen dari luar program
Keunggulan: objektivitas lebih terjamin, kredibilitas lebih tinggi untuk akuntabilitas
Kelemahan: biaya lebih tinggi, kurang memahami konteks, hasil mungkin kurang digunakan karena tidak "milik" staf
Melibatkan: pemangku kepentingan — termasuk penerima manfaat program — dalam proses evaluasi
Keunggulan: perspektif yang lebih kaya, ownership yang lebih tinggi terhadap hasil, lebih sesuai dengan nilai-nilai partisipasi
Relevansi tinggi untuk program kesehatan reproduksi karena melibatkan isu-isu sensitif yang memerlukan kepercayaan komunitas
6 langkah yang saling terhubung dalam siklus evaluasi:
Identifikasikan semua pihak yang berkepentingan dengan evaluasi: Those involved (yang menjalankan program), Those served (penerima manfaat), Primary intended users (yang akan menggunakan hasil evaluasi). Mengapa penting: evaluasi yang tidak melibatkan pemangku kepentingan kunci sering menghasilkan laporan yang tidak digunakan.
Artikulasikan program secara eksplisit: Need, Expected effects, Activities, Resources, Stage, Context, Logic model! Tanpa deskripsi yang jelas: evaluasi tidak tahu apa yang seharusnya dinilai.
Tidak semua yang dapat dievaluasi harus dievaluasi. Fokuskan pada pertanyaan yang paling berguna untuk keputusan yang akan diambil. Pilih desain yang tepat untuk pertanyaan tersebut.
Tentukan indikator yang akan diukur. Pilih sumber data. Pilih metode pengumpulan. Pastikan data yang dikumpulkan kredibel: valid, reliable, dan dipercaya oleh pemangku kepentingan.
Interpretasikan data terhadap nilai dan standar yang telah disepakati. Buat kesimpulan dan rekomendasi yang dapat dipertahankan. Bedakan antara temuan (apa yang data katakan) dan kesimpulan (apa artinya) dan rekomendasi (apa yang seharusnya dilakukan).
Diseminasikan hasil kepada pemangku kepentingan yang relevan. Pastikan hasil benar-benar digunakan untuk keputusan. Ini adalah langkah yang paling sering diabaikan.
5 kriteria evaluasi yang dikembangkan OECD Development Assistance Committee (paling banyak digunakan untuk program yang didanai donor internasional — sangat relevan untuk banyak program kesehatan reproduksi Indonesia):
Apakah program sesuai dengan kebutuhan dan prioritas penerima manfaat, pemerintah, dan donor? Pertanyaan: "Apakah kita mengerjakan hal yang benar?" Contoh untuk program kesehatan reproduksi remaja: apakah desain program sesuai dengan kebutuhan remaja di konteks lokal yang spesifik?
Ditambahkan dalam revisi 2019. Apakah program konsisten secara internal (antar komponen) dan eksternal (dengan program dan kebijakan lain yang relevan)? Apakah ada kontradiksi antara program ini dengan program lain yang berjalan bersamaan?
Sejauh mana program mencapai tujuannya? Pertanyaan: "Apakah kita mencapai apa yang ingin kita capai?" Fokus pada outcome dan dampak terhadap tujuan yang telah ditetapkan.
Apakah program menggunakan sumber daya dengan cara terbaik untuk mencapai hasilnya? Pertanyaan: "Apakah kita mengerjakan hal yang benar dengan cara yang benar dan ekonomis?" Analisis nilai per rupiah.
Perubahan positif dan negatif, primer dan sekunder, yang disebabkan oleh program — baik yang direncanakan maupun tidak. Pertanyaan: "Apa perbedaan yang dibuat program ini, termasuk yang tidak direncanakan?"
Apakah manfaat program berlanjut setelah program berakhir? Pertanyaan: "Apakah perubahan ini akan bertahan?" Kritis untuk program dengan pendanaan donor yang terbatas waktu.
Untuk program yang masih dalam tahap pengembangan — ketika teori perubahan belum final. Evaluator bekerja bersama tim program secara real-time. Sangat relevan untuk program inovatif di konteks yang berubah. Kurang tepat untuk akuntabilitas karena tidak memberikan verdict "berhasil/gagal".
Pertanyaan: "Apa yang berhasil, untuk siapa, dalam konteks apa, dan mengapa?" Fokus pada mekanisme: bagaimana program menghasilkan perubahan? Sangat berguna untuk program kesehatan reproduksi di mana konteks sangat menentukan: intervensi yang berhasil di Jawa mungkin tidak berhasil di Papua dengan mekanisme yang sama.
Menguji teori perubahan program: apakah mekanisme yang diasumsikan dalam logic model benar-benar bekerja? Bukan hanya "apakah berhasil?" tetapi "mengapa berhasil atau tidak?" Paling informatif untuk pembelajaran dan pengembangan program.
Evaluasi program keluarga berencana awal: hampir sepenuhnya berbasis statistik demografis. Pertanyaan utama: apakah angka kelahiran turun? Metode: analisis data sensus dan survei demografi. Keterbatasan: mengabaikan dimensi kualitas layanan, hak reproduksi, dan pengalaman perempuan.
Pengaruh manajemen berbasis hasil (results-based management). Evaluasi mulai memperhatikan proses implementasi dan efisiensi. Munculnya logical framework (logframe) sebagai alat perencanaan dan evaluasi. Masih sangat top-down: evaluasi oleh pakar eksternal untuk donor.
Konferensi Internasional Kependudukan dan Pembangunan (Cairo 1994): pergeseran fundamental dari target demografis ke kesehatan reproduksi berbasis hak. Implikasi untuk evaluasi: tidak lagi cukup mengukur cakupan KB — perlu mengukur kualitas, pilihan, dan pengalaman perempuan. Munculnya indikator baru: unmet need, method mix, quality of care.
Tekanan untuk menunjukkan "evidence" dari program. Proliferasi RCT dan quasi-experimental designs. Munculnya systematic reviews dan meta-analysis. SDG 3 dan 5: target global yang memerlukan evaluasi nasional yang konsisten.
Program KB Indonesia: salah satu yang paling berhasil di dunia dalam menurunkan TFR (Total Fertility Rate) dari 5,6 ke 2,6. Evaluasi: terutama berbasis indikator demografis dan cakupan. Sistem BKKBN: infrastruktur data yang kuat untuk monitoring cakupan KB. Kritik: dimensi kualitas dan hak reproduksi kurang diperhatikan — laporan tentang tekanan dan paksaan dalam program KB tidak dievaluasi secara independen.
Desentralisasi: program kesehatan reproduksi menjadi tanggung jawab daerah → fragmentasi sistem evaluasi. BKKBN kehilangan posisi strategis → dampak pada kontinuitas monitoring program KB. TFR stagnan di 2,6 → "demographic stagnation". Evaluasi mulai mempertanyakan: mengapa penurunan TFR berhenti?
Reposisi BKKBN dan program KKBPK (Kependudukan, Keluarga Berencana, dan Pembangunan Keluarga). SDKI sebagai instrumen evaluasi nasional utama. Meningkatnya perhatian pada kesehatan reproduksi remaja: program GenRe (Generasi Berencana). Evaluasi program KIA (Kesehatan Ibu dan Anak) dalam konteks penurunan AKI dan AKB yang stagnan. Tantangan: kapasitas evaluasi di daerah masih sangat bervariasi — DKI Jakarta berbeda jauh dengan Maluku atau Papua.
Keputusan klinis dan manajerial seharusnya berbasis bukti — termasuk bukti dari evaluasi program. Kemampuan membaca dan mengkritisi laporan evaluasi secara kritis adalah prasyarat. Tanpa kompetensi ini: rentan terhadap evaluasi berkualitas rendah yang dikemas dengan baik.
Data klinis yang dikumpulkan di fasilitas adalah salah satu sumber data evaluasi program yang paling penting. Kualitas data yang dikumpulkan menentukan kualitas evaluasi. Subsp.Obginsos yang memahami evaluasi akan mengumpulkan data yang lebih relevan dan valid.
Di level kabupaten dan provinsi: Subsp.Obginsos sering dalam posisi untuk memimpin atau mengawasi evaluasi program KIA dan kesehatan reproduksi. Di level nasional: berkontribusi pada pengembangan standar evaluasi.
Hasil evaluasi yang kuat adalah argumen paling efektif untuk mendapat sumber daya, mengubah kebijakan, atau menghentikan program yang tidak efektif. Subsp.Obginsos yang dapat menggunakan data evaluasi untuk advokasi adalah aset yang sangat berharga.
Ekosistem Evaluasi Program Kesehatan Reproduksi di Indonesia:
Seringkali diminta memberikan penilaian tentang program tanpa data yang cukup. Tekanan untuk memberikan kesimpulan positif meskipun bukti lemah. Strategi: tegaskan batasan apa yang dapat dan tidak dapat disimpulkan berdasarkan data yang tersedia.
Manajer program sering melihat evaluasi sebagai ancaman terhadap program dan posisi mereka. Resistensi terhadap evaluasi yang objektif. Strategi: frame evaluasi sebagai pembelajaran, bukan penilaian; pastikan pemangku kepentingan terlibat sejak awal.
Evaluasi yang jujur akan menghasilkan temuan yang tidak sesuai harapan. Tekanan untuk mengubah temuan atau tidak mempublikasikan. Prinsip etis yang tidak dapat dikompromikan: integritas data dan kesimpulan tidak dapat dinegosiasikan.
Evaluasi memerlukan data yang berkualitas. Banyak program KIA tidak memiliki sistem data yang cukup untuk evaluasi yang bermakna. Strategi: bangun sistem data evaluasi sejak desain program, bukan setelah program selesai.
Modul 1 adalah modul tanpa tugas. Thread diskusi di bawah ini adalah refleksi formatif untuk membangun fondasi konseptual sebelum modul-modul berikutnya.
Pertanyaan 1: Dr. Farid menemukan bahwa program Kesehatan Reproduksi Remaja Nasional dengan anggaran Rp 340 miliar selama 4 tahun tidak memiliki data outcome yang sistematis. Menggunakan kerangka yang dibahas dalam modul ini: (a) identifikasikan tipe evaluasi apa yang seharusnya sudah dilakukan pada titik-titik berbeda selama program berlangsung — dan apa pertanyaan spesifik yang seharusnya dijawab oleh setiap tipe evaluasi tersebut; (b) dari perspektif OECD DAC criteria, dimensi apa yang paling kritis yang gagal diperhatikan dalam program ini? Berikan justifikasi dengan mengacu pada situasi konkret yang dideskripsikan; (c) siapa saja pemangku kepentingan yang seharusnya dilibatkan dalam evaluasi program ini — dan mengapa keterlibatan mereka penting tidak hanya secara prosedural tetapi juga secara substansif?
Pertanyaan 2: Anda adalah Subsp.Obginsos yang baru ditugaskan sebagai anggota tim teknis evaluasi program Kesehatan Reproduksi Remaja di provinsi Anda. Direktur Dinkes meminta Anda memberikan rekomendasi dalam dua minggu — "cukup berdasarkan data yang sudah ada." Menggunakan pemahaman dari Modul 1: (a) apa risiko dari pendekatan evaluasi yang tergesa-gesa tanpa perancangan yang sistematis, dan bagaimana risiko ini berdampak pada kualitas keputusan yang akan diambil? (b) minimal kondisi apa yang harus ada agar evaluasi yang dilakukan — meskipun singkat dan berbasis data yang sudah tersedia — tetap dapat menghasilkan kesimpulan yang dapat dipertahankan? (c) bagaimana Anda akan memposisikan peran Anda sebagai Subsp.Obginsos dalam tim evaluasi ini — apa yang unik tentang kontribusi Anda dibandingkan anggota tim yang lain?