Mengelola Bias, Confounding, dan Validitas Internal Penelitian
MK Epidemiologi Klinik & Biostatistik Lanjut (6 SKS)
Dr.dr. Budi Siswanto, Sp.OG., Subsp.Obginsos., SH., S.Kom.
Konsultan Obstetri Ginekologi Sosial
Deskripsi Modul
Penelitian yang dirancang dengan baik tetapi gagal mengenali dan mengelola bias serta confounding akan menghasilkan kesimpulan yang menyesatkan — dan dalam konteks kebijakan kesehatan reproduksi, kesimpulan yang salah dapat berakibat fatal. Program KIA yang diimplementasikan berdasarkan bukti yang terdistorsi bias akan membuang sumber daya, melewatkan intervensi yang efektif, atau bahkan memperburuk situasi yang ingin diperbaiki.
Modul ini membahas tiga ancaman utama validitas internal penelitian epidemiologi: bias, confounding, dan chance (kebetulan statistik). Ketiganya adalah sumber kesalahan sistematis atau acak yang dapat membuat hubungan yang sebenarnya tidak ada tampak ada, atau sebaliknya menyembunyikan hubungan yang nyata. Memahami ketiganya bukan hanya kompetensi metodologis — ini adalah kompetensi etis seorang konsultan yang bertanggung jawab terhadap rekomendasi berbasis bukti.
Capaian Pembelajaran Modul
Setelah menyelesaikan modul ini, peserta didik mampu:
Mendefinisikan dan membedakan tiga sumber kesalahan utama dalam penelitian epidemiologi: bias, confounding, dan chance
Mengidentifikasi jenis-jenis bias seleksi dan bias informasi yang relevan dalam penelitian obstetri ginekologi
Menjelaskan konsep confounding, kriteria confounding variable, dan membedakannya dari effect modifier
Menerapkan strategi pengendalian bias dan confounding pada tahap desain maupun analisis penelitian
Mengevaluasi validitas internal suatu studi penelitian obstetri secara kritis
Materi Inti
C.1. Kerangka Konseptual: Tiga Ancaman Validitas Internal
Sebelum menyimpulkan bahwa suatu paparan menyebabkan suatu outcome, peneliti harus secara sistematis menyingkirkan tiga penjelasan alternatif:
Setelah ketiganya disingkirkan secara memadai, barulah hubungan kausal dapat dipertimbangkan menggunakan kriteria kausalitas — yang akan dibahas lebih mendalam di Modul 4 dan seterusnya.
C.2. Bias
Definisi: Bias adalah kesalahan sistematis dalam desain, pengumpulan, analisis, atau interpretasi data yang menghasilkan estimasi hubungan yang menyimpang dari nilai sebenarnya secara konsisten — bukan secara acak.
Bias berbeda dari chance: chance dapat diperkecil dengan memperbesar sampel, sedangkan bias tidak hilang meskipun sampel diperbesar. Justru dengan sampel yang besar, bias akan semakin presisi menghasilkan jawaban yang salah.
Terdapat dua kategori utama bias dalam penelitian epidemiologi:
C.2.1. Bias Seleksi (Selection Bias)
Terjadi ketika mekanisme seleksi partisipan ke dalam studi menghasilkan kelompok yang tidak representatif dari populasi sumber, sehingga hubungan paparan-outcome dalam sampel berbeda dari hubungan sebenarnya di populasi.
Klasik dalam penelitian berbasis rumah sakit. Pasien yang dirawat di RS bukan representasi acak dari populasi — mereka adalah subkelompok dengan karakteristik tertentu. Jika paparan dan outcome keduanya mempengaruhi kemungkinan masuk RS, asosiasi yang ditemukan dapat terdistorsi.
Contoh dalam obstetri: Studi yang meneliti hubungan antara anemia dan preeklampsia menggunakan sampel ibu di RS tipe A. Ibu dengan anemia ringan mungkin tidak dirujuk ke RS, dan ibu dengan preeklampsia ringan mungkin ditangani di Puskesmas. Akibatnya, studi ini over-representasi kasus berat dari kedua kondisi, menghasilkan estimasi asosiasi yang terdistorsi.
Terjadi dalam studi kohort berbasis pekerjaan. Pekerja aktif cenderung lebih sehat dari populasi umum karena individu yang sakit telah meninggalkan pekerjaan.
Analogi dalam obstetri: Ibu yang datang ke ANC secara konsisten cenderung lebih termotivasi, lebih sehat, dan lebih berdaya secara sosial-ekonomi dibanding yang tidak datang.
Dalam studi kohort, jika peserta yang drop out berbeda secara sistematis dari yang tetap tinggal dalam studi, hasil dapat terdistorsi.
Contoh dalam obstetri: Kohort ibu hamil yang diikuti hingga persalinan. Ibu dengan komplikasi berat mungkin dirujuk ke RS lain dan hilang dari follow-up. Jika analisis hanya menggunakan data yang lengkap, hasil akan under-estimate komplikasi.
Relevan untuk studi cross-sectional. Jika kondisi tertentu menyebabkan kematian cepat atau penyembuhan cepat sebelum pengukuran dilakukan, prevalensi kondisi tersebut akan under-estimated.
Contoh dalam obstetri: Studi cross-sectional prevalensi eklamsia akan under-estimate kondisi ini karena ibu dengan eklamsia berat mungkin sudah meninggal atau sudah sembuh sebelum survei dilakukan.
C.2.2. Bias Informasi (Information Bias / Misclassification Bias)
Terjadi ketika pengukuran paparan atau outcome tidak akurat, sehingga partisipan salah diklasifikasikan.
Kasus cenderung lebih mengingat paparan di masa lalu dibanding kontrol, karena mereka telah "mencari alasan" atas kondisi mereka.
Contoh dalam obstetri: Studi kasus-kontrol tentang hubungan konsumsi obat selama kehamilan dengan cacat lahir. Ibu yang bayinya lahir cacat (kasus) akan lebih intensif mengingat dan melaporkan setiap obat yang dikonsumsi dibanding ibu dengan bayi normal (kontrol). Ini menghasilkan OR yang over-estimated.
Strategi pengendalian:
- Gunakan catatan medis atau biomarker objektif
- Standardisasi pertanyaan dengan kuesioner terstruktur
- Blinding pewawancara terhadap status kasus/kontrol
Pewawancara yang mengetahui status paparan partisipan (dalam kohort) atau status kasus/kontrol (dalam case-control) dapat secara tidak sadar mengajukan pertanyaan yang berbeda atau menginterpretasikan jawaban secara berbeda.
Strategi pengendalian:
- Blinding pewawancara
- Gunakan kuesioner terstruktur yang sama untuk semua partisipan
- Rekam dan audit wawancara secara acak
Non-differential
Kesalahan klasifikasi terjadi sama pada kelompok terpapar dan tidak terpapar. Efek: cenderung bias menuju null (under-estimate asosiasi).
Differential
Kesalahan klasifikasi berbeda antara kelompok. Effek: dapat bias ke segala arah.
Implikasi praktis: Penelitian yang menggunakan pengukuran paparan yang tidak akurat (misal: data ANC dari laporan bidan yang mungkin inflated) cenderung menghasilkan under-estimate hubungan ANC dengan luaran maternal.
C.3. Confounding
Definisi: Confounding terjadi ketika suatu variabel ketiga (confounder) secara bersamaan berhubungan dengan paparan DAN outcome, dan bukan merupakan bagian dari jalur kausal antara paparan dan outcome — sehingga menciptakan hubungan semu atau menyembunyikan hubungan yang nyata.
Tiga Kriteria Confounding Variable:
Confounder berhubungan dengan PAPARAN
Confounder berhubungan dengan OUTCOME
Confounder BUKAN intermediate dalam jalur kausal
Contoh Klasik dalam Obstetri:
Pertanyaan: Apakah persalinan sesar (SC) meningkatkan risiko kematian neonatal?
Data mentah: Neonatal dari persalinan SC memiliki mortalitas lebih tinggi.
Confounder: Indikasi medis untuk SC (gawat janin, plasenta previa, preeklampsia berat).
Penjelasan: Ibu yang menjalani SC umumnya memiliki komplikasi obstetri yang lebih berat, yang secara independen meningkatkan risiko kematian neonatal. Tanpa mengontrol indikasi SC, analisis akan menghasilkan kesimpulan menyesatkan bahwa SC itu sendiri yang menyebabkan kematian neonatal.
C.3.1. Membedakan Confounding dari Effect Modification
Ini adalah konsep yang sering membingungkan namun krusial.
Confounding adalah bias yang harus dieliminasi. Effect modification (interaksi) adalah fenomena biologis/sosial yang nyata dan informatif — harus dilaporkan, bukan dieliminasi.
| Dimensi | Confounding | Effect Modification |
|---|---|---|
| Sifat | Artefak metodologis (bias) | Fenomena biologis nyata |
| Yang dilakukan | Dieliminasi/dikontrol | Dilaporkan dan dianalisis terpisah |
| Implikasi | Mengganggu estimasi asosiasi | Memberikan informasi tentang subkelompok |
| Deteksi | Membandingkan crude vs. adjusted estimate | Membandingkan stratum-specific estimates |
Contoh effect modification dalam obstetri: Efek suplementasi besi pada pencegahan BBLR mungkin berbeda antara ibu dengan anemia berat (efek besar) dan ibu tanpa anemia (efek minimal). Di sini, status anemia adalah effect modifier, bukan confounder. Melaporkan efek rata-rata tanpa stratifikasi ini akan menyembunyikan informasi klinis yang penting.
C.3.2. Strategi Pengendalian Confounding
Pada Tahap Desain:
a. Randomisasi
Hanya tersedia dalam RCT. Mendistribusikan semua confounder (yang diketahui maupun tidak) secara merata antara kelompok.
b. Restriction (Pembatasan)
Membatasi studi hanya pada subkelompok dengan nilai confounder tertentu.
Contoh: Untuk menghindari confounding oleh usia, batasi studi hanya pada ibu usia 20–35 tahun.
Kelemahan: Mengurangi generalisabilitas dan ukuran sampel.
c. Matching
Memilih kontrol yang memiliki nilai confounder yang sama dengan kasus.
Perhatian: Variabel yang di-match tidak dapat dianalisis sebagai variabel independen.
Pada Tahap Analisis:
a. Stratifikasi (Mantel-Haenszel)
Menghitung ukuran asosiasi secara terpisah untuk setiap stratum confounder, kemudian menggabungkan estimasi.
b. Multivariable Regression
Memasukkan confounder sebagai kovariat dalam model:
- • Regresi logistik untuk outcome biner
- • Regresi Cox untuk data survival
- • Regresi linear untuk outcome kontinu
c. Propensity Score Analysis
Menghitung probabilitas menerima paparan berdasarkan semua confounder, kemudian menggunakan skor untuk matching atau weighting.
Prasyarat penting: Model regresi hanya mengontrol confounding yang diukur dan dimasukkan ke dalam model. Unmeasured confounding tetap menjadi ancaman dalam studi observasional.
C.4. Chance dan Ukuran Statistik
Meskipun bukan "bias" dalam pengertian teknis, peran kebetulan (chance) perlu dikelola melalui desain yang memadai.
Ukuran utama:
p-value
Probabilitas mendapatkan hasil setidaknya seekstrem yang diamati, jika hipotesis null benar. Bukan probabilitas bahwa hipotesis null benar atau salah.
Confidence Interval (CI)
Rentang nilai yang dengan tingkat kepercayaan tertentu (biasanya 95%) mengandung nilai parameter populasi yang sebenarnya. CI yang sempit menunjukkan presisi tinggi.
Catatan Kritis:
Dalam epidemiologi modern, ketergantungan berlebihan pada p-value telah banyak dikritisi. Sebuah hasil dengan p=0,049 tidak secara fundamental berbeda dari p=0,051. Yang lebih penting adalah besarnya efek (effect size) dan lebar CI.
American Statistical Association (2019) secara eksplisit merekomendasikan pergeseran dari dikotomi "signifikan/tidak signifikan" menuju evaluasi yang lebih nuansif.
C.5. Checklist Evaluasi Validitas Internal
Ketika mengevaluasi suatu studi (atau merancang studi sendiri), gunakan checklist berikut:
Bias Seleksi
Bias Informasi
Confounding
Pertanyaan Diskusi
Thread Dosen – Minggu 3
Pertanyaan 1:
Sebuah studi kasus-kontrol di RSUD Provinsi menemukan bahwa ibu yang melahirkan malam hari (pukul 20.00–08.00) memiliki risiko kematian 2,3 kali lebih tinggi dibanding yang melahirkan siang hari (OR = 2,3; 95% CI: 1,4–3,8). Peneliti menyimpulkan bahwa "persalinan malam hari berbahaya dan harus dihindari."
Identifikasi minimal DUA jenis bias atau confounding yang mungkin menjelaskan temuan ini selain hubungan kausal yang diklaim peneliti. Jelaskan mekanismenya secara spesifik.
Pertanyaan 2:
Anda membaca sebuah studi kohort yang menyimpulkan bahwa ibu yang mengikuti kelas ibu hamil memiliki risiko persalinan dengan komplikasi 40% lebih rendah (RR = 0,60; 95% CI: 0,45–0,80). Seorang kolega Anda langsung merekomendasikan program kelas ibu hamil ke seluruh puskesmas di kabupaten berdasarkan studi ini.
Dengan menggunakan konsep confounding dan validitas eksternal, berikan penilaian kritis: apakah rekomendasi kolega Anda sudah tepat? Faktor apa yang perlu dievaluasi lebih lanjut sebelum mengimplementasikan kebijakan tersebut?
Rangkuman
Tiga ancaman utama validitas internal adalah bias (kesalahan sistematis), confounding (variabel ketiga yang mengacaukan hubungan), dan chance (kebetulan statistik) — ketiganya harus dievaluasi sebelum menyimpulkan hubungan kausal
Bias seleksi terjadi akibat mekanisme rekrutmen yang tidak representatif; bias informasi terjadi akibat pengukuran yang tidak akurat — keduanya tidak hilang meskipun sampel diperbesar
Confounder memenuhi tiga kriteria: berhubungan dengan paparan, berhubungan dengan outcome, dan bukan intermediate dalam jalur kausal — berbeda fundamental dari effect modifier yang merupakan fenomena nyata dan harus dilaporkan
Strategi pengendalian confounding pada tahap desain meliputi randomisasi, restriction, dan matching; pada tahap analisis meliputi stratifikasi dan regresi multivariabel
Evaluasi validitas internal adalah kompetensi wajib konsultan Obginsos sebelum mengadopsi bukti untuk rekomendasi kebijakan
Referensi
1. Rothman KJ, Greenland S, Lash TL. Modern Epidemiology. 3rd ed. Philadelphia: Lippincott Williams & Wilkins; 2008.
2. Szklo M, Nieto FJ. Epidemiology: Beyond the Basics. 4th ed. Burlington: Jones & Bartlett Learning; 2019.
3. Hernán MA, Robins JM. Causal Inference: What If. Boca Raton: Chapman & Hall/CRC; 2020. (free online)
4. Grimes DA, Schulz KF. Bias and causal associations in observational research. Lancet. 2002;359(9302):248-252.
5. Schlesselman JJ. Case-Control Studies: Design, Conduct, Analysis. New York: Oxford University Press; 1982.
6. Greenland S, Morgenstern H. Confounding in health research. Annual Review of Public Health. 2001;22:189-212.
7. Wasserstein RL, Schirm AL, Lazar NA. Moving to a world beyond "p < 0.05." The American Statistician. 2019;73(sup1):1-19.
8. VanderWeele TJ. Explanation in Causal Inference: Methods for Mediation and Interaction. New York: Oxford University Press; 2015.
9. Sterne JA, Hernán MA, Reeves BC, et al. ROBINS-I: a tool for assessing risk of bias in non-randomised studies of interventions. BMJ. 2016;355:i4919.
10. WHO. WHO Recommendations on Antenatal Care for a Positive Pregnancy Experience. Geneva: WHO; 2016.
Tugas Kelompok 1 – Minggu 3
Mata Kuliah: Epidemiologi Klinik & Biostatistik Lanjut
Materi: Modul 1–3 (Epidemiologi Dasar, Desain Penelitian, Bias & Confounding)
Identitas Tugas
| Jenis Tugas | Tugas Kelompok Pertama |
| Minggu | Minggu ke-3 |
| Bobot Nilai | 15% dari nilai akhir mata kuliah |
| Komposisi Kelompok | 3–4 orang per kelompok (ditentukan oleh fakultas) |
| Batas Pengumpulan | Akhir Minggu ke-3 (7 hari sejak tugas dibuka) |
| Format Pengumpulan | Dokumen Word / PDF + slide presentasi (maks 10 slide) |
| Panjang Laporan | 1.500–2.500 kata (tidak termasuk referensi) |
Petunjuk Pengerjaan:
- Setiap kelompok mendapat satu artikel penelitian yang sama (dilampirkan oleh fakultas di LMS)
- Seluruh anggota kelompok wajib membaca artikel secara mandiri sebelum diskusi kelompok
- Pembagian peran dalam kelompok (koordinator, penulis, reviewer, presenter) diserahkan kepada kelompok
- Laporan ditulis dalam satu dokumen terpadu — bukan gabungan jawaban individual
- Pada halaman pertama, cantumkan: nama lengkap semua anggota, NIM, dan pembagian peran
- Plagiarisme antar kelompok maupun dari sumber lain tanpa sitasi akan menghasilkan nilai nol
Artikel yang Digunakan
Fakultas menyediakan artikel berikut di LMS (full-text tersedia):
Filippi V, Chou D, Ronsmans C, Graham W, Say L. Levels and Causes of Maternal Mortality and Morbidity. In: Black RE, Laxminarayan R, Temmerman M, Walker N, editors. Reproductive, Maternal, Newborn, and Child Health: Disease Control Priorities. 3rd ed. Vol. 2. Washington DC: World Bank; 2016. Chapter 3.
URL: https://www.ncbi.nlm.nih.gov/books/NBK361917/
Catatan: Apabila artikel ini tidak dapat diakses, fakultas dapat mengganti dengan artikel setara yang tersedia di PubMed Central (open access). Konfirmasi ke koordinator mata kuliah.
I Bagian I — Ringkasan Artikel (Bobot 10%)
Tulis ringkasan artikel dalam maksimal 300 kata yang mencakup:
- Pertanyaan penelitian atau tujuan utama artikel
- Desain studi dan sumber data yang digunakan
- Populasi yang diteliti
- Temuan utama
- Kesimpulan penulis
Catatan: Ringkasan harus ditulis dengan kata-kata sendiri — bukan terjemahan langsung dari abstrak.
II Bagian II — Analisis Desain Penelitian (Bobot 25%)
Berdasarkan Modul 2, jawab pertanyaan berikut:
2a.
Klasifikasikan desain penelitian yang digunakan dalam artikel ini. Apakah termasuk deskriptif, analitik observasional, atau eksperimental? Jelaskan alasan klasifikasi Anda.
2b.
Dalam hierarki bukti ilmiah, di tingkat mana artikel ini berada? Apa implikasi tingkat ini terhadap kekuatan kesimpulan yang dapat ditarik?
2c.
Identifikasi satu kelebihan dan satu keterbatasan utama desain yang digunakan, khususnya dalam konteks penerapannya untuk menghasilkan rekomendasi kebijakan KIA di negara berkembang.
III Bagian III — Identifikasi Bias & Confounding (Bobot 35%)
Berdasarkan Modul 3, jawab pertanyaan berikut:
3a.
Identifikasi minimal dua potensi bias. Untuk setiap bias:
- Jelaskan mekanisme spesifik bagaimana bias tersebut dapat muncul
- Nilai arah kemungkinan distorsi (over-estimate atau under-estimate?)
- Apakah penulis mengakui bias ini? Bagaimana mengatasinya?
3b.
Identifikasi minimal satu variabel confounding potensial. Jelaskan:
- Mengapa variabel tersebut memenuhi ketiga kriteria confounding
- Apakah artikel telah mengontrol variabel ini? Metode apa?
3c.
Apakah Anda menemukan indikasi effect modification dalam artikel ini? Jika ya, jelaskan variabel apa yang berperan sebagai effect modifier dan implikasi klinisnya. Jika tidak, jelaskan variabel apa yang seharusnya dieksplorasi dan mengapa.
IV Bagian IV — Relevansi untuk Kebijakan KIA Indonesia (Bobot 20%)
4a.
Identifikasi dua implikasi kebijakan yang relevan untuk program KIA di Indonesia. Untuk setiap implikasi:
- Sebutkan temuan spesifik yang menjadi dasar rekomendasi
- Pertimbangkan keterbatasan metodologis
- Identifikasi apakah bukti ini cukup kuat atau memerlukan penelitian konfirmasi
4b.
Apabila Anda adalah tim peneliti yang ingin melakukan studi lanjutan berdasarkan keterbatasan artikel ini di konteks Indonesia, desain penelitian apa yang akan Anda usulkan? Sebutkan: jenis desain, populasi target, paparan utama, outcome yang diukur, dan satu strategi pengendalian confounding.
V Bagian V — Refleksi Kelompok (Bobot 10%)
Tulis refleksi kelompok dalam maksimal 200 kata yang menjawab:
- Apa konsep dari Modul 1–3 yang paling menantang untuk diterapkan dalam telaah artikel ini?
- Apakah ada perbedaan perspektif antar anggota kelompok? Bagaimana mencapai kesepakatan?
- Satu pertanyaan yang masih belum terjawab dari diskusi kelompok Anda
Rubrik Penilaian
| Bagian | Komponen | Bobot |
|---|---|---|
| Bagian I | Akurasi dan kelengkapan ringkasan; kemampuan mengidentifikasi elemen kunci studi | 10% |
| Bagian II | Ketepatan klasifikasi desain; pemahaman hierarki bukti; analisis kelebihan-keterbatasan | 25% |
| Bagian III | Kedalaman identifikasi bias; ketepatan analisis confounding; membedakan dari effect modification | 35% |
| Bagian IV | Relevansi implikasi kebijakan; kehati-hatian dalam mengekstrapolasi bukti | 20% |
| Bagian V | Keaslian refleksi; bukti adanya diskusi substantif antar anggota | 10% |
Format Slide Presentasi
Siapkan presentasi maksimal 10 slide dengan struktur:
Presentasi dilakukan secara daring di awal Minggu ke-4. Setiap kelompok mendapat 10 menit presentasi + 5 menit tanya jawab.
Panduan Referensi Minimal
Laporan harus mencantumkan minimal 5 referensi selain artikel utama:
- Rothman KJ, Greenland S, Lash TL. Modern Epidemiology. 3rd ed. 2008.
- Szklo M, Nieto FJ. Epidemiology: Beyond the Basics. 4th ed. 2019.
- Grimes DA, Schulz KF. Bias and causal associations in observational research. Lancet. 2002.
- Hernán MA, Robins JM. Causal Inference: What If. 2020. (free online)
- WHO. Trends in Maternal Mortality 2000–2020. Geneva: WHO; 2023.