Semester 1 | Periode 1 | Sesi 1

Mengelola Bias, Confounding, dan Validitas Internal Penelitian

MK Epidemiologi Klinik & Biostatistik Lanjut (6 SKS)

Dr.dr. Budi Siswanto, Sp.OG., Subsp.Obginsos., SH., S.Kom.

Konsultan Obstetri Ginekologi Sosial

Deskripsi Modul

Penelitian yang dirancang dengan baik tetapi gagal mengenali dan mengelola bias serta confounding akan menghasilkan kesimpulan yang menyesatkan — dan dalam konteks kebijakan kesehatan reproduksi, kesimpulan yang salah dapat berakibat fatal. Program KIA yang diimplementasikan berdasarkan bukti yang terdistorsi bias akan membuang sumber daya, melewatkan intervensi yang efektif, atau bahkan memperburuk situasi yang ingin diperbaiki.

Modul ini membahas tiga ancaman utama validitas internal penelitian epidemiologi: bias, confounding, dan chance (kebetulan statistik). Ketiganya adalah sumber kesalahan sistematis atau acak yang dapat membuat hubungan yang sebenarnya tidak ada tampak ada, atau sebaliknya menyembunyikan hubungan yang nyata. Memahami ketiganya bukan hanya kompetensi metodologis — ini adalah kompetensi etis seorang konsultan yang bertanggung jawab terhadap rekomendasi berbasis bukti.

Capaian Pembelajaran Modul

Setelah menyelesaikan modul ini, peserta didik mampu:

Mendefinisikan dan membedakan tiga sumber kesalahan utama dalam penelitian epidemiologi: bias, confounding, dan chance

Mengidentifikasi jenis-jenis bias seleksi dan bias informasi yang relevan dalam penelitian obstetri ginekologi

Menjelaskan konsep confounding, kriteria confounding variable, dan membedakannya dari effect modifier

Menerapkan strategi pengendalian bias dan confounding pada tahap desain maupun analisis penelitian

Mengevaluasi validitas internal suatu studi penelitian obstetri secara kritis

Materi Inti

C.1. Kerangka Konseptual: Tiga Ancaman Validitas Internal

Sebelum menyimpulkan bahwa suatu paparan menyebabkan suatu outcome, peneliti harus secara sistematis menyingkirkan tiga penjelasan alternatif:

Apakah hubungan yang ditemukan nyata?

CHANCE

(Kebetulan)

BIAS

(Sistematik)

CONFOUNDING

(Variabel ketiga)

Setelah ketiganya disingkirkan secara memadai, barulah hubungan kausal dapat dipertimbangkan menggunakan kriteria kausalitas — yang akan dibahas lebih mendalam di Modul 4 dan seterusnya.

C.2. Bias

Definisi: Bias adalah kesalahan sistematis dalam desain, pengumpulan, analisis, atau interpretasi data yang menghasilkan estimasi hubungan yang menyimpang dari nilai sebenarnya secara konsisten — bukan secara acak.

Bias berbeda dari chance: chance dapat diperkecil dengan memperbesar sampel, sedangkan bias tidak hilang meskipun sampel diperbesar. Justru dengan sampel yang besar, bias akan semakin presisi menghasilkan jawaban yang salah.

Terdapat dua kategori utama bias dalam penelitian epidemiologi:

C.2.1. Bias Seleksi (Selection Bias)

Terjadi ketika mekanisme seleksi partisipan ke dalam studi menghasilkan kelompok yang tidak representatif dari populasi sumber, sehingga hubungan paparan-outcome dalam sampel berbeda dari hubungan sebenarnya di populasi.

a. Berkson's Bias (Hospital Admission Bias)

Klasik dalam penelitian berbasis rumah sakit. Pasien yang dirawat di RS bukan representasi acak dari populasi — mereka adalah subkelompok dengan karakteristik tertentu. Jika paparan dan outcome keduanya mempengaruhi kemungkinan masuk RS, asosiasi yang ditemukan dapat terdistorsi.

Contoh dalam obstetri: Studi yang meneliti hubungan antara anemia dan preeklampsia menggunakan sampel ibu di RS tipe A. Ibu dengan anemia ringan mungkin tidak dirujuk ke RS, dan ibu dengan preeklampsia ringan mungkin ditangani di Puskesmas. Akibatnya, studi ini over-representasi kasus berat dari kedua kondisi, menghasilkan estimasi asosiasi yang terdistorsi.

b. Healthy Worker Effect

Terjadi dalam studi kohort berbasis pekerjaan. Pekerja aktif cenderung lebih sehat dari populasi umum karena individu yang sakit telah meninggalkan pekerjaan.

Analogi dalam obstetri: Ibu yang datang ke ANC secara konsisten cenderung lebih termotivasi, lebih sehat, dan lebih berdaya secara sosial-ekonomi dibanding yang tidak datang.

c. Loss to Follow-Up Bias

Dalam studi kohort, jika peserta yang drop out berbeda secara sistematis dari yang tetap tinggal dalam studi, hasil dapat terdistorsi.

Contoh dalam obstetri: Kohort ibu hamil yang diikuti hingga persalinan. Ibu dengan komplikasi berat mungkin dirujuk ke RS lain dan hilang dari follow-up. Jika analisis hanya menggunakan data yang lengkap, hasil akan under-estimate komplikasi.

d. Neyman Bias (Prevalence-Incidence Bias)

Relevan untuk studi cross-sectional. Jika kondisi tertentu menyebabkan kematian cepat atau penyembuhan cepat sebelum pengukuran dilakukan, prevalensi kondisi tersebut akan under-estimated.

Contoh dalam obstetri: Studi cross-sectional prevalensi eklamsia akan under-estimate kondisi ini karena ibu dengan eklamsia berat mungkin sudah meninggal atau sudah sembuh sebelum survei dilakukan.

C.2.2. Bias Informasi (Information Bias / Misclassification Bias)

Terjadi ketika pengukuran paparan atau outcome tidak akurat, sehingga partisipan salah diklasifikasikan.

a. Recall Bias

Kasus cenderung lebih mengingat paparan di masa lalu dibanding kontrol, karena mereka telah "mencari alasan" atas kondisi mereka.

Contoh dalam obstetri: Studi kasus-kontrol tentang hubungan konsumsi obat selama kehamilan dengan cacat lahir. Ibu yang bayinya lahir cacat (kasus) akan lebih intensif mengingat dan melaporkan setiap obat yang dikonsumsi dibanding ibu dengan bayi normal (kontrol). Ini menghasilkan OR yang over-estimated.

Strategi pengendalian:

Gunakan catatan medis atau biomarker objektif
Standardisasi pertanyaan dengan kuesioner terstruktur
Blinding pewawancara terhadap status kasus/kontrol

b. Interviewer Bias (Observer Bias)

Pewawancara yang mengetahui status paparan partisipan (dalam kohort) atau status kasus/kontrol (dalam case-control) dapat secara tidak sadar mengajukan pertanyaan yang berbeda atau menginterpretasikan jawaban secara berbeda.

Strategi pengendalian:

Blinding pewawancara
Gunakan kuesioner terstruktur yang sama untuk semua partisipan
Rekam dan audit wawancara secara acak

c. Differential vs. Non-Differential Misclassification

Non-differential

Kesalahan klasifikasi terjadi sama pada kelompok terpapar dan tidak terpapar. Efek: cenderung bias menuju null (under-estimate asosiasi).

Differential

Kesalahan klasifikasi berbeda antara kelompok. Effek: dapat bias ke segala arah.

Implikasi praktis: Penelitian yang menggunakan pengukuran paparan yang tidak akurat (misal: data ANC dari laporan bidan yang mungkin inflated) cenderung menghasilkan under-estimate hubungan ANC dengan luaran maternal.

C.3. Confounding

Definisi: Confounding terjadi ketika suatu variabel ketiga (confounder) secara bersamaan berhubungan dengan paparan DAN outcome, dan bukan merupakan bagian dari jalur kausal antara paparan dan outcome — sehingga menciptakan hubungan semu atau menyembunyikan hubungan yang nyata.

Tiga Kriteria Confounding Variable:

CONFOUNDER

↙ ↘

PAPARAN

≠→

OUTCOME

Confounder berhubungan dengan PAPARAN

Confounder berhubungan dengan OUTCOME

Confounder BUKAN intermediate dalam jalur kausal

Contoh Klasik dalam Obstetri:

Pertanyaan: Apakah persalinan sesar (SC) meningkatkan risiko kematian neonatal?

Data mentah: Neonatal dari persalinan SC memiliki mortalitas lebih tinggi.

Confounder: Indikasi medis untuk SC (gawat janin, plasenta previa, preeklampsia berat).

Penjelasan: Ibu yang menjalani SC umumnya memiliki komplikasi obstetri yang lebih berat, yang secara independen meningkatkan risiko kematian neonatal. Tanpa mengontrol indikasi SC, analisis akan menghasilkan kesimpulan menyesatkan bahwa SC itu sendiri yang menyebabkan kematian neonatal.

C.3.1. Membedakan Confounding dari Effect Modification

Ini adalah konsep yang sering membingungkan namun krusial.

Confounding adalah bias yang harus dieliminasi. Effect modification (interaksi) adalah fenomena biologis/sosial yang nyata dan informatif — harus dilaporkan, bukan dieliminasi.

Dimensi	Confounding	Effect Modification
Sifat	Artefak metodologis (bias)	Fenomena biologis nyata
Yang dilakukan	Dieliminasi/dikontrol	Dilaporkan dan dianalisis terpisah
Implikasi	Mengganggu estimasi asosiasi	Memberikan informasi tentang subkelompok
Deteksi	Membandingkan crude vs. adjusted estimate	Membandingkan stratum-specific estimates

Contoh effect modification dalam obstetri: Efek suplementasi besi pada pencegahan BBLR mungkin berbeda antara ibu dengan anemia berat (efek besar) dan ibu tanpa anemia (efek minimal). Di sini, status anemia adalah effect modifier, bukan confounder. Melaporkan efek rata-rata tanpa stratifikasi ini akan menyembunyikan informasi klinis yang penting.

C.3.2. Strategi Pengendalian Confounding

Pada Tahap Desain:

a. Randomisasi

Hanya tersedia dalam RCT. Mendistribusikan semua confounder (yang diketahui maupun tidak) secara merata antara kelompok.

b. Restriction (Pembatasan)

Membatasi studi hanya pada subkelompok dengan nilai confounder tertentu.

Contoh: Untuk menghindari confounding oleh usia, batasi studi hanya pada ibu usia 20–35 tahun.

Kelemahan: Mengurangi generalisabilitas dan ukuran sampel.

c. Matching

Memilih kontrol yang memiliki nilai confounder yang sama dengan kasus.

Perhatian: Variabel yang di-match tidak dapat dianalisis sebagai variabel independen.

Pada Tahap Analisis:

a. Stratifikasi (Mantel-Haenszel)

Menghitung ukuran asosiasi secara terpisah untuk setiap stratum confounder, kemudian menggabungkan estimasi.

b. Multivariable Regression

Memasukkan confounder sebagai kovariat dalam model:

• Regresi logistik untuk outcome biner
• Regresi Cox untuk data survival
• Regresi linear untuk outcome kontinu

c. Propensity Score Analysis

Menghitung probabilitas menerima paparan berdasarkan semua confounder, kemudian menggunakan skor untuk matching atau weighting.

Prasyarat penting: Model regresi hanya mengontrol confounding yang diukur dan dimasukkan ke dalam model. Unmeasured confounding tetap menjadi ancaman dalam studi observasional.

C.4. Chance dan Ukuran Statistik

Meskipun bukan "bias" dalam pengertian teknis, peran kebetulan (chance) perlu dikelola melalui desain yang memadai.

Ukuran utama:

p-value

Probabilitas mendapatkan hasil setidaknya seekstrem yang diamati, jika hipotesis null benar. Bukan probabilitas bahwa hipotesis null benar atau salah.

Confidence Interval (CI)

Rentang nilai yang dengan tingkat kepercayaan tertentu (biasanya 95%) mengandung nilai parameter populasi yang sebenarnya. CI yang sempit menunjukkan presisi tinggi.

Catatan Kritis:

Dalam epidemiologi modern, ketergantungan berlebihan pada p-value telah banyak dikritisi. Sebuah hasil dengan p=0,049 tidak secara fundamental berbeda dari p=0,051. Yang lebih penting adalah besarnya efek (effect size) dan lebar CI.

American Statistical Association (2019) secara eksplisit merekomendasikan pergeseran dari dikotomi "signifikan/tidak signifikan" menuju evaluasi yang lebih nuansif.

C.5. Checklist Evaluasi Validitas Internal

Ketika mengevaluasi suatu studi (atau merancang studi sendiri), gunakan checklist berikut:

Bias Seleksi

Apakah populasi sumber didefinisikan dengan jelas?

Apakah mekanisme rekrutmen dapat menghasilkan sampel yang tidak representatif?

Berapa tingkat partisipasi/response rate?

Dalam kohort: berapa loss to follow-up?

Bias Informasi

Bagaimana paparan diukur? Objektif atau subjektif?

Apakah pengukur mengetahui status paparan/outcome?

Apakah instrumen pengukuran divalidasi?

Apakah misklasifikasi differential atau non-differential?

Confounding

Confounder potensial apa yang telah diidentifikasi?

Apakah semua confounder penting diukur?

Metode apa yang digunakan untuk mengontrol?

Apakah unmeasured confounding dibahas?

Pertanyaan Diskusi

Thread Dosen – Minggu 3

Pertanyaan 1:

Sebuah studi kasus-kontrol di RSUD Provinsi menemukan bahwa ibu yang melahirkan malam hari (pukul 20.00–08.00) memiliki risiko kematian 2,3 kali lebih tinggi dibanding yang melahirkan siang hari (OR = 2,3; 95% CI: 1,4–3,8). Peneliti menyimpulkan bahwa "persalinan malam hari berbahaya dan harus dihindari."

Identifikasi minimal DUA jenis bias atau confounding yang mungkin menjelaskan temuan ini selain hubungan kausal yang diklaim peneliti. Jelaskan mekanismenya secara spesifik.

Pertanyaan 2:

Anda membaca sebuah studi kohort yang menyimpulkan bahwa ibu yang mengikuti kelas ibu hamil memiliki risiko persalinan dengan komplikasi 40% lebih rendah (RR = 0,60; 95% CI: 0,45–0,80). Seorang kolega Anda langsung merekomendasikan program kelas ibu hamil ke seluruh puskesmas di kabupaten berdasarkan studi ini.

Dengan menggunakan konsep confounding dan validitas eksternal, berikan penilaian kritis: apakah rekomendasi kolega Anda sudah tepat? Faktor apa yang perlu dievaluasi lebih lanjut sebelum mengimplementasikan kebijakan tersebut?

Rangkuman

Tiga ancaman utama validitas internal adalah bias (kesalahan sistematis), confounding (variabel ketiga yang mengacaukan hubungan), dan chance (kebetulan statistik) — ketiganya harus dievaluasi sebelum menyimpulkan hubungan kausal

Bias seleksi terjadi akibat mekanisme rekrutmen yang tidak representatif; bias informasi terjadi akibat pengukuran yang tidak akurat — keduanya tidak hilang meskipun sampel diperbesar

Confounder memenuhi tiga kriteria: berhubungan dengan paparan, berhubungan dengan outcome, dan bukan intermediate dalam jalur kausal — berbeda fundamental dari effect modifier yang merupakan fenomena nyata dan harus dilaporkan

Strategi pengendalian confounding pada tahap desain meliputi randomisasi, restriction, dan matching; pada tahap analisis meliputi stratifikasi dan regresi multivariabel

Evaluasi validitas internal adalah kompetensi wajib konsultan Obginsos sebelum mengadopsi bukti untuk rekomendasi kebijakan

Referensi

1. Rothman KJ, Greenland S, Lash TL. Modern Epidemiology. 3rd ed. Philadelphia: Lippincott Williams & Wilkins; 2008.

2. Szklo M, Nieto FJ. Epidemiology: Beyond the Basics. 4th ed. Burlington: Jones & Bartlett Learning; 2019.

3. Hernán MA, Robins JM. Causal Inference: What If. Boca Raton: Chapman & Hall/CRC; 2020. (free online)

4. Grimes DA, Schulz KF. Bias and causal associations in observational research. Lancet. 2002;359(9302):248-252.

5. Schlesselman JJ. Case-Control Studies: Design, Conduct, Analysis. New York: Oxford University Press; 1982.

6. Greenland S, Morgenstern H. Confounding in health research. Annual Review of Public Health. 2001;22:189-212.

7. Wasserstein RL, Schirm AL, Lazar NA. Moving to a world beyond "p < 0.05." The American Statistician. 2019;73(sup1):1-19.

8. VanderWeele TJ. Explanation in Causal Inference: Methods for Mediation and Interaction. New York: Oxford University Press; 2015.

9. Sterne JA, Hernán MA, Reeves BC, et al. ROBINS-I: a tool for assessing risk of bias in non-randomised studies of interventions. BMJ. 2016;355:i4919.

10. WHO. WHO Recommendations on Antenatal Care for a Positive Pregnancy Experience. Geneva: WHO; 2016.

Tugas Kelompok 1 – Minggu 3

Mata Kuliah: Epidemiologi Klinik & Biostatistik Lanjut

Materi: Modul 1–3 (Epidemiologi Dasar, Desain Penelitian, Bias & Confounding)

Identitas Tugas

Jenis Tugas	Tugas Kelompok Pertama
Minggu	Minggu ke-3
Bobot Nilai	15% dari nilai akhir mata kuliah
Komposisi Kelompok	3–4 orang per kelompok (ditentukan oleh fakultas)
Batas Pengumpulan	Akhir Minggu ke-3 (7 hari sejak tugas dibuka)
Format Pengumpulan	Dokumen Word / PDF + slide presentasi (maks 10 slide)
Panjang Laporan	1.500–2.500 kata (tidak termasuk referensi)

Petunjuk Pengerjaan:

Setiap kelompok mendapat satu artikel penelitian yang sama (dilampirkan oleh fakultas di LMS)
Seluruh anggota kelompok wajib membaca artikel secara mandiri sebelum diskusi kelompok
Pembagian peran dalam kelompok (koordinator, penulis, reviewer, presenter) diserahkan kepada kelompok
Laporan ditulis dalam satu dokumen terpadu — bukan gabungan jawaban individual
Pada halaman pertama, cantumkan: nama lengkap semua anggota, NIM, dan pembagian peran
Plagiarisme antar kelompok maupun dari sumber lain tanpa sitasi akan menghasilkan nilai nol

Artikel yang Digunakan

Fakultas menyediakan artikel berikut di LMS (full-text tersedia):

Filippi V, Chou D, Ronsmans C, Graham W, Say L. Levels and Causes of Maternal Mortality and Morbidity. In: Black RE, Laxminarayan R, Temmerman M, Walker N, editors. Reproductive, Maternal, Newborn, and Child Health: Disease Control Priorities. 3rd ed. Vol. 2. Washington DC: World Bank; 2016. Chapter 3.

URL: https://www.ncbi.nlm.nih.gov/books/NBK361917/

Catatan: Apabila artikel ini tidak dapat diakses, fakultas dapat mengganti dengan artikel setara yang tersedia di PubMed Central (open access). Konfirmasi ke koordinator mata kuliah.

I Bagian I — Ringkasan Artikel (Bobot 10%)

Tulis ringkasan artikel dalam maksimal 300 kata yang mencakup:

Pertanyaan penelitian atau tujuan utama artikel
Desain studi dan sumber data yang digunakan
Populasi yang diteliti
Temuan utama
Kesimpulan penulis

Catatan: Ringkasan harus ditulis dengan kata-kata sendiri — bukan terjemahan langsung dari abstrak.

II Bagian II — Analisis Desain Penelitian (Bobot 25%)

Berdasarkan Modul 2, jawab pertanyaan berikut:

2a.

Klasifikasikan desain penelitian yang digunakan dalam artikel ini. Apakah termasuk deskriptif, analitik observasional, atau eksperimental? Jelaskan alasan klasifikasi Anda.

2b.

Dalam hierarki bukti ilmiah, di tingkat mana artikel ini berada? Apa implikasi tingkat ini terhadap kekuatan kesimpulan yang dapat ditarik?

2c.

Identifikasi satu kelebihan dan satu keterbatasan utama desain yang digunakan, khususnya dalam konteks penerapannya untuk menghasilkan rekomendasi kebijakan KIA di negara berkembang.

III Bagian III — Identifikasi Bias & Confounding (Bobot 35%)

Berdasarkan Modul 3, jawab pertanyaan berikut:

3a.

Identifikasi minimal dua potensi bias. Untuk setiap bias:

Jelaskan mekanisme spesifik bagaimana bias tersebut dapat muncul
Nilai arah kemungkinan distorsi (over-estimate atau under-estimate?)
Apakah penulis mengakui bias ini? Bagaimana mengatasinya?

3b.

Identifikasi minimal satu variabel confounding potensial. Jelaskan:

Mengapa variabel tersebut memenuhi ketiga kriteria confounding
Apakah artikel telah mengontrol variabel ini? Metode apa?

3c.

Apakah Anda menemukan indikasi effect modification dalam artikel ini? Jika ya, jelaskan variabel apa yang berperan sebagai effect modifier dan implikasi klinisnya. Jika tidak, jelaskan variabel apa yang seharusnya dieksplorasi dan mengapa.

IV Bagian IV — Relevansi untuk Kebijakan KIA Indonesia (Bobot 20%)

4a.

Identifikasi dua implikasi kebijakan yang relevan untuk program KIA di Indonesia. Untuk setiap implikasi:

Sebutkan temuan spesifik yang menjadi dasar rekomendasi
Pertimbangkan keterbatasan metodologis
Identifikasi apakah bukti ini cukup kuat atau memerlukan penelitian konfirmasi

4b.

Apabila Anda adalah tim peneliti yang ingin melakukan studi lanjutan berdasarkan keterbatasan artikel ini di konteks Indonesia, desain penelitian apa yang akan Anda usulkan? Sebutkan: jenis desain, populasi target, paparan utama, outcome yang diukur, dan satu strategi pengendalian confounding.

V Bagian V — Refleksi Kelompok (Bobot 10%)

Tulis refleksi kelompok dalam maksimal 200 kata yang menjawab:

Apa konsep dari Modul 1–3 yang paling menantang untuk diterapkan dalam telaah artikel ini?
Apakah ada perbedaan perspektif antar anggota kelompok? Bagaimana mencapai kesepakatan?
Satu pertanyaan yang masih belum terjawab dari diskusi kelompok Anda

Rubrik Penilaian

Bagian	Komponen	Bobot
Bagian I	Akurasi dan kelengkapan ringkasan; kemampuan mengidentifikasi elemen kunci studi	10%
Bagian II	Ketepatan klasifikasi desain; pemahaman hierarki bukti; analisis kelebihan-keterbatasan	25%
Bagian III	Kedalaman identifikasi bias; ketepatan analisis confounding; membedakan dari effect modification	35%
Bagian IV	Relevansi implikasi kebijakan; kehati-hatian dalam mengekstrapolasi bukti	20%
Bagian V	Keaslian refleksi; bukti adanya diskusi substantif antar anggota	10%

Format Slide Presentasi

Siapkan presentasi maksimal 10 slide dengan struktur:

Slide 1: Judul, nama kelompok, anggota

Slide 2: Ringkasan artikel

Slide 3: Klasifikasi desain & hierarki bukti

Slide 4–5: Analisis bias (2 bias)

Slide 6: Confounding & effect modification

Slide 7–8: Implikasi kebijakan KIA

Slide 9: Usulan studi lanjutan

Slide 10: Refleksi & pertanyaan terbuka

Presentasi dilakukan secara daring di awal Minggu ke-4. Setiap kelompok mendapat 10 menit presentasi + 5 menit tanya jawab.

Panduan Referensi Minimal

Laporan harus mencantumkan minimal 5 referensi selain artikel utama:

Rothman KJ, Greenland S, Lash TL. Modern Epidemiology. 3rd ed. 2008.
Szklo M, Nieto FJ. Epidemiology: Beyond the Basics. 4th ed. 2019.
Grimes DA, Schulz KF. Bias and causal associations in observational research. Lancet. 2002.
Hernán MA, Robins JM. Causal Inference: What If. 2020. (free online)
WHO. Trends in Maternal Mortality 2000–2020. Geneva: WHO; 2023.

Modul 3 - Epidemiologi Klinik & Biostatistik Lanjut