Implementasi Random Forest Menggunakan Gridsearchcv Dalam Klasifikasi Penyakit Kanker Paru-Paru

Penulis

Hendrawansyah Nasution ( Universitas Sultan Syarif Kasim II )

Evia Budianita ( Universitas Sultan Syarif Kasim II )

Novi Yanti ( Universitas Sultan Syarif Kasim II )

Jasril ( Universitas Sultan Syarif Kasim II )

DOI:

https://doi.org/10.52060/juptik.v4i1.4281

Abstrak

Kanker paru-paru merupakan salah satu penyebab utama kematian di seluruh dunia karena sulitnya deteksi dini, karena gejala awalnya seringkali tidak spesifik. Diagnosis yang terlambat secara signifikan menurunkan angka harapan hidup pasien. Studi ini bertujuan untuk mengembangkan model klasifikasi kanker paru-paru yang akurat dan efisien untuk mendukung pengambilan keputusan medis. Studi ini menggunakan 50.000 rekam medis pasien yang diperoleh dari dataset sekunder, yang telah divalidasi secara klinis oleh seorang ahli paru di Rumah Sakit Umum Pekanbaru. Atribut yang dipilih dikategorikan menjadi faktor risiko yang tidak dapat dimodifikasi (usia, jenis kelamin, dan riwayat keluarga) dan faktor risiko yang dapat dimodifikasi (paparan merokok, paparan radon, paparan asbes, diagnosis PPOK, dan konsumsi alkohol). Model klasifikasi dikembangkan menggunakan algoritma Random Forest dan dioptimalkan menggunakan GridSearchCV untuk mendapatkan konfigurasi hyperparameter terbaik. Pra-pemrosesan data meliputi pengkodean label, pengkodean one-hot, dan normalisasi Min-Max. Pengujian eksperimental dilakukan menggunakan tiga rasio pembagian data latih-uji: 90:10, 80:20, dan 70:30. Hasil menunjukkan bahwa rasio pembagian 90:10 mencapai kinerja keseluruhan terbaik. Model optimal, menggunakan 300 estimator tanpa batasan kedalaman (max_depth=None), mencapai akurasi 70,3%, Recall 82,68%, dan F1-Score 79,28%. Nilai Recall yang tinggi menunjukkan bahwa model tersebut sangat efektif dalam mendeteksi kasus kanker paru-paru positif dan meminimalkan false negative, sehingga cocok sebagai alat pendukung keputusan untuk deteksi dini dan intervensi medis

Referensi

[1] D. Aprilianto and E. Rizal, “Klasifikasi Penyakit Kanker Paru Menggunakan Algoritma Random Forest Berbasis Streamlit,” vol. 9, p. 2025, 2025, doi: 10.47002/metik.v9i2.1076.

[2] J. P. Kesehatan et al., “Kanker didefinisikan sebagai suatu penyakit yang berasal dari adanyapertumbuhan sel tubuh yang progresif dan abnormal . Kondisi ini disebabkanolehterjadinya perubahan pada deoxiribonucleid acid ( DNA ), sehingga sel kehilangan fungsinya secara normal . Pe,” vol. 3, no. 2, pp. 141–149, 2020.

[3] A. Maulana, A. Pratama, D. Primanda, and N. Hariyanto, “Model Prediksi Kanker Paru-Paru dengan Random Forest Lung Cancer Prediction Model with Random Forest,” vol. 15, no. 2, pp. 136–146, 2025. https://doi.org/10.30700/sisfotenika.v15i2.569

[4] I. Buana and D. A. Harahap, “Asbestos, Radon and Air Pollution as Risk Factors for Lung Cancer in Non-Smoking Women,” AVERROUS: Jurnal Kedokteran dan Kesehatan Malikussaleh, vol. 8, no. 1, p. 1, 2022. https://doi.org/10.29103/averrous.v8i1.7088

[5] B. Bhinder, C. Gilvary, N. S. Madhukar, and O. Elemento, “Artificial Intelligence in Cancer Research and Precision Medicine,” Cancer Discovery, vol. 11, no. 4, pp. 900–915, Apr. 2021, https://doi.org/10.1158/2159-8290.CD-21-0090

[6] H. Shimizu and K. I. Nakayama, “Artificial intelligence in oncology,” Cancer Science, vol. 111, no. 5, pp. 1452–1460, 2020, https://doi.org/10.1111/cas.14377

[7] N. Nuraeni and P. Astuti, “Pendekatan Machine Learning untuk Deteksi Dini Kanker Paru-Paru: Mengoptimalkan Sensitivitas dan Akurasi,” Jurnal Informatika Polinema, vol. 11, no. 3, pp. 339–346, 2025, https://doi.org/10.33795/jip.v11i3.7011.

[8] K. Aidi Saputra, J. Tata Hardinata, M. Ridwan Lubis, S. Retno Andani, and I. Syahputra Saragih, “KLIK: Kajian Ilmiah Informatika dan Komputer Klasifikasi Algoritma C4.5 Dalam Penerapan Tingkat Kepuasan Siswa Terhadap Media Pembelajaran Online,” Media Online), vol. 1, no. 3, pp. 113–118, 2020.

[9] M. Y. Zidane, B. Nurina Sari, I. Maulana, A. Primaya, and G. Garno, “Penerapan Data Mining Dalam Klasifikasi Data Transaksi Produk Koperasi Di Smk Pgri 2 Karawang,” JATI (Jurnal Mahasiswa Teknik Informatika), vol. 9, no. 1, pp. 263–269, 2024, https://doi.org/10.36040/jati.v9i1.12196

[10] M. Abdul, R. Wahid, A. Nugroho, and A. H. Anshor, “Prediksi Penyakit Kanker Paru-Paru Dengan Algoritma Regresi Linier,” Bulletin of Information Technology (BIT), vol. 4, no. 1, pp. 63–74, 2023, https://doi.org/10.47065/bit.v3i1

[11] K. P. Menggunakan, C. Algoritma, J. Teknologi, S. Informasi, and P. N. Subang, “Penerapan Metode Klasifikasi Decision Tree dalam Prediksi,” vol. 18, no. 1, pp. 126–139.

[12] I. Muhamad and M. Matin, “Hyperparameter Tuning menggunakan GridsearchCV pada Random Forest untuk Deteksi Malware,” vol. 9, no. 1, 2023. https://doi.org/10.32722/multinetics.v9i1.5578

[13] C. Azzaria, E. Daniati, and A. Ristyawan, “Peningkatan Akurasi Deteksi Liver Disease melalui Hyperparameter Tuning pada Algoritma Random Forest,” vol. 4, no. 2, pp. 139–147, 2025. https://doi.org/10.59095/ijcsr.v4i2.198

[14] R. Pradistiani, “Jurnal JPILKOM ( Jurnal Penelitian Ilmu Komputer ) Optimasi Hyperparameter Random Forest dalam Memprediksi Daya Beli Mobil Menggunakan GridSearch,” vol. 3, no. 1, 2025.

[15] K. Kunci, “Indonesian Journal of Computer Science,” vol. 12, no. 1, pp. 2162–2171, 2023.

[16] Z. Ahmadi, A. Abdullah, and I. Fakhruzi, “Meningkatkan Kemampuan Model dalam Memprediksi Penyakit Jantung Meningkatkan Kemampuan Model dalam Memprediksi Penyakit Jantung dengan Algoritma NCL dan GridSearchCV,” no. October, 2023, https://doi.org/10.30865/mib.v7i3.6142

[17] Suci Amaliah, M. Nusrang, and A. Aswi, “Penerapan Metode Random Forest Untuk Klasifikasi Varian Minuman Kopi di Kedai Kopi Konijiwa Bantaeng,” VARIANSI: Journal of Statistics and Its application on Teaching and Research, vol. 4, no. 3, pp. 121–127, 2022, https://doi.org/10.35580/variansiunm31

[18] S. Mahmuda, “Implementasi Metode Random Forest pada Kategori Konten Kanal Youtube,” Jurnal Jendela Matematika, vol. 2, no. 01, pp. 21–31, 2024, https://doi.org/10.57008/jjm.v2i01.633

[19] R. Supriyadi, W. Gata, N. Maulidah, and A. Fauzi, “Penerapan Algoritma Random Forest Untuk Menentukan Kualitas Anggur Merah,” E-Bisnis : Jurnal Ilmiah Ekonomi dan Bisnis, vol. 13, no. 2, pp. 67–75, 2020, https://doi.org/10.51903/e-bisnis.v13i2.247

[20] M. C. E. all Rani, “Perbandingan Algoritma Random Forest, Naive Bayes, Dan Neural Network Dalam Klasifikasi Penyakit Jantung,” Jurnal Sains Informatika Terapan (JSIT), vol. 2, no. 1, pp. 16–20, 2023.


Keywords  :  
Kata Kunci: lung cancer, random forest, GridSearchCV, classification, machine learning
Galleys  :  
Diterbitkan  :  
2026-06-01
Terbitan  :  

Cara Mengutip

Implementasi Random Forest Menggunakan Gridsearchcv Dalam Klasifikasi Penyakit Kanker Paru-Paru. (2026). Jurnal Pengembangan Teknologi Informasi Dan Komunikasi (JUPTIK), 4(1), 31-38. https://doi.org/10.52060/juptik.v4i1.4281