Komparasi Algoritma Random Forest, Naïve Bayes dan K- Nearest Neighbor Dalam klasifikasi Data Penyakit Jantung

Amril Samosir, M. Said Hasibuan, Wahyu Eko Justino, Tri Hariyono

Abstract


Penyakit jantung merupakan penyabab kematian tertinggi setelah stroke dan dapat terjadi pada semua usia. Metode berbasis komputer mendorong peneliti untuk menjadi salah satu cara bagi penelitian terhadap penyakit jantung koroner. Pengolahan data dalam jumlah besar dapat dilakukan dengan klasifikasi menggunakan algoritma tertentu sehingga hasilnya cepat dan akurat. Metode klasifikasi yang umum digunakan antara lain Naïve Bayes, K-Nearest Neighbor, dan Random Forest. Metode Naïve Bayes menggunakan probabilitas disetiap data, metode K-Nearest Neighbor menggunakan perhitungan jarak, sedangkan metode Random Forest menggunakan beberapa pohon keputusan yang disatukan. Penulisan ini bertujuan untuk membandingkan ketiga algoritma  tersebut  dalam  mengklasifikasikan  data  penyakit  jantung.  Perbandingan  algoritma  akan  dilihat  berdasarkan performance measure yang terdiri dari tingkatan akurasi, recall disetiap kelas, dan presisi disetiap kelas. Pada setiap algoritma diuji menggunakan cross validation. Berdasarkan hasil perbandingan terhadap 304 dataset penyakit jantung, algoritma Naïve Bayes lebih baik dan optimal dibanding dengan Algoritma, K-Nearest Neighbor dan Random Forest untuk mengklasifikasikan penyakit jantung. Hasil klasifikasi dengan algoritma Naïve Bayes memiliki rerata hasil akurasi sebesar 0,91 AUC, 0,84 CA, 0,84

F1, 0,839 Precision dan 0,84 Recall.


Full Text:

PDF

References


Kementerian Kesehatan RI, “Penyakit jantung penyebab kematian tertinggi, kemenkes ingatkan cerdik,” Kementerian Kesehatan RI, 2017. [Daring]. Tersedia: http://www.depkes.go.id/article/view/17073100005/penyakit-jantung-penyebab-kematian-tertinggi-

kemenkes-ingatkan-cerdik-.html. [Diakses: 25 April 2019].

D. Sartika dan D. I. Sensuse, “Perbandingan algoritma klasifikasi Naive Bayes, Nearest Neighbour, dan Decision

Tree pada studi kasus pengambilan keputusan pemilihan pola pakaian,” Jatisi, vol. 1, no. 2, hal. 153 – 154,

M. Lestari, “Penerapan algoritma klasifikasi Nearest Neighbor (K-NN) untuk mendeteksi penyakit jantung,” Faktor

Exacta, vol. 7, no. 4, hal. 366 – 371, 2014.

M. R. Amiarrahman dan T. Handhika, “Analisis dan implementasi algoritma klasifikasi Random Forest dalam pengenalan Bahasa Isyarat Indonesia (BISINDO),” Prosiding Seminar Nasional Inovasi Teknologi, 2017, hal. 83 – 88.

T. Retnasari dan E. Rahmawati, “Diagnosa prediksi penyakit jantung dengan model algoritma Naïve Bayes dan algoritma C4.5,” Prosiding Konferensi Nasional Ilmu Sosial dan Teknologi (KNiST), 2017, hal. 7 – 12.

S. Dewi, “Komparasi 5 metode algoritma klasifikasi data mining pada prediksi keberhasilan pemasaran produk

layanan perbankan,” Jurnal Techno Nusa Mandiri, vol. 8, no. 1, hal. 60 – 66, 2016.

Kaggle Dataset, “Heart disease UCI,” Kaggle Dataset, 2019. [Daring]. Tersedia:

https://www.kaggle.com/ronitf/heart-disease-uci. [Diakses: 25 April 2021].


Refbacks

  • There are currently no refbacks.



Prosiding Seminar Nasional Darmajaya is abstracting and indexing in the following databases:


PROSIDING SEMINAR NASIONAL DARMAJAYA

Diatur Oleh: Lembaga Penelitian dan Pengabdian kepada Masyarakat (LPPM)

Diterbitkan Oleh: IIB Darmajaya
Alamat: Jl. Z.A. Pagar Alam No. 93 Gedong Meneng, Bandar Lampung Lampung
Website: jurnal.darmajaya.ac.id

E-mail: ProsidingSemnasDJ@darmajaya.ac.id