Penerapan Model CRISP-DM untuk Prediksi Penyakit Diabetes Menggunakan Metode K-Nearest Neighbor dan Logistic Regression

Authors

  • Angel Aprilia Putri Lo Program Studi Sistem Informasi Universitas Ciputra
  • Vincentia Jennifer Evelyn Tjioe Program Studi Sistem Informasi Universitas Ciputra

Keywords:

Diabetes, KNN, Regresi Logistik, Pembelajaran Mesin, Klasifikasi, CRISP_DM

Abstract

Penyakit diabetes merupakan tantangan kesehatan global yang semakin meningkat. Penelitian ini menggunakan model CRISP-DM, metode K-Nearest Neighbor (K-NN) dan regresi logistik, untuk memprediksi kemungkinan seseorang menderita diabetes berdasarkan data medis. Dataset yang digunakan berasal dari The National Institute of Diabetes and Digestive and Kidney Diseases, yang tersedia di Kaggle. Metode K-NN mengklasifikasikan data baru berdasarkan kedekatan dengan data dalam dataset menggunakan jarak Euclidean, sedangkan regresi logistik memprediksi probabilitas kejadian biner (diabetes atau tidak) berdasarkan hubungan linier antara variabel independen dan dependen. Hasil analisis menunjukkan bahwa metode regresi logistik memiliki performa yang lebih baik dalam klasifikasi diabetes, dengan regresi logistik menunjukkan hasil yang lebih superior dalam akurasi. Akurasi model regresi logistik mencapai 79%, sementara K-NN mencapai 74%.

Downloads

Published

2024-09-10