Prediksi Kualitas Air di Jawa Timur Menggunakan Metode CRISP-DM dengan Algoritma K-NN dan Regresi Logistik Multinomial
Keywords:
Kualitas air, prediksi, K-NN, Regresi Logistik Multinomial, CRISP-DMAbstract
Air merupakan salah satu sumber daya penting bagi kehidupan manusia. Kualitas air yang buruk dapat menyebabkan berbagai masalah kesehatan, seperti diare dan stunting, yang merupakan penyebab utama kematian pada balita di Indonesia. Penelitian ini bertujuan untuk memprediksi kualitas air di Jawa Timur menggunakan metode pembelajaran mesin K-NN dan Regresi Logistik Multinomial. Data yang digunakan adalah data kualitas air Jawa Timur yang diambil dari situs Kaggle, mencakup variabel temperatur, TDS, BOD, COD, DO, dan kelas. Setelah melalui metode CRISP-DM, hasil evaluasi menunjukkan bahwa model Regresi Logistik Multinomial memiliki akurasi lebih tinggi (0.72) dibandingkan dengan model K-NN (0.67), sehingga dapat disimpulkan bahwa model Regresi Logistik Multinomial dalam penelitian ini lebih cocok digunakan untuk memprediksi kualitas air di Jawa Timur. Berdasarkan hasil analisis, ditemukan bahwa variabel DO dan TDS memiliki pengaruh terbesar terhadap kualitas air. Tingginya kadar DO menunjukkan air yang layak digunakan, sementara tingginya TDS menunjukkan adanya polusi dan limbah yang berbahaya. Hasil penelitian ini diharapkan dapat membantu meningkatkan kualitas air di Jawa Timur, serta mendukung tercapainya Tujuan Pembangunan Berkelanjutan (SDGs) nomor 6 mengenai air bersih dan sanitasi yang berkelanjutan.