PERBANDINGAN KINERJA ALGORITMA K-NEAREST NEIGHBOR MENGGUNAKAN SMOTE DAN ALGORITMA K-NEAREST NEIGHBOR TANPA SMOTE DALAM DIAGNOSIS PENYAKIT DIABETES PADA DATA TIDAK SEIMBANG

Pertiwi, Amelia Gita and Bahtiar, Nurdin (2019) PERBANDINGAN KINERJA ALGORITMA K-NEAREST NEIGHBOR MENGGUNAKAN SMOTE DAN ALGORITMA K-NEAREST NEIGHBOR TANPA SMOTE DALAM DIAGNOSIS PENYAKIT DIABETES PADA DATA TIDAK SEIMBANG. Undergraduate thesis, Universitas Diponegoro.

[img]
Preview
PDF
Available under License Creative Commons Attribution Non-commercial Share Alike.

5Mb

Abstract

Penyakit diabetes merupakan salah satu penyebab kematian hampir 70% di seluruh dunia menurut Profil Kesehatan Indonesia tahun 2017. Tingginya angka kematian tersebut menyebabkan perlunya dilakukan upaya untuk menurunkan jumlah penderita penyakit diabetes dengan cara melakukan penelitian-penelitian yang mengarah pada melakukan suatu diagnosis sehingga dapat mendeteksi seseorang terkena penyakit diabetes secara akurat. Penelitian ini mencoba membandingkan kinerja algoritma K-Nearest Neighbor menggunakan Synthetic Minority Over-sampling Technique dan algoritma K-Nearest Neighbor tanpa Synthetic Minority Over-sampling Technique dalam mendiagnosis penyakit diabetes pada data tidak seimbang. Parameter yang diujicobakan adalah nilai k pada KNearest Neighbor dan Synthetic Minority Over-sampling Technique. Pengujian dilakukan menggunakan strategi K-Fold Cross Validation. Data yang digunakan pada penelitian ini sebanyak 3876 data yang berasal dari Rumah Sakit Pusat Pertamina. Berdasarkan hasil pengujian yang dilakukan menunjukkan bahwa nilai akurasi yang dihasilkan dalam mendiagnosis penyakit diabetes dengan menggunakan Synthetic Minority Over-sampling Technique lebih baik daripada akurasi yang dihasilkan tanpa menggunakan Synthetic Minority Over-sampling Technique dengan peningkatan akurasi tertinggi sebesar 8,25%. Rata-rata akurasi tertinggi didapatkan ketika nilai k = 3 pada K-Nearest Neighbor, nilai k = 5 pada Synthetic Minority Over-sampling Technique, dan nilai fold = 10, yaitu mencapai 78,06%. Kata Kunci: Diagnosis penyakit diabetes, Imbalanced datasets, K-Nearest Neighbor, Synthetic Minority Over-sampling Technique

Item Type:Thesis (Undergraduate)
Subjects:Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Q Science > QA Mathematics > QA76 Computer software
Divisions:Faculty of Science and Mathematics > Department of Computer Science
ID Code:82591
Deposited By:INVALID USER
Deposited On:15 Feb 2021 11:31
Last Modified:15 Feb 2021 11:31

Repository Staff Only: item control page