SELF ADAPTIVE K-MEANS CLUSTERING DALAM PERKEMBANGAN HASIL BELAJAR SISWA BERBASIS WEB

FAJAR, Muhammad Syaeful and Adi, Kusworo and Widodo, Catur Edi (2018) SELF ADAPTIVE K-MEANS CLUSTERING DALAM PERKEMBANGAN HASIL BELAJAR SISWA BERBASIS WEB. Masters thesis, School of Postgraduate.

[img]
Preview
PDF
3792Kb
[img]PDF
Restricted to Repository staff only

3792Kb
[img]
Preview
PDF
3792Kb
[img]PDF
Restricted to Repository staff only

3784Kb

Abstract

K-means clustering merupakan metode pengelompokkan data yang bersifat partisonla dan memiliki kemampuan dalam mengelompokkan data berskala besar karena kesederhanaan metode yang terbukti diimplementasikan cukup baik di bidang pengelolaan data dan informasi. Kelemahan pada metode k-means adalah hasil akhir dari metode ini sangat berpengaruh terhadap inisialisasi centroid awal dan memiliki sensitifitas terhadap data outliner. Penelitian ini mengkombinasikan antara k-means clustering dengan pohon Huffman sebagai inisialisasi centroid awal dan menggunakan nilai ambang untuk mengetahui data outliner dalam cluster. Penelitian ini menggunakan 120 data nilai tryout siswa yang diambil dari salah satu sekolah di kota Semarang. Penelitian bertujuan untuk mengelompokkan data dengan berdasarkan keterkaitan antara atribut yang dimiliki oleh titik data, serta penerapan nilai ambang yang dapat membantu dalam mengetahui data outliner. Hasil penelitian ini menunjukkan nilai akurasi tertinggi sebesar 92% dengan rata-rata 67% di semua cluster. Kata kunci: K-means, pohon Huffman, nilai ambang, penggalian data pendidikan. K-means clustering is a method of grouping data which is participatory and has the ability to classify large-scale data because proven methods can be implemented well in the field of data and information. The weakness in the k-means method is the end result of this method it is very important for initial centroid initialization to have sensitivity to outliner data. This research combines k-means clustering with the Huffman tree as initial centroid initialization and uses a threshold to find outliner data in clusters. This study uses 120 data from student tryout scores taken from one of the schools in Semarang city. The purpose of this research is to classify data by working on the relationship between attributes controlled by data points. In addition, treated threshold that can help in knowing outliner data. The results of this study showed that the highest value of 92% with an average of 67% in all clusters. Keywords: K-means Clustering, Huffman Tree, Threshold, Educational Data Mining.

Item Type:Thesis (Masters)
Subjects:T Technology > Computer engineering. Embedded system. Network. Softwares. Robotics. Multimedia
Divisions:School of Postgraduate > Master Program in Information System
ID Code:66379
Deposited By:INVALID USER
Deposited On:12 Nov 2018 14:55
Last Modified:12 Nov 2018 14:55

Repository Staff Only: item control page