Prasetyo, Samuel Adi and KUSUMANINGRUM, RETNO (2018) KLASIFIKASI DOKUMEN BERITA BAHASA INDONESIA MENGGUNAKAN METODE LATENT DIRICHLET ALLOCATION (LDA) DAN WORD2VEC. Undergraduate thesis, Universitas Diponegoro.
| PDF Available under License Creative Commons Attribution Non-commercial Share Alike. 752Kb |
Abstract
Perkembangan yang pesat dalam informasi digital telah menyebabkan semakin meningkat pula volume informasi yang berbentuk teks seperti dokumen berita. Dokumen berita yang muncul diunggah di internet sangatlah banyak dalam rentang waktu yang cepat. Oleh karena itu diperlukan adanya pengorganisasian dokumen berita. Salah satu cara yang dapat dilakukan dengan cepat dan dapat dipahami oleh para penerima informasi adalah dengan melakukan klasifikasi dokumen berita berdasarkan topiknya. Penelitian yang diusulkan yaitu penerapan klasifikasi dokumen untuk berita Bahasa Indonesia menggunakan metode Latent Dirichlet Allocation (LDA) yang akan digabungkan dengan metode word embedding Word2Vec dan juga k-means clustering sebagai metode pembantu melakukan klusterisasi vektor kata. Dokumen berita Bahasa Indonesia akan diklasifikasikan ke dalam lima topik yaitu olahraga, teknologi, ekonomi, politik, dan sosial dimana kelima kategori tersebut merupakan kategori berita utama yang sering diakses oleh pengguna. Hasil penelitian dengan jumlah data pelatihan sebanyak 1000 berita (200 berita per kategori) menunjukkan bahwa metode gabungan LDA dan Word2Vec sudah cukup baik dalam melakukan klasifikasi dengan nilai akurasi tertinggi sebesar 73,4%. Meski demikian akurasi lebih baik didapatkan oleh metode LDA murni tanpa Word2Vec dengan nilai akurasi sebesar 87,5% sehingga memiliki selisih akurasi sebesar 14,1%. Kedua perbandingan metode tersebut sama-sama diperoleh pada kombinasi parameter alpha 0,1; beta 0,01; dan jumlah topik sebanyak 300 topik.
Item Type: | Thesis (Undergraduate) |
---|---|
Subjects: | Q Science > QA Mathematics > QA75 Electronic computers. Computer science Q Science > QA Mathematics > QA76 Computer software |
Divisions: | Faculty of Science and Mathematics > Department of Computer Science |
ID Code: | 65832 |
Deposited By: | INVALID USER |
Deposited On: | 11 Oct 2018 19:55 |
Last Modified: | 11 Oct 2018 19:55 |
Repository Staff Only: item control page