ANALISIS SENTIMEN MENGGUNAKAN LATENT DIRICHLET ALLOCATION DAN VISUALISASI TOPIC POLARITY WORDCLOUD

BASHRI, MOHAMMAD FAJAR AINUL and KUSUMANINGRUM, RETNO (2017) ANALISIS SENTIMEN MENGGUNAKAN LATENT DIRICHLET ALLOCATION DAN VISUALISASI TOPIC POLARITY WORDCLOUD. Undergraduate thesis, Universitas Diponegoro.

[img]
Preview
PDF
Available under License Creative Commons Attribution Non-commercial Share Alike.

1113Kb

Abstract

Bagi sebuah institusi pendidikan, pendapat peserta didik memiliki peran penting untuk kemajuan institusi pendidikan tersebut. Analisis sentimen dapat membantu dalam mengekstrasi pendapat yang berasal dari sebuah dokumen, komentar, review produk, dan data-data lainnya sehingga akan lebih mudah dalam melakukan pemantauan. Salah satu metode untuk melakukan analisis sentimen adalah Latent Dirichlet Allocation (LDA) yang mampu digunakan untuk mengekstraksi topik dari kumpulan dokumen komentar, dimana topik tersebut direpresentasikan sebagai kemunculan kata-kata dengan probabilitas topik yang berbeda. Oleh karena itu diperlukan representasi data dalam bentuk visual yang mudah dipahami daripada teks dan tabel. Salah satu bentuk visualisasi data adalah wordcloud yang memberikan gambaran visual frekuensi kemunculan kata. Pada penelitian ini akan dilakukan analisis sentimen terhadap komentar mahasiswa pada suatu universitas, dalam hal ini Universitas Diponegoro, menggunakan LDA dengan visualisasi topic polarity wordcloud. Adapun tujuan khusus penelitian ini adalah untuk mengetahui pengaruh perubahan nilai alpha, beta, jumlah topik terhadap nilai perplexity dan waktu eksekusi (detik), mengetahui kombinasi parameter terbaik untuk analisis sentimen, dan mengetahui persebaran topik terkait komentar mahasiswa Universitas Diponegoro. Pada penelitian ini dilakukan proses LDA untuk melakukan ekstraksi topik dengan menggunakan 690 data komentar. Kemudian memvisualisasikan hasil ekstraksi topik ke dalam bentuk topic polarity wordcloud dengan sentimen positif, negatif atau netral. Hasil penelitian menunjukkan nilai alpha, beta, dan jumlah topik yang semakin besar menghasilkan nilai perplexity yang kecil. Nilai alpha dan beta yang semakin besar menghasilkan waktu eksekusi yang relatif lebih cepat. Sedangkan kenaikan jumlah topik menghasilkan waktu eksekusi yang lebih lama. Kemudian kombinasi parameter terbaik adalah parameter dengan nilai alpha 0.1, beta 0.1, jumlah topik 9 dengan nilai threshold 0.0000001. Kombinasi parameter menghasilkan 3 topik sebagai sentimen positif dan 6 topik sebagai sentimen negatif dengan topik yang dibahas adalah masalah fasilitas, birokrasi, tempat parkir, dan ukt.

Item Type:Thesis (Undergraduate)
Subjects:Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Q Science > QA Mathematics > QA76 Computer software
Divisions:Faculty of Science and Mathematics > Department of Computer Science
ID Code:60590
Deposited By:INVALID USER
Deposited On:08 Feb 2018 09:35
Last Modified:08 Feb 2018 09:35

Repository Staff Only: item control page