METODE LATENT DIRICHLET ALLOCATION DENGAN SELEKSI CIRI PADA ANALISIS SENTIMEN DI TWITTER BERBAHASA INDONESIA

USOP, Eka Surya and Isnanto, R. Rizal and Kusumaningrum, Retno (2017) METODE LATENT DIRICHLET ALLOCATION DENGAN SELEKSI CIRI PADA ANALISIS SENTIMEN DI TWITTER BERBAHASA INDONESIA. Masters thesis, School of Postgraduate.

[img]
Preview
PDF
262Kb
[img]PDF
Restricted to Repository staff only

4Mb

Abstract

Data masukan yang digunakan pada proses analisis sentimen dengan menggunakan mesin pembelajaran (machine learning) umumnya berupa Bag of Word (BoW). Masukan berupa BoW tidaklah cukup untuk dapat meningkatkan kemampuan mesin pembelajaran dalam penentuan polaritas pada sebuah dokumen. Untuk itu diperlukan masukan dalam bentuk ciri yang lebih spesifik sehingga mampu memberikan penentuan polaritas secara lebih maksimal. Part of Speech (POS) merupakan salah satu teknik untuk membentuk ciri yang lebih spesifik pada sebuah dokumen. Dengan menggunakan seleksi ciri (feature selection) POS pada sebuah dokumen, maka kemunculan kelas kata seperti kata sifat (adjective) atau negasi (negation) dapat terdeteksi. Kata sifat dan negasi merupakan penanda utama kemunculan sentimen atau opini pada sebuah dokumen. Penelitian ini bertujuan menggunakan teknik POS untuk melakukan seleksi ciri. Hasil seleksi ciri akan dijadikan masukan untuk proses analisis sentimen dengan metode Latent Dirichlet Allocation (LDA). Hasil penelitian ini menunjukkan bahwa dokumen yang telah melalui proses seleksi ciri POS dapat memberikan nilai akurasi yang lebih tinggi dengan selisih sebesar 8 % dibandingkan dokumen tanpa proses seleksi ciri POS. Kata-kunci : analisis sentimen, klasifikasi, seleksi ciri, part of speech, latent dirichlet allocation. The input data used in the sentiment analysis process by using machine learning generally is Bag of Word (BoW). However, the input data using BoW is not enough to improve the machine learning in defining the polarity on a document. Therefore, need input in the form of more specific feature so that it is capable to give the more maximal result. Part of Speech (POS) is one of the techniques to create the more specific feature on a document. By using the POS-based feature on a document, then the occurrence of the word class like adjective or negation can be detected. The adjective and negation are the main sign of the sentiment or opinion on a document. This study is aimed to use POS technique to conduct feature selection. The result of the POS-based feature process will be the input for sentiment analysis process by using Latent Dirichlet Allocation (LDA) method. The result of this research showed that the document which has passed the POS-based feature process can give accuracy score higher with the difference about 8 % than the document without feature selection process of POS Keywords : sentiment analysis, feature selection, part of speech, latent dirichlet allocation

Item Type:Thesis (Masters)
Subjects:T Technology > Computer engineering. Embedded system. Network. Softwares. Robotics. Multimedia
Divisions:School of Postgraduate (mixed) > Master Program in Information System
ID Code:58004
Deposited By:Mrs Ekana Perpus Pasca
Deposited On:13 Nov 2017 13:47
Last Modified:13 Nov 2017 13:47

Repository Staff Only: item control page