ARDI, Hario Laskito and Sediyono, Eko and Kusumaningrum, Retno (2017) METODE SUPPORT VECTOR MACHINE UNTUK MELAKUKAN ANALISIS SENTIMEN PADA MARKETPLACE DENGAN PERBANDINGAN CIRI PADA LEVEL ASPEK. Masters thesis, School of Postgraduate.
| PDF 417Kb | |
PDF Restricted to Repository staff only 4Mb |
Abstract
Analisis sentimen merupakan bidang interdisipliner antara pengolahan bahasa alami, kecerdasan buatan dan text mining. Kunci utama dari analisis sentimen adalah klasifikasi polaritas yang menentukan apakah sentimen tersebut bersifat positif atau negatif. Pada penelitian ini menggunakan metode klasifikasi support vector machine dengan jumlah data ulasan konsumen berjumlah 648 data. Data tersebut didapatkan dari ulasan konsumen dari marketplace dengan produk yang dijual adalah handpone. Hasil penelitian ini mendapatkan 3 aspek yang mengindikasikan sentimen analisis pada marketplace yaitu aspek pelayanan , pengiriman dan produk. Kamus slang yang digunakan untuk proses normalisasi berjumlah 552 kata slang. Penelitian ini membandingkan analisis ciri untuk mendapatkan hasil klasifikasi terbaik, karena akurasi klasifikasi dipengaruhi oleh proses analisis ciri. Hasil nilai perbandingan dari analisis ciri antara n-gram dan TF-IDF dengan menggunakan metode Support Vector Machine didapatkan bahwa unigram mempunyai nilai akurasi tertinggi, dengan nilai akurasi sebesar 80,87 %. Hasil penelitian ini menjelaskan bahwa pada kasus sentimen analisis pada level aspek dengan perbandingan ciri dengan model klasifikasi Support Vector Machine didapatkan bahwa model analisis ciri unigram dan klasifikasi Support Vector Machine adalah model terbaik. Kata-kunci : analisis sentimen, e-commerce, marketplace, ekstraksi ciri, TF-IDF, n-gram, support vector machine Sentiment analysis is an interdisciplinary field between natural language processing, artificial intelligence and text mining. The main key of the sentiment analysis is the polarity that is meant by the sentiment is positive or negative. In this study using the method of classification support vector machine with the amount of data consumer reviews amounted to 648 data. The data obtained from consumer reviews from the marketplace with products sold is handpone. The results of this study get 3 aspects that indicate sentiment analysis on the marketplace aspects of service, delivery and products. The slang dictionary used for the normalization process is 552 words slang. This study compares the characteristic analysis to obtain the best classification result, because classification accuration is influenced by characteristic analysis process. The result of comparison value from characteristic analysis between n-gram and TF-IDF by using Support Vector Machine method found that unigram has the highest akurasi value, with akurasi value 80,87%. The results of this study explain that in the case of analysis sentiment at the aspect level with the comparison of characteristics with the classification model of support vector machine found that the analysis model of unigram character and classification of support vector machine is the best model. Keywords : sentiment analysis, e-commerce, marketplace, features selection, TF-IDF, n-gram, support vector machine
Item Type: | Thesis (Masters) |
---|---|
Subjects: | T Technology > Computer engineering. Embedded system. Network. Softwares. Robotics. Multimedia |
Divisions: | School of Postgraduate (mixed) > Master Program in Information System |
ID Code: | 58008 |
Deposited By: | INVALID USER |
Deposited On: | 13 Nov 2017 14:00 |
Last Modified: | 13 Nov 2017 14:00 |
Repository Staff Only: item control page