HIERARCHICAL SENTENCE SENTIMENT ANALYSIS UNTUK ULASAN HOTEL PADA WEBSITE TRAVELOKA MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER

Kurniawan, Sandy and KUSUMANINGRUM, RETNO (2018) HIERARCHICAL SENTENCE SENTIMENT ANALYSIS UNTUK ULASAN HOTEL PADA WEBSITE TRAVELOKA MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER. Undergraduate thesis, Universitas Diponegoro.

[img]
Preview
PDF
Available under License Creative Commons Attribution Non-commercial Share Alike.

497Kb

Abstract

Traveloka menyediakan ruang bagi penggunanya untuk menuliskan ulasan tentang layanan hotel yang disewakan. Ulasan-ulasan ini sangat berguna bagi pengelola hotel dalam mengetahui tingkat kepuasan pelanggan. Sentiment analysis merupakan sarana yang dapat digunakan untuk menganalisis ulasan tersebut, sehingga dapat diketahui apakah ulasan tersebut mengandung opini atau tidak, yang kemudian tingkat kepuasan pelanggan akan diukur berdasarkan jumlah sentimen (positif, negatif) yang terkandung dari opini yang didapatkan. Penelitian ini menggunakan metode Naïve Bayes classifier dalam melakukan hierarchical sentence sentiment analysis pada ulasan hotel dari website Traveloka. Selain itu, penelitian ini menggunakan dua jenis pembobotan kata dalam ekstraksi fitur, yaitu raw term frequency dan TF-IDF. Sentence sentiment analysis menggunakan flat classification untuk ulasan hotel pada website Traveloka dilakukan untuk membandingkan hasilnya dengan hierarchical sentence sentiment analysis pada ulasan hotel dari website Traveloka. Hasil penelitian sentiment analysis terhadap ulasan hotel ini menunjukkan bahwa penggunaan hierarchical classification dalam sentiment analysis lebih baik dibandingkan dengan menggunakan flat classification. Hasil perhitungan rata-rata nilai f-measure untuk model flat classification menghasilkan nilai sebesar 0,7518, sedangkan untuk model hierarchical classification menghasilkan nilai sebesar 0,7748. Berdasarkan hasil tersebut, menunjukkan bahwa penggunaan hierarchical classification pada sentiment analysis meningkatkan kinerja rata-rata model klasifikasi sebesar 0,023. Penggunaan fitur raw term frequency pada flat classification memberikan nilai f-measure yang lebih tinggi daripada penggunaan fitur TF-IDF dengan selisih 0,039. Rata-rata nilai f-measure flat classification dengan fitur raw term frequency menghasilkan nilai sebesar 0,7518 sedangkan untuk fitur TF-IDF sebesar 0,7123.

Item Type:Thesis (Undergraduate)
Subjects:Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Q Science > QA Mathematics > QA76 Computer software
Divisions:Faculty of Science and Mathematics > Department of Computer Science
ID Code:78230
Deposited By:INVALID USER
Deposited On:19 Nov 2019 14:24
Last Modified:19 Nov 2019 14:24

Repository Staff Only: item control page