PELABELAN TOPIK OTOMATIS PADA ARTIKEL BERITA MENGGUNAKAN LATENT DIRICHLET ALLOCATION DAN ONTOLOGI

ADHITAMA, Rifki and Kusumaningrum, Retno and Gernowo, Rahmat (2017) PELABELAN TOPIK OTOMATIS PADA ARTIKEL BERITA MENGGUNAKAN LATENT DIRICHLET ALLOCATION DAN ONTOLOGI. Masters thesis, School of Postgraduate.

[img]
Preview
PDF
315Kb
[img]PDF
Restricted to Repository staff only

4Mb

Abstract

Latent Dirichlet Allocation (LDA) merupakan metode dalam pemodelan topik yang menyediakan keleluasaan mengorganisir, memahamkan, mencari dan meringkas arsip elektronik yang terbukti berhasil diimplementasikan cukup baik pada bidang teks dan pengambilan informasi. Kelemahan pada metode LDA adalah ketidakmampuan dalam melabeli topik-topik yang telah dibentuk. Penelitian ini mengkombinasikan antara LDA dengan skema ontology untuk mengatasai kelemahan pelabelan topik pada LDA. Penelitian ini menggunakan 50 dokumen berita yang diambil dari portal berita online. Skema ontologi yang digunakan pada penelitian ini berdasarkan kamus bidang yang terdapat di Kamus Besar Bahasa Indonesia (KBBI). Eksperimen bertujuan untuk menemukan representasi jumlah kata terbaik untuk setiap topik agar menghasilkan nama label yang relevan. Cohen’s kappa coefficient digunakan untuk mengukur realibilitas dari label berdasarkan kesepakatan dua orang ahli linguistic. Hasil penelitian ini menunjukkan nilai mean relevance rate tertinggi terdapat pada representasi 5 kata dan 30 kata tiap topik dengan nilai 80% dengan nilai rata-rata mean relevance rate sebesar 71%. Kata Kunci: Latent Dirichlet Allocation, Ontologi, Kappa, Artikel Berita Latent Dirichlet Allocation (LDA) is a topic modeling method that provides the flexibility to organize, understand, search and summarize electronic archives that have proven well implemented in text and information retrieval. The weakness in the LDA method is the inability to label the topics that have been formed. This research combines LDA with ontology scheme to overcome the weakness of labeling topic on LDA. This study uses datasests of 50 news documents taken from the online news portal. The ontology scheme used in this study based on the dictionary of the field contained in Kamus Besar Bahasa Indonesia (KBBI). Experiment aims to find the best word count representation for each topic in order to produce the relevant label name for the topic. Cohen's kappa coefficient is used to measure the reliability of the label based on the agreement of two linguistic experts. The results of this study indicate that the highest mean relevance rate value is in the 5 words and 30 words representation of each topic with 80% value with he average of mean Relevance rate value is 71%. Keywords: Latent Dirichlet Allocation, Ontology, Kappa Coefficients, news articles

Item Type:Thesis (Masters)
Subjects:T Technology > Computer engineering. Embedded system. Network. Softwares. Robotics. Multimedia
Divisions:School of Postgraduate (mixed) > Master Program in Information System
ID Code:58015
Deposited By:Mrs Ekana Perpus Pasca
Deposited On:13 Nov 2017 14:25
Last Modified:13 Nov 2017 14:25

Repository Staff Only: item control page