PERINGKAS MULTI DOKUMEN MENGGUNAKAN METODE K-MEANS DAN LATENT DIRICHLET ALLOCATION (LDA) – SIGNIFICANCE SENTENCES

Twinandilla, Shiva and KUSUMANINGRUM, RETNO (2018) PERINGKAS MULTI DOKUMEN MENGGUNAKAN METODE K-MEANS DAN LATENT DIRICHLET ALLOCATION (LDA) – SIGNIFICANCE SENTENCES. Undergraduate thesis, Universitas Diponegoro.

[img]
Preview
PDF
Available under License Creative Commons Attribution Non-commercial Share Alike.

1249Kb

Abstract

Teknologi merupakan salah satu media yang digunakan untuk menyebarkan informasi ke khalayak umum. Di era globalisasi ini, ilmu pengetahuan dan teknologi terus berkembang pesat dari waktu ke waktu. Hal ini menyebabkan jumlah dokumen berita yang ada semakin banyak khususnya di internet. Dokumen berita online dapat membantu pembaca dalam memperoleh informasi terbaru secara cepat, dimanapun dan kapanpun. Namun, dokumen berita online mengesampingkan detail dan akurasi berita karena tujuannya untuk memberikan informasi terkini sebanyak-banyaknya. Banyak isi dokumen berita yang hampir sama sehingga menyebabkan redundansi dokumen berita atau disebut yellow journalism. Yellow journalism dapat menyebabkan pembaca sulit membedakan dokumen yang mengandung informasi fakta atau opini. Oleh sebab itu, diperlukan penelitian mengenai peringkas multi dokumen agar pembaca lebih mudah memahami maksud dari dokumen berita online. Peringkas multi dokumen menggunakan metode K-Means dan Latent Dirichlet Allocation (LDA) – Significance Sentences merupakan teknologi yang dapat diimplementasikan untuk mendapatkan hasil ringkasan dari beberapa dokumen berita yang secara umum memiliki topik yang sama. Tujuan dari penelitian ini yaitu untuk mengetahui kinerja metode peringkas multi dokumen menggunakan metode KMeans dan LDA – Significance Sentences. Pengujian sistem peringkas multi dokumen dilakukan dengan menggunakan metode ROUGE-1 dan terdapat 2 skenario pengujian. Pengujian pertama dilakukan untuk mengetahui nilai parameter terbaik pada metode LDA – Significance Sentences. Berdasarkan hasil pengujian pertama, penelitian ini memiliki nilai alfa terbaik sebesar 0.001 dengan nilai ROUGE-1 sebesar 0.5545 dan level peringkasan terbaik sebesar 30% dengan nilai ROUGE-1 sebesar 0.6118. Pengujian kedua dilakukan untuk mengetahui kinerja metode K-Means yang terdiri dari 2 proses dengan berita sebanyak 8 dokumen sehingga masing-masing proses menghasilkan 2 cluster. Proses pertama menghasilkan cluster 1 yang terdiri dari dokumen 1, 2, 3, 4, 6 dengan niai ROUGE-1 sebesar 0.6139 dan cluster 2 terdiri dari dokumen 5, 7, 8 dengan nilai ROUGE-1 sebesar 0.6199, sedangkan proses kedua menghasilkan cluster 1 yang terdiri dari dokumen 2 dengan nilai ROUGE-1 sebesar 0.5833 dan cluster 2 terdiri dari dokumen 1, 3, 4, 5, 6, 7, 8 dengan nilai ROUGE-1 sebesar 0.4542. Proses pertama memiliki hasil yang cukup baik karena nilai ROUGE-1 hampir mendekati nilai 1. Peringkas multi dokumen menggunakan metode K-Means dan LDA- Significance Sentence memiliki kinerja yang baik untuk metode LDA-Significance Sentence , sedangkan metode K-Means belum bisa membedakan dokumen berita berdasarkan topiknya secara khusus.

Item Type:Thesis (Undergraduate)
Subjects:Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Q Science > QA Mathematics > QA76 Computer software
Divisions:Faculty of Science and Mathematics > Department of Computer Science
ID Code:65826
Deposited By:Mrs. Khadijah .
Deposited On:11 Oct 2018 19:23
Last Modified:11 Oct 2018 19:23

Repository Staff Only: item control page