SISTEM PENCARIAN DAN PERINGKASAN BERITA ONLINE BERBAHASA INDONESIA MENGGUNAKAN METODE LATENT SEMANTIC INDEXING (LSI)

FARIQ, MUHAMMAD LUKMAN and Sutikno, Sutikno (2017) SISTEM PENCARIAN DAN PERINGKASAN BERITA ONLINE BERBAHASA INDONESIA MENGGUNAKAN METODE LATENT SEMANTIC INDEXING (LSI). Undergraduate thesis, Universitas Diponegoro.

[img]
Preview
PDF
Available under License Creative Commons Attribution Non-commercial Share Alike.

873Kb

Abstract

Jumlah berita online yang tersebar di internet semakin bertambah banyak, selain itu banyaknya situs berita yang terdaftar pada www (world wide web) memungkinkan hasil pencarian berita menjadi sangat luas. Mesin pencari berita berbasis information retrieval menjadi solusi untuk mempermudah masyarakat dalam mencari informasi berita tertentu. Information retrieval menghasilkan beberapa berita yang diurutkan berdasarkan tingkat relevansi terhadap query. Relevan atau tidaknya berita akan diketahui secara jelas setelah pengguna membaca keseluruhan isi berita. Oleh karena itu mesin pencari berita disertai ringkasan berita membantu memudahkan pengguna untuk mencari informasi lebih cepat tanpa membaca keseluruhan isi berita. Peringkasan berita menggunakan peringkasan ekstraktif Cross Method dengan memilih kalimat-kalimat penting sebagai representasi ringkasan berita. Penelitian ini menerapkan metode Latent Semantic Indexing yang mampu mencari hubungan semantik tiap kata untuk mencari nilai kemiripan antar kalimat maupun query dengan dokumen. Data penelitian yang dipakai berupa korpus yang berisi 100 berita dari situs Detik, Kompas dan Tribunnews. Sistem memberikan output berupa 10 urutan teratas berita yang dicari disertai dengan ringkasannya. Berdasarkan hasil evaluasi pada peringkasan dan pencarian, nilai akurasi dipengaruhi oleh perubahan parameter nilai k-rank. Peringkasan berita yang diuji dengan ringkasan pakar menghasilkan rata-rata nilai precision 0.41, nilai recall 0.64 dan nilai F-score 0.49 pada nilai k-rank = 3. Nilai k-rank optimal untuk pencarian berita adalah 2 yang menghasilkan nilai Mean Average Precision (MAP) sebesar 0.73. Kombinasi penggunaan korpus ringkasan dan parameter k-rank untuk pencarian berita menghasilkan nilai Mean Average Precision (MAP) sebesar 0.40.

Item Type:Thesis (Undergraduate)
Subjects:Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Q Science > QA Mathematics > QA76 Computer software
Divisions:Faculty of Science and Mathematics > Department of Computer Science
ID Code:60722
Deposited By:INVALID USER
Deposited On:12 Feb 2018 15:33
Last Modified:12 Feb 2018 15:33

Repository Staff Only: item control page