SISTEM PENCARIAN INFORMASI KARYA ILMIAH BERBAHASA INDONESIA BERBASIS WEB SEMANTIK

ATINA, Vihi and Sediyono, Eko and Isnanto, R. Rizal (2017) SISTEM PENCARIAN INFORMASI KARYA ILMIAH BERBAHASA INDONESIA BERBASIS WEB SEMANTIK. Masters thesis, School of Postgraduate.

[img]PDF
Restricted to Repository staff only

2243Kb

Abstract

Peningkatan jumlah karya ilmiah serta keragamannya menambah kesulitan dalam pencarian dan pengaturan akan karya ilmiah yang relevan. Kualitas hasil pencarian yang disediakan oleh mesin pencari belum maksimal dalam menjawab permintaan pengguna karena tidak melibatkan unsur semantik dalam proses pencarian. Maka perlu untuk membangun sistem pencarian informasi karya ilmiah yang memudahkan bagi peneliti dalam mencari judul naskah yang sesuai dengan topik penelitiannya. Penelitian ini bertujuan menerapkan web semantik dengan ontologi dalam sistem pencarian informasi karya ilmiah berbahasa Indonesia. Data karya ilmiah yang digunakan adalah karya ilmiah berbahasa Indonesia. Tahapan membangun sistem meliputi proses crawler data dengan algoritma Breadth-First Search, membangun ontologi, proses NLP (case folding, tokenizing dan filtering), proses representasi query SPARQL, proses pengindeksan dan proses pemeringkatan. Hasil penelitian berupa sistem pencarian informasi karya ilmiah berbahasa Indonesia yang dapat menampilkan judul dan link karya ilmiah yang berhubungan dengan frasa pencariannya. Pengujian dilakukan dengan metode recall dan precision. Peningkatan nilai recall sebesar 9,4% menunjukkan bahwa sistem pencarian berbasis web semantik meningkatkan hasil pencarian, sedangkan peningkatan nilai precision sebesar 11.1% menunjukkan bahwa sistem pencarian berbasis web semantik meningkatkan relevansi pencarian jika dibandingkan dengan sistem pencarian berbasis web. Nilai recall sebesar 98.3% dan nilai precision sebesar 99,6% menunjukkan bahwa sistem pencarian informasi karya ilmiah pada penelitian ini efektivitasnya tinggi. Kata kunci : karya ilmiah, NLP, ontologi, query SPARQL, web semantik The increase number of manuscripts and their diversity add the difficulty of searching and arranging for relevant manuscripts. The quality of search results provided by search engines has not been maximized in response to user requests because it does not involve semantic elements in the search process. It is necessary to build a information retrieval system for manuscript that makes it easy for researchers finding the title of the manuscript according to their research topic. This research aims to apply semantic web with ontology in information retrieval system for Indonesian manuscript. Manuscript data used in this research are Indonesian manuscript. Stages build system include data crawler process, build ontologies, NLP process, SPARQL query representation process, indexing process and ranking process. The results of research is information retrieval system for Indonesian manuscript that can display the title and link of manuscript related to the search phrase. Tests are done with recall and precision methods. The increase in recall value of 9,4% indicates that information retrieval system using semantic web improves search results, while the increase in precision value of 11,1% indicates that information retrieval system using semantic web improves search relevance when compared with information retrieval system using web. The recall value of 98.3% and the precision value of 99.6% indicates that the information retrieval system in this research has high effectiveness. Keywords: manuscript, NLP, ontology, SPARQL query, semantic web

Item Type:Thesis (Masters)
Subjects:T Technology > Computer engineering. Embedded system. Network. Softwares. Robotics. Multimedia
Divisions:School of Postgraduate (mixed) > Master Program in Information System
ID Code:58022
Deposited By:INVALID USER
Deposited On:13 Nov 2017 14:54
Last Modified:13 Nov 2017 14:54

Repository Staff Only: item control page