Rochmawati, Yeny and KUSUMANINGRUM, RETNO (2015) PERBANDINGAN ALGORITMA PENCARIAN STRINGDALAM METODE APPROXIMATE STRING MATCHING UNTUK IDENTIFIKASI KESALAHAN PENGETIKAN TEKS BAHASA INDONESIA DAN SARAN PERBAIKAN. Undergraduate thesis, Universitas Diponegoro.
| PDF Available under License Creative Commons Attribution Non-commercial Share Alike. 617Kb |
Abstract
Penggunaan Bahasa Indonesia yang baik dan benar memiliki peran penting khususnya untuk sebuah dokumen ilmiah (laporan, makalah, karya ilmiah, skripsi) dan dokumen resmi yang lain. Kesalahan pengetikan yang sering terjadi menyebabkan kata baku berubah menjadi kata tidak baku karena ejaan yang digunakan tidak sesuai. Proses pengecekan kesalahan pengetikan dengan cara manual akan menghabiskan banyak waktu dan tidak optimal karena memungkinkan adanya human error. Hal tersebut dapat ditangani dengan mengembangkan suatu sistem yang mampu mengidentifikasi kesalahan pengetikan agar sesuai dengan kaidah penulisan. Beberapa penelitian yang sudah dikembangkan terkait dengan pengecekan kata berbahasa Indonesia di Indonesia, untuk memberikan saran perbaikan menggunakan algoritma Levenshtein Distance. Pada metode approximate string matching terdapat empat jenis algoritma yaitu Levenshtein Distance, Hamming Distance, Damerau Levenshtein Distance dan Jaro Winkler Distance. Perbandingan kinerja keempat algoritma tersebut untuk pencarian string dalam pengecekan kata belum pernah dilakukan. Oleh karena itu, pada penelitian ini akan dilakukan perbandingan antara empat algoritma tersebut sehingga dapat diketahui algoritma mana yang lebih akurat dan tepat dalam pencarian string berdasarkan kesalahan penulisan yang bervariasi. Evaluasi yang dilakukan menggunakan user relevance judgement yang menghasilkan nilai mean average precision (MAP) untuk menentukan algoritma yang terbaik. Berdasarkan hasil penelitian terhadap 50 kata salah menunjukkan bahwa algoritma Jaro Winkler Distance terbaik dalam melakukan pengecekan kata dengan nilai MAP sebesar 0.87 yang terbagi dalam empat jenis kesalahan yaitu penghapusan huruf 0.92, penambahan huruf 0.90, penggantian huruf 0.70 dan penukaran huruf 0.95.
Item Type: | Thesis (Undergraduate) |
---|---|
Subjects: | Q Science > QA Mathematics > QA75 Electronic computers. Computer science Q Science > QA Mathematics > QA76 Computer software |
Divisions: | Faculty of Science and Mathematics > Department of Computer Science |
ID Code: | 59539 |
Deposited By: | INVALID USER |
Deposited On: | 17 Jan 2018 15:21 |
Last Modified: | 17 Jan 2018 15:21 |
Repository Staff Only: item control page