Mahmud, Irfandy (2010) Aplikasi Pengenalan Ucapan Dengan Jaringan Syaraf Tiruan Propagasi Balik Untuk Pengendalian Robot Bergerak. Undergraduate thesis, Diponegoro University.
| PDF - Published Version 256Kb |
Abstract
Abstrak – Pengenalan ucapan dengan jaringan syaraf tiruan dapat dipahami dan dimengerti melalui beberapa metode ekstraksi ciri, diantaranya dengan metode LPC dan transformasi Fourier. Linear Predictive Coding adalah salah satu alat dalam pemrosesan atau analisa sinyal untuk memperoleh fitur atau ciri unik dari tiap pola suara. Sedangkan Transformasi Fourier digunakan untuk memperjelas ciri tiap pola karena dapat memberikan informasi-informasi yang disajikan dalam ranah frekuensi baik yang bersifat diskret maupun kontinu. JST (Jaringan Syaraf Tiruan) banyak digunakan untuk aplikasi pengenalan pola (pattern recognition). Kemampuan untuk pembelajaran dari data pelatihan dan generalisasi ke situasi/kondisi yang baru adalah alasan mendasar mengapa JST banyak digunakan. Hasil yang di harapkan adalah suatu sistem kendali robot yang efektif hanya dengan menggunakan suara manusia. Suara manusia yang masuk akan dikenali oleh JST dan diubah menjadi suatu karakter ASCII yang dapat dikenali oleh robot kemudian dikirimkan melalui komunikasi serial ke robot. Dalam aplikasi ini pengenalan ucapan meliputi lima kata, diantaranya maju, mundur, kanan, kiri dan stop. Mula-mula sinyal suara direkam dalam bentuk file *.wav. Kemudian sinyal suara analog dicuplik menjadi sinyal digital dengan kecepatan cuplik 8000 Hz. Untuk proses ekstraksi parameter suara digunakan metode Linear Predictive Coding (LPC) untuk mendapatkan koefisien cepstral. Koefisien cepstral LPC ini ditransformasikan ke dalam domain frekuensi dengan beberapa titik pada Fast Fourier Transform (FFT), yaitu 32, 64, 128, dan 512 point. Selanjutnya dari data tersebut diambil setengahnya saja yang sudah mewakili representasi frekuensi dari sinyal tersebut. Data numeris tersebut dilatih dengan Jaringan Syaraf Tiruan untuk dikenali. Metoda pembelajaran yang digunakan adalah Back Propagation. Dari hasil pembelajaran akan didapatkan bobot jaringan yang telah berubah. Jaringan diuji dengan memberikan masukkan berupa data pengujian. Hasil pengujian menunjukkan bahwa pengenalan jaringan terhadap data baru lebih rendah terhadap data latihan. Dari beberapa variasi pengujian diperoleh jaringan terbaik net9 dengan prosentase pengenalan suara dari responden di dalam database sebesar 86 %, dan prosentase pengenalan suara dari responden di luar database sebesar 66,67 %.
Item Type: | Thesis (Undergraduate) |
---|---|
Uncontrolled Keywords: | Pengenalan ucapan, LPC, FFT, JST, Back Propagation, serial |
Subjects: | T Technology > TK Electrical engineering. Electronics Nuclear engineering |
Divisions: | Faculty of Engineering > Department of Electrical Engineering Faculty of Engineering > Department of Electrical Engineering |
ID Code: | 19058 |
Deposited By: | INVALID USER |
Deposited On: | 06 Aug 2010 09:01 |
Last Modified: | 06 Aug 2010 09:01 |
Repository Staff Only: item control page