PENERAPAN ALGORITMA LALR PARSER DAN CONTEXT-FREE GRAMMAR UNTUK STRUKTUR KALIMAT BAHASA INDONESIA

Penyajian bahasa dalam bentuk tulisan, dapat menyimpan pengetahuan dari generasi ke generasi berikutnya. Setiap penulisan karya tulis seperti buku, hendaknya ditulis dengan tata bahasa yang benar sesuai kaidah-kaidah bahasa Indonesia, karena akan berpengaruh pada kesempurnaan proses penyampaian ide atau pesan. Parsing adalah proses untuk memeriksa kebenaran struktur kalimat berdasarkan suatu grammar (tata bahasa). Salah satu algoritma untuk parsing kata dalam Context-Free Grammar (CFG) adalah LALR Parser . LALR Parser merupakan salah satu varian dari LR Parser yang mampu menangani grammar (Gupta, 2013). Uji coba dilakukan pada tiga jenis kalimat yaitu kalimat tunggal, kalimat majemuk setara, dan kalimat majemuk bertingkat. LALR Parser efektif dalam melakukan parsing terhadap CFG bahasa Indonesia pada kalimat tunggal (nilai akurasi 90.30%), kalimat majemuk setara (nilai akurasi 76.66%), dan kalimat majemuk bertingkat (nilai akurasi 78.57%). Kegagalan deteksi dipengaruhi oleh 3 hal yaitu (1) struktur kalimat tidak sesuai dengan kaidah bahasa Indonesia, (2) unsur pembentuk kalimat tidak tersedia dalam CFG, dan (3) kata yang terdapat dalam kalimat tidak tersedia dalam lexicon .

[1]  Sunita Yadav,et al.  Extraction of link context using tag tree and LALR parsing , 2013, 2013 IEEE CONFERENCE ON INFORMATION AND COMMUNICATION TECHNOLOGIES.

[2]  V. KodavadeD.,et al.  Recognizing English Grammar Using Predictive Parser , 2013 .

[3]  C. Boogerd A Framework for SGLR Parsing in Java , 2005 .