Mastering the recitation of the Holy Quran is an obligation among Muslims. It is an important task to fulfill other Ibadat like prayer, pilgrimage, and zikr. However, the traditional way of teaching Quran recitation is a hard task due to the extensive training time and effort required from both teacher and learner. In fact, learning the correct pronunciation of the Quranic letters or alphabets is the first step in mastering Tajweed
(Rules and Guidance) in Quranic recitation. The pronunciation of Arabic alphabets is based on its points of articulation and the characteristics of a particular alphabet. In this paper, we implement a lip identification technique from video signal acquired from experts to extract the movement data of the lips while pronouncing the correct Quranic alphabets. The extracted lip movement data from experts helps in categorizing the alphabets into 5 groups and in deciding the final shape of the lips. Later, the technique was tested among a
public reciter and then compared for similarity verification between the novice and the professional reciter. The system is able to extract the lip movement of the random user and draw the displacement graph and compare with the pronunciation of the expert. The error
will be shown if the user has mistakenly pronounced the alphabet and suggests ways for improvement. More subjects with different backgrounds will be tested in the very near future with feedback instructions. Machine learning techniques will be implemented at a later stage for the real time learning application.
Menguasai bacaan Al-Quran adalah satu kewajipan di kalangan umat Islam.
Ia adalah satu tugas yang penting untuk memenuhi Ibadat lain seperti solat, haji, dan zikir.
Walau bagaimanapun, cara tradisional pengajaran bacaan Al-Quran adalah satu tugas yang
sukar kerana memerlukan masa latihan dan usaha yang banyak daripada guru dan pelajar.
Malah, mempelajari sebutan yang betul bagi huruf Al-Quran adalah langkah pertama
dalam menguasai Tajweed (Peraturan dan Panduan) pada bacaan Al-Quran. Sebutan huruf
Arab adalah berdasarkan cara penyebutan tiap-tiap huruf dan ciri-ciri huruf tertentu.
Dalam kertas ini, kami membina teknik pengenalan bibir dari isyarat video yang diperoleh
daripada bacaan Al Quran oleh pakar-pakar untuk mengekstrak data pergerakan bibir
ketika menyebut huruf Al-Quran yang betul. Data pergerakan bibir yang diekstrak
daripada pembacaan oleh pakar membantu dalam mengkategorikan huruf kepada 5
kumpulan dan dalam menentukan bentuk akhir bibir. Kemudian, teknik ini diuji dengan
pembaca awam dan kemudian bacaan mereka dibandingkan untuk pengesahan persamaan
bacaan antara pembaca awam dan pembaca Al-Quran profesional. Sistem ini berjaya
mengambil pergerakan bibir pengguna rawak dan melukis graf perbezaan sebutan mereka
apabila dibandingkan dengan sebutan pakar. Jika pengguna telah tersilap menyebut sesuatu huruf, kesilapan akan ditunjukkan dan cara untuk penambahbaikan dicadangkan.
Lebih ramai pengguna yang mempunyai latar belakang yang berbeza akan diuji dalam
masa terdekat dan arahan maklum balas akan diberi. Teknik pembelajaran mesin akan
dilaksanakan di peringkat seterusnya bagi penggunaan pembelajaran masa nyata.
[1]
Ahmad Basheer Hassanat,et al.
Visual Words for Automatic Lip-Reading
,
2014,
ArXiv.
[2]
D.R. Reddy,et al.
Speech recognition by machine: A review
,
1976,
Proceedings of the IEEE.
[3]
Luca Lombardi,et al.
A survey of automatic lip reading approaches
,
2013,
Eighth International Conference on Digital Information Management (ICDIM 2013).
[4]
Gérard Bailly,et al.
Visual articulatory feedback for phonetic correction in second language learning
,
2010
.
[5]
Reda A. El-Khoribi,et al.
Audio-Visual Speech Recognition for People with Speech Disorders
,
2014
.
[6]
Tsuhan Chen,et al.
Audiovisual speech processing
,
2001,
IEEE Signal Process. Mag..
[7]
Sadaoki Furui,et al.
Audio-Visual Speech Recognition Using Lip Information Extracted from Side-Face Images
,
2007,
EURASIP J. Audio Speech Music. Process..
[8]
Gang Chen,et al.
Computer-Assisted Audiovisual Language Learning
,
2012,
Computer.
[9]
Bassel Soudan,et al.
Computer-Aided Training for Quranic Recitation☆
,
2015
.
[10]
Yasuhiro Oikawa,et al.
Extract voice information using high-speed camera
,
2013
.