KAJIAN TENTANG EKSTRAKSI HEADER SURAT RESMI DENGAN HISTOGRAM

Sistem ekstraksi header surat resmi adalah sebuah sistem Optical Character Recognition yang menerima input berupa citra surat hasil pemindaian (scan) dan menghasilkan output berupa karakter-karakter dari header surat tersebut. Header surat adalah bagian-bagian surat berupa tanggal surat, nomor surat, lampiran surat, perihal surat, dan tujuan dalam surat. Sistem ekstraksi header surat resmi terdiri dari lima proses utama yaitu preprocessing citra input, segmentasi header surat, segmentasi baris dan karakter dengan histogram automatic cropping, resize template, dan pengenalan dengan template matching. Preprocessing citra input terdiri dari proses grayscale, thresholding dan skew correction. Template matching digunakan untuk mencari karakter dari citra karakter yang didapatkan dengan membandingkan citra tersebut dengan template-template yang ada. Untuk dapat menggunakan metode template matching, dilakukan proses resize template terlebih dahulu agar ukuran citra karakter dengan template sama besar.