Identifikasi Kata Kunci Pada Dokumen Ilmiah Berbahasa Inggris Menggunakan Algoritma Hidden Markov Model

Kata kunci merupakan kumpulan kata penting dalam sebuah dokumen yang menggambarkan isi dari dokumen tersebut. Pemilihan kata kunci dapat memakan waktu banyak jika ruang lingkup yang digunakan terlalu luas. Oleh karena itu diperlukan suatu teknik agar proses tersebut lebih efisien. Untuk menyelesaikan masalah tersebut dapat diterapkan pada proses text mining. Algoritma Hidden Markov Model dapat digunakan untuk menentukan pemilihan alternatif kata kunci, dimana Hidden Markov Model mencari sebuah keadaan tersembunyi dari sebuah kata. Hasil dari penerapan algoritma tersebut akan ditampilkan sebagai alternatif daftar kata kunci dimana keputusan terakhir tetap pengguna yang menentukan. Dari pengujian yang telah dilakukan parameter yang mempengaruhi pemilihan kata kunci pada algoritma hidden markov model yaitu transisi dan emisi dimana kedua parameter tersebut merupakan probabilitas penentu sebuah kata merupakan kata kunci atau bukan. Permasalahan pemilihan kata kunci otomatis ternyata kurang cocok jika diimplementasikan dengan algoritma hidden markov model karena keragaman yang cukup besar sehingga memerlukan data latih yang sangat besar. Kontribusi penelitian ini adalah memberikan alternatif pada pengguna dalam menentukan kata kunci yang akan digunakan pada sebuah dokumen.