Klasifikasi Teks untuk Ekstraksi Pasangan Pertanyaan-Jawaban dari Mega-Thread di Forum Online
暂无分享,去创建一个
Forum online dapat dimanfaatkan dalam pengembangan chatbot dengan mengekstraksi pasangan pertanyaan-jawaban (PJ) dari thread. Pasangan PJ ini akan menjadi sumber pengetahuan untuk chatbot. Makalah ini membahas proses ekstraksi otomatis pasangan PJ dari thread berukuran besar (ribuan posting) yang disebut mega-thread. Klasifikasi teks digunakan untuk menentukan pasangan PJ yang valid dan tidak. Dengan menggunakan 1030 data pasangan quote-tanggapan yang tidak seimbang, akurasi model terbaik diperoleh dengan menggunakan teknik klasifikasi SVM (Support Vector Machine) dengan precision, recall dan F1 kelas minoritas PPJ masing-masing sebesar 0.77, 0,46 dan 0.58. Kinerja model klasifikasi masih memiliki potensi ditingkatkan lebih lanjut dengan penambahan fitur-fitur lain.