Klasifikasi Berita Online Dengan Menggunakan Pembobotan TF-IDF Dan Cosine Similarity

Dalam klasifikasi berita online dengan menggunakan pembobotan tf-idf dan cosine similarity ini mendapatkan referensi penelitian sebelumnya mengenai klasifikasi berita online menggunakan algoritma single pass clustering, dimana data yang akan digunakan berasal dari website berita online yaitu kompas.com. Karena banyaknya berita yang dimasukkan ke dalam website, sehingga terkadang berita tersebut terposting tidak sesuai dengan kategorinya. Human error akan menjadi masalah berita yang salah posting. Selain kesalahan posting pengelompokan berita online juga penting untuk kenyamanan user untuk mencari berita sesuai dengan kategorinya. Menerapkan klasifikasi berita online dengan menggunakan tf-idf dan cosine similarity, memerlukan proses preprocessing yaitu tokenizing, stopword dan stemming dapat memperkecil term sehingga mempercepat proses perhitungan pembobotan term menggunakan tf-idf dan mempercepat proses cosine similarity. Tujuannya adalah untuk mempermudahkan human error serta mengurangi terjadinya kesalahan pengkategorian. klasifikasi mampu mengelompokkan berita dengan tingkat akurasi sebesar 91.25%.