Jumlah aliran artikel berita yang diunggah di internet sangat banyak dan rentang waktu yang cepat. Jumlah yang banyak dan waktu yang cepat akan menyulitkan editor mengkategorikan secara manual. Terdapat metode agar berita dapat dikategorikan secara otomatis, yaitu klasifikasi. Data berita berbentuk teks, sehingga jauh lebih rumit dan perlu proses untuk mempersiapkan data. Salah satu prosesnya adalah confix-stripping stemmer sebagai cara untuk mendapatkan kata dasar dari berita Indonesia. Untuk metode klasifikasi yang digunakan adalah Naive Bayes Classifier (NBC) yang secara umum sering digunakan dalam data teks dan Support Vector Machine (SVM) yang diketahui bekerja sangat baik pada data dengan dimensi besar. Kedua metode tersebut akan dibandingkan untuk mengetahui hasil klasifikasi yang paling baik. Hasil penelitian menunjukkan bahwa SVM kernel Linier dan kernel RBF menghasilkan ketepatan klasifikasi yang sama dan bila dibandingkan dengan NBC maka SVM lebih baik.
[1]
Nello Cristianini,et al.
An introduction to Support Vector Machines
,
2000
.
[2]
Ian H. Witten,et al.
Data mining: practical machine learning tools and techniques, 3rd Edition
,
1999
.
[3]
Su-Yun Huang,et al.
Model selection for support vector machines via uniform design
,
2007,
Comput. Stat. Data Anal..
[4]
Irina Rish,et al.
An empirical study of the naive Bayes classifier
,
2001
.
[5]
Daniel T. Larose,et al.
Discovering Knowledge in Data: An Introduction to Data Mining
,
2005
.
[6]
Andreas Hotho,et al.
A Brief Survey of Text Mining
,
2005,
LDV Forum.