Klasifikasi Topik Berita Berbahasa Indonesia menggunakan Weighted K-Nearest Neighbor
暂无分享,去创建一个
Berita adalah salah satu sarana informasi bagi masyarakat umum. Di jaman yang modern ini orang-orang banyak menggunakan media online sebagai salah satu sarana untuk mengakses berita. Di Indonesia sendiri media online memiliki presentase paling besar sebagai sarana penyampaian berita [1]. Namun banyaknya berita yang ada dalam media online memunculkan masalah dalam mengkategorikan topik berita yang ada. Sehingga dibutuhkanlah sistem yang dapat mengkategorikan setiap topik berita yang ada pada media online . Penelitian ini bertujuan menciptakan sistem yang mampu mengkategorikan setiap berita berbahasa Indonesia pada kelas yang seharusnya. Pengklasifikasian menggunakan metode weighted k-Nearest Neighbor ( wkNN ) karena merupakan classifier yang sederhana namun powerful . Pada penelitian ini terdapat beberapa tahap dalam perancangan sistem, yaitu preprocessing data, feature extraction , dan pengklasifikasian menggunakan weighted k-Nearest Neighbor . Setelah tahap-tahap tersebut dilalui dilakukanlah pengukuran performansi. Hasil penelitian mampu memberikan performa sistem sebesar 75,86% dengan nilai k = 27.
[2] Klaus Hechenbichler,et al. Weighted k-Nearest-Neighbor Techniques and Ordinal Classification , 2004 .
[3] Edi Winarko,et al. PENGGUNAAN KNN (K-NEARST NEIGHBOR) UNTUK KLASIFIKASI TEKS BERITA YANG TAK-TERKELOMPOKKAN PADA SAAT PENGKLASTERAN OLEH STC (SUFFIX TREE CLUSTERING) , 2015 .
[4] Lukasz Kurgan,et al. Data Mining and Knowledge Discovery Data Mining and Knowledge Discovery , 2002 .