What Is Branding?
Are you sure that you got it right?
Thursday, May 7, 2020
Optimasi Suffix Tree Clustering dengan Wordnet dan Named Entity Recognition untuk Pengelompokan Dokumen
.
Abstrak
Semakin meningkatnya jumlah dokumen teks di dunia digital mempengaruhi banyaknya jumlah informasi dan menyebabkan kesulitan dalam proses temu kembali informasi (information retreival).
Clustering dokumen merupakan suatu bidang text mining yang penting dan dapat digunakan untuk mengefisienkan dalam pengelolaan teks serta peringkasan teks.
Namun beberapa permasalahan muncul dalam clustering dokumen teks terutama dalam dokumen berita seperti ambiguitas dalam content, overlapping cluster, dan struktur unik yang terdapat dalam dokumen berita.
Penelitian ini mengusulkan metode baru yaitu optimasi Suffix Tree Clustering (STC) dengan WordNet dan Named Entity Recognition (NER) untuk pengelompokan dokumen.
Metode ini memiliki beberapa tahap, yaitu prepocessing dokumen dengan mengekstraksi named entity serta melakukan deteksi sinonim berdasarkan WordNet.
Tahap kedua adalah pembobotan term dengan tfidf dan nerfidf.
Tahap ketiga adalah melakukan clustering dokumen dengan menggunakan Suffix Tree Clustering.
Berdasarkan pengujian didapatkan rata-rata nilai precision sebesar 79.83%, recall 77.25%, dan f-measure78.30 %.
Kata kunci: Clustering dokumen, Named Entity Recognition, Suffix Tree Clustering, WordNet
.
https://www.researchgate.net/publication/322735269_Optimasi_Suffix_Tree_Clustering_dengan_Wordnet_dan_Named_Entity_Recognition_untuk_Pengelompokan_Dokumen
Subscribe to:
Post Comments (Atom)
No comments:
Post a Comment