Thursday, May 7, 2020

Text Mining pada Sosial Media untuk Mendeteksi Emosi Pengguna Menggunakan Metode Support Vector Machine dan K-Nearest Neighbour


.
Twitter layanan jejaring sosial dan mikroblog yang memungkinkan penggunanya untuk mengirim dan membaca pesan berbasis teks hingga 140 karakter, yang dikenal dengan sebutan kicauan (tweet).

Sebuah teks pada tweet tidak hanya menyampaikan keterangan dari suatu informasi, tetapi juga berisi informasi tentang perilaku manusia termasuk emosi.

Untuk mendeteksi emosi dari teks pada layanan sosial media twitter dengan data yang tidak terstruktur maka perlu dilakukan analisis teks salah satunya dengan menggunakan Text Mining.

Pada penelitian ini mengusulkan melakukan penelitian text mining pada Sosial Media untuk mendeteksi emosi pengguna.

Deteksi emosi berbasis teks dapat digunakan dalam bisnis, pendidikan, psikologi, dan bidang lain mana pun yang paling penting untuk memahami dan menafsirkan emosi.

Tahapan penelitian ini melalui beberapa tahapan yaitu data. Dari Pengujian yang dilakukan dengan metode Support Vector Machine dan K-Nearest Neighbour dapat menghasilkan nilai rata-rata precision sebesar 0.45640904478933. nilai recall sebesar 0.50199332258158 dan pada nilai accuracy sebesar 0.8140589569161 sedangkan dari metode K-Nearest Neighbour nilai rata-rata precision sebesar 0.34210487225193. nilai recall sebesar 0.45954538381009 dan pada nilai accuracy sebesar 0.79705215419501. hasil dari pengujian dengan metode SVM-KNN menunjukkan bahwa kesesuaian klasifikasi emosi lebih baik daripada metode K-Nearest Neighbour dari keseluruhan kategori emosi.



I. PENDAHULUAN

Data tidak terstruktur banyak terdapat pada layanan sosial media. 

Layanan  sosial  media  merupakan  penyedia  sumber daya yang menyediakan data yang cukup besar.

Media sosial banyak menyita perhatian masyarakat karena dianggap dapat menjadi tempat untk berbagi karya, ide, opini tentang isu-isu yang terjadi  secara bebas, dan media untuk  mengungkapkan berbagai  hal  mengenai  kehidupan  pribadinya. 

Salah  satu media  sosial  yang  banyak  digunakan  masyarakat  adalah Twitter. 

Twitter  layanan  jejaring  sosial  dan  mikroblog  yang memungkinkan penggunanya untuk mengirim dan membaca pesan berbasis teks hingga 140 karakter, yang dikenal dengan sebutan kicauan (tweet)[1].

Sebuah  teks  pada  tweet  tidak  hanya  menyampaikan keterangan dari  suatu informasi,  tetapi  juga berisi informasi tentang perilaku manusia termasuk emosi.

Emosi merupakan keadaan  kompleks  dari  pikiran  yang  dipengaruhi  oleh peristiwa  eksternal,  perubahan  fisiologis,  atau  hubungan dengan orang lain. 

Dengan  tidak adanya kontak  tatap muka untuk  mendeteksi  ekspresi  wajah  dan intonasi  dalam  suara, opsi  alternatifnya  adalah  menguraikan  emosi  dari  teks  di layanan  sosial  media. 

Studi  penelitian  pendeteksian  emosi telah  menyelidiki  deteksi  emosi  dalam  prosodi,  perubahan keadaan  fisiologis,  ekspresi  wajah  dan  teks. 

Namun,  ada kekurangan  penelitian  dalam  mendeteksi  emosi  dari  teks dibandingkan dengan area lain dari deteksi emosi [2].

Untuk  mendeteksi  emosi  dari  teks  pada  layanan  sosial media twitter dengan data  yang tidak  terstruktur maka  perlu dilakukan  analisis  teks  salah  satunya  dengan  menggunakan Text  Mining.

Text  mining  mencoba  untuk  mengekstrak informasi yang berguna dari sumber data melalui identifikasi dan eksplorasi dari suatu pola menarik.

Sumber  data berupa sekumpulan dokumen dan pola menarik yang tidak ditemukan dalam  bentuk  database record,  tetapi  dalam  data  teks  yang tidak terstruktur.

Beberapa  penelititan  mengenai  deteksi  emosi  telah dilakukan contohnya padap enelitian yang dilakukan Chaitail G. Patil dan Sandip S.Patil  menyebutkan penggunaan metode Support Vector Machine dan dataset ISEAR memiliki akurasi tertinggi  yaitu  71.64%  sedangkan  Metode  Naive  Bayes Classifier akurasinya 60.8% dan yang terendah pada metode Vector Space Model 34.8% dalam untuk Ekstraksi Emosi dari Headline News [3].

Namun Pada penelitianm Arifin and Ketut Eddy  Purnama  melakukan  Klasifikasi  Emosi  Dalam  Teks Bahasa Indonesia menggunakan metode K-Nearest Neighbour.

Pada penelitian yang dilakukan penulis melakukan klasfikasi emosi  pada artikel  yang  ada  diinternet  kemudian dilakukan pengujian  antara  metode  Naïve  Bayes  dengan  K-Nearest Neighbour.

Hasil  dari penelitian tersebut  didapat metode K-Nearest Neighbour menghasilkan nilai akurasi 71.26% yang lebih tinggi daripada metode Naïve Bayes dengan nilai akurasi 58.01% [4].

Berdasarkan  latar  belakang  dan  beberapa  penelitian sebelumnya maka penulis melalui penelitian ini mengusulkan melakukan  penelitian  implementasi text  mining  pada  Sosial Media untuk mendeteksi emosi pengguna.

Metode klasifikasi yang digunakan yaitu metode Support Vector Machine untuk klasifikasi  kelas  emosi  dan  metode  K-Nearest  Neighbour untuk klasifikasi kategori emosi. 

Metode tersebut  digunakan karena metode Support Vector Machine memiliki nilai akurasi tertinggi  pada  penelitian  sebelumnya  serta  Support  Vector Machine  secara  teoritik  dikembangkan  untuk  problem klasifikasi  dengan  dua  class  yang  sangat  tepat  untuk klasifikasi  kelas  emosi[5].

Sedangkan  Metode  K-Nearest Neighbour digunakan  karena pada penelitian sebelumnya K-Nearest  Neighbour  memiliki  akurasi  yang  lebih  tinggi daripada  metode  Naive  Bayes  dan  Metode  K-Nearest Neighbour melakukan  pelatihannya sangat cepat dan  Efektif jika  data  pelatihan  besar  yang  sangat  cocok  dengan penggunaan ISEAR  dataset [6]. 

Deteksi emosi berbasis teks seperti  yang disebutkan sebelumnya dapat  digunakan  dalam bisnis, pendidikan, psikologi, dan bidang lain mana pun yang paling penting untuk memahami dan menafsirkan emosi.


.
https://www.researchgate.net/publication/333020467_Text_Mining_pada_Sosial_Media_untuk_Mendeteksi_Emosi_Pengguna_Menggunakan_Metode_Support_Vector_Machine_dan_K-Nearest_Neighbour

No comments:

Post a Comment