Model Klasifikasi Ujaran Kebencian pada Data Twitter dengan Menggunakan CNN-LSTM

HATE SPEECH CLASSIFICATION MODEL ON TWITTER DATA USING CNN-LSTM

Authors

  • Muhammad Ridwan Universitas Bina Darma
  • Ari Muzakir Universitas Bina Darma

Keywords:

ujaran kebencian, media sosial, cnn, lstm

Abstract

Ujaran kebencian sering terjadi di media sosial dikarenakan karakteristiknya yang bersifat publik dan transparan. Jika dibiarkan akan banyak timbul berbagai dampak negatif seperti diskriminasi, konflik sosial, dan bahkan genosida. Untuk menghindari hal tersebut pencegahan dengan mendeteksi ujaran kebencian harus dilakukan. Penelitian ini mengusulkan metode hybrid deep learning yang terdiri dari gabungan model Convolutional Neural Network (CNN) dan Long Short-Term Memory (LSTM) yang didukung oleh metode word embedding Skip-gram dan Continuous Bag of Word (CBOW) dari model Word2Vec untuk membuat model klasifikasi yang dapat bekerja pada ujaran kebencian di Twitter. Eksperimen dilakukan dengan menyetel kombinasi iterasi dan dimensi embedding pada model CNN-LSTM dengan Skip-gram dan CBOW. Hasil CNN-LSTM terbaik didapatkan dari kombinasi 30 iterasi dan 300 dimensi Skip-gram yang memperoleh nilai akurasi label setinggi 69.1% pada tahapan uji coba.

Downloads

Published

2022-09-29

How to Cite

Model Klasifikasi Ujaran Kebencian pada Data Twitter dengan Menggunakan CNN-LSTM: HATE SPEECH CLASSIFICATION MODEL ON TWITTER DATA USING CNN-LSTM. (2022). Teknomatika, 12(02), 209-218. https://ojs.palcomtech.ac.id/index.php/teknomatika/article/view/604