Analisis Semantik Berbasis Konteks Menggunakan Model Hybrid Indobert–knn untuk Deteksi Komentar Cyberbullying Tiktok

Authors

  • Dita Latuba Universitas Darul 'Ulum
  • Budiman Universitas Darul 'Ulum
  • Winarti Universitas Darul 'Ulum

DOI:

https://doi.org/10.61124/sinta.v3i2.187

Keywords:

Cyberbullying, analisis semantik, Indobert, K-Nearest Neighbor, TikTok, NLP

Abstract

Cyberbullying saat ini dipandang sebagai salah satu persoalan serius dalam lingkungan, khususnya Tiktok, karena berpotensi menimbulkan dampak negatif terhadap kondisi psikologis dan kenyamanan pengguna. Sifat komentar yang pendek, tidak baku, serta bergantung konteks menyebabkan pendekatan klasifikasi yang hanya mengandalkan fitur leksikal sederhana belum mampu memahami makna secara utuh. Berdasarkan permasalahan tersebut, penelitian ini berfokus pada upaya merepresentasikan konteks semantik komentar berbahasa Indonesia secara lebih efektif untuk meningkatkan ketepatan deteksi cyberbullying. Tujuan penelitian adalah menganalisis efektivitas pendekatan representasi semantik berbasis konteks menggunakan model hybrid dalam mendeteksi komentar cyberbullying pada TikTok. Metode yang diusulkan mengombinasikan IndoBERT sebagai feature extractor untuk menghasilkan vektor representasi semantik dan algoritma K-Nearest Neighbor (KNN) sebagai klasifier berdasarkan kedekatan fitur. Data yang digunakan berupa komentar TikTok berbahasa Indonesia yang telah dilabeli sebagai cyberbullying dan non-cyberbullying. Hasil pengujian menunjukkan bahwa representasi semantik berbasis IndoBERT mampu mendukung kinerja klasifikasi KNN secara efektif dan menghasilkan performa deteksi yang stabil. Model hybrid ini mencapai nilai akurasi sebesar 81% yang mengindikasikan kemampuan model dalam membedakan komentar bullying dan non-bullying secara efektif. Secara keseluruhan, penelitian ini membuktikan bahwa integrasi representasi semantik berbasis konteks dan klasifikasi berbasis kedekatan vektor berpotensi menjadi solusi yang relevan dan adaptif untuk deteksi cyberbullying berbasis teks pada platform TikTok.

References

E. Sylvain and M. Talpade, “Exploring The Characteristics of Cyberbullied TikTokers Based on Their Ethnicity,” Int. J. Arts, Humanit. Soc. Sci., vol. 05, no. 06, pp. 49–53, 2024, doi: 10.56734/ijahss.v5n6a8.

F. G. Aser, S. Paramita, and Sudarto, “Fenomena Cyberbullying di Media Sosial TikTok,” Kiwari, vol. 1, no. 3, pp. 449–453, 2022, doi: 10.24912/ki.v1i3.15763.

D. Cyberbullying, T. Mental, and D. A. N. Perilaku, “Triwikrama : Jurnal Ilmu Sosial,” vol. 6, no. 1, pp. 42–56, 2024.

Sadaruddin, A. F. K. Nur, Kasmawati, and K. N. Fitrah, “Cyberbullying: Ancaman Mental Siswa di Era Digital,” J. Pendidik. dan Teknol., vol. 1, no. April, pp. 16–25, 2025, [Online]. Available: http://jurnal-fkip-uim.ac.id/index.php/teknos/article/view/394

H. Saleous, M. Gergely, and K. Shuaib, “Review Article Exploring NLP-Based Solutions to Social Media Moderation Challenges,” vol. 2025, 2025, doi: 10.1155/hbe2/9436490.

N. F. Hasan and V. Wati, “Deteksi Cyberbullying pada Facebook Menggunakan Algoritma K-Nearest Neighbor-Detect Cyberbullying on Facebook Using K-Nearest Neighbor Algorithm,” vol. 1, no. 1, pp. 35–44, 2021.

I. S. Arfan, S. Fauziah, and I. Nawangsih, “Sentiment Analyst of Cyber Bullying in X Using Naïve Bayes Algorithm Analisa Sentimen Terhadap Cyber Bullying di X Menggunakan Algoritma Naïve Bayes,” vol. 4, no. October, pp. 1411–1419, 2024.

Y. D. Novandian et al., “IndoBERT-based Indonesian Cyberbullying Detection with Multi-stage Labeling,” Proc. - 2024 Int. Semin. Appl. Technol. Inf. Commun. Smart Emerg. Technol. a Better Life, iSemantic 2024, no. December, pp. 515–521, 2024, doi: 10.1109/iSemantic63362.2024.10762553.

Kurniawanda, R., Tobing, and A. A., “Cyberbullying Detection on Instagram Using XGBoost,” Indones. J. Data Sci., vol. 3, no. 2, pp. 85–96, 2023.

A. A. Hafiza and E. B. Setiawan, “Peningkatan Deteksi Cyberbullying pada Platform ’ X ’ Menggunakan IndoBERT dan Model Hybrid CNN-LSTM,” vol. 6, no. 2, pp. 655–672, 2025.

P. Rona and I. Riadi, “Cyberbullying Detection on TikTok using Association of Chief Police Officers,” Int. J. Comput. Appl., vol. 186, no. 3, pp. 6–13, 2024, doi: 10.5120/ijca2024923359.

I. Jufri, Arianto, and A. F. Sonni, “Analisis Respon Publik dan Sentimen Video Berbagi Willy Salim yang Viral di TikTok,” J. Ris. Jurnalistik dan Media Digit., pp. 77–88, 2025, doi: 10.29313/jrjmd.v5i1.7017.

A. Pramudyantoro, E. Utami, and D. Ariatmanto, “Penggabungan K-Nearest Neighbors Dan Lightgbm Untuk Prediksi Diabetes Pada Dataset Pima Indians: Menggunakan Pendekatan Exploratory Data Analysis,” JIPI (Jurnal Ilm. Penelit. dan Pembelajaran Inform., vol. 9, no. 3, pp. 1133–1144, 2024, doi: 10.29100/jipi.v9i3.4966.

S. García-méndez, F. De Arriba-pérez, and E. Costa-montenegro, “Special Issue on Advancements in Natural Language Processing , Semantic Networks , and Sentiment Analysis,” 2025.

A. Kurniasih and L. P. Manik, “On the Role of Text Preprocessing in BERT Embedding-based DNNs for Classifying Informal Texts,” Int. J. Adv. Comput. Sci. Appl., vol. 13, no. 6, pp. 927–934, 2022, doi: 10.14569/IJACSA.2022.01306109.

E. F. Fasttext, T. D. A. N. Indobert, P. Metode, and K. N. Untuk, “Eksplorasi fitur fasttext, tf-idf dan indobert pada metode k-nearest neighbor untuk klasifikasi sentimen 1,2,3,4,” vol. 7, no. 1, pp. 49–60.

M. H. Fiqri, R. Rudiman, and N. A. Verdikha, “Analisis Model Klasifikasi Sentimen Publik Terhadap Kebijakan Keberlanjutan IKN Menggunakan BERT Sebagai Feature Extractor dan K-Nearest Neighbor ( KNN ),” vol. 7, no. 2, pp. 1332–1342, 2025, doi: 10.47065/bits.v7i2.8168.

K. Hadi and E. Utami, “Analysis of K-NN with the Integration of Bag of Words , TF-IDF , and N-Grams for Hate Speech Classification on Twitter,” vol. 12, no. 2, pp. 289–298, 2024.

Downloads

Published

05/27/2026

How to Cite

Latuba, D., Budiman, & Winarti. (2026). Analisis Semantik Berbasis Konteks Menggunakan Model Hybrid Indobert–knn untuk Deteksi Komentar Cyberbullying Tiktok. Jurnal SINTA: Sistem Informasi Dan Teknologi Komputasi, 3(2), 106–113. https://doi.org/10.61124/sinta.v3i2.187