Analisis Komparatif Jaccard dan Cosine Similarity Untuk Pencarian Ayat Alkitab
DOI:
https://doi.org/10.61124/sinta.v2i4.102Keywords:
cosine similarity, jaccard similarity, K-Means, pencarian ayat AlkitabAbstract
Pencarian ayat Alkitab yang relevan berdasarkan tema perasaan merupakan tantangan signifikan bagi pengguna, disebabkan oleh banyaknya jumlah ayat dan variasi bahasa yang kompleks. Sistem pencarian konvensional seringkali tidak mampu menangkap nuansa emosional yang diinginkan pengguna. Penelitian ini bertujuan untuk merancang, mengimplementasikan, dan membandingkan performa sistem temu kembali informasi ayat Alkitab menggunakan metode Jaccard Similarity dan Cosine Similarity. Data yang digunakan terdiri dari 31.102 ayat Alkitab dari website SABDA yang melalui tahap preprocessing teks. Metode Cosine Similarity memanfaatkan pembobotan TF-IDF, sedangkan Jaccard Similarity berbasis himpunan kata. Hasil pencarian kemudian dikelompokkan menggunakan algoritma K-Means Clustering untuk memisahkan hasil relevan dan kurang relevan. Evaluasi dilakukan menggunakan metrik Precision, Recall, dan F1-Score untuk metode similaritas, serta Davies-Bouldin Index (DBI) untuk kualitas clustering. Hasil penelitian menunjukkan bahwa Cosine Similarity secara konsisten mengungguli Jaccard Similarity, dengan nilai macro average F1-Score sebesar 0,46 berbanding 0,34. Kualitas clustering pada Cosine Similarity juga lebih superior dengan skor DBI 0,252. Penelitian ini menyimpulkan bahwa Cosine Similarity merupakan metode yang lebih efektif untuk pencarian ayat Alkitab berbasis sentimen.
References
Muhammad Khalid, “Contributions of Dr. Ibrahim Muhammad Ibrahim to the Development of Arabic and Urdu Literature: A Study of His Life and Works,” Al-Qamar, vol. 7, pp. 1–14, Jun. 2024.
A. Angdresey, M. A. Lamongi, and R. Munir, “Information Retrieval System in the Bible,” Cogito Smart Journal |, vol. 7, no. 1, 2021.
Abhishek Anand, “Information Retrieval in Computing Model,” International Conference on Intelligent Computing and Control Systems (ICCS), vol. 10, Apr. 2020.
O. Nurdiana and D. Nursantika, “PERBANDINGAN METODE COSINE SIMILARITY DENGAN METODE JACCARD SIMILARITY PADA APLIKASI PENCARIAN TERJEMAH AL-QUR’AN DALAM BAHASA INDONESIA,” no. 1, 2016.
N. Aini Rakhmawati, A. Adi Firmansyah, P. Maulidya Effendi, R. Abdillah, and T. Agung Cahyono, “Auto Halal Detection Products Based on Euclidian Distance and Cosine Similarity,” vol. 8, pp. 4–6, 2018, [Online]. Available: http://halal.addi.is.its.ac.id;
T. P. Rinjeni, A. Indriawan, and N. A. Rakhmawati, “Matching Scientific Article Titles using Cosine Similarity and Jaccard Similarity Algorithm,” in Procedia Computer Science, Elsevier B.V., 2024, pp. 553–560. doi: 10.1016/j.procs.2024.03.039.
C. Hadi, dan Muhammad Rifqi Ma, P. A. Studi Teknik Informatika STMIK Jenderal Yani Yogyakarta, and P. A. Studi Sistem Informasi STMIK Jenderal Yani Yogyakarta, “IMPLEMENTASI COSINE SIMILARITY DALAM APLIKASI PENCARIAN AYAT AL-QUR’AN BERBASIS ANDROID AN IMPLEMENTATION OF COSINE SIMILARITY FOR ANDROID BASED QURAN VERSE SEARCHING APPLICATION.”
M. Wisaksono and E. Pujiyanto, “Pengembangan Sistem Berbasis Pengetahuan untuk Pengendalian Kualitas pada Proses Frontune Produk Infrared (Studi Kasus pada PT Perkin Elmer Optoelektronics Batam),” 2003.
“STUDI PERBANDINGAN METODE EKSTRAKSI FITUR UNTUK TOPIC MODELING BERBASIS ASPEK DAN SENTIMEN ANALISIS PADA ULASAN PRODUK E-COMMERCE THESIS Oleh: FAHRENDRA KHOIRUL IHTADA NIM. 230605210033 PROGRAM STUDI MAGISTER INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS ISLAM NEGERI MAULANA MALIK IBRAHIM MALANG 2025.”
S. Qaiser and R. Ali, “Text Mining: Use of TF-IDF to Examine the Relevance of Words to Documents,” Int J Comput Appl, vol. 181, no. 1, pp. 25–29, Jul. 2018, doi: 10.5120/ijca2018917395.
D. Iskandar and A. Kurniawati, “Analisis Perbandingan Teknik Word2vec dan Doc2vec dalam Mengukur Kemiripan Dokumen Menggunakan Cosine Similarity,” Jurnal Teknologi Informasi dan Ilmu Komputer, vol. 12, no. 1, pp. 133–144, Feb. 2025, doi: 10.25126/jtiik.2025129143.
Dewa Ayu Rai Ariantini dkk, “PENGUKURAN KEMIRIPAN DOKUMEN TEKS BAHASA INDONESIA MENGGUNAKAN METODE COSINE SIMILARITY,” E-Journal Teknik Informatika, vol. 9, pp. 1–8, Sep. 2019.
I. A. Nur Afifah and H. Nurdiyanto, “DATA MINING CLUSTERING DALAM PENGELOMPOKAN BUKU PERPUSTAKAAN MENGUNAKAN ALGORITMA K-MEANS,” JIPI (Jurnal Ilmiah Penelitian dan Pembelajaran Informatika), vol. 8, no. 3, pp. 802–814, Aug. 2023, doi: 10.29100/jipi.v8i3.3891.
A. Sulistiyawati and E. Supriyanto, “Implementasi Algoritma K-means Clustring dalam Penetuan Siswa Kelas Unggulan,” vol. 15, no. 2.
R. Gesit Prasasti Alam and Y. Everhard, “Optimasi K-Means Dengan Particle Swarm Optimization Dalam Penentuan Titik Awal Pusat Klaster Data Telekomunikasi K-Means Optimization with Particle Swarm Optimization In Determining The Starting Point Of Cluster Centers of Telecommunication Data.”
I. Muslim et al., “Implementasi Text Summarization Pada Review Aplikasi Digital Library System Menggunakan Metode Maximum Marginal Relevance,” 2024.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2025 Yusuf Imanuel, Stanislaus J. Pinastika, Harry Soepandi, Katarina Lebai

This work is licensed under a Creative Commons Attribution 4.0 International License.





