Analisis Klasifikasi Email Spam Menggunakan Algoritma Naïve Bayes

Rahman, Azan (2025) Analisis Klasifikasi Email Spam Menggunakan Algoritma Naïve Bayes. Skripsi thesis, Prodi Teknik Informatika.

[img] Text
cover.pdf - Submitted Version

Download (1MB)
[img] Text
bab I.pdf - Submitted Version

Download (1MB)
[img] Text
bab II.pdf - Submitted Version

Download (4MB)
[img] Text
bab III.pdf - Submitted Version

Download (2MB)
[img] Text
bab IV.pdf - Submitted Version
Restricted to Registered users only

Download (3MB) | Request a copy
[img] Text
bab V.pdf - Submitted Version

Download (321kB)
[img] Text
daftar pustaka.pdf - Submitted Version

Download (812kB)
[img] Text
lampiran.pdf - Submitted Version
Restricted to Registered users only

Download (1MB) | Request a copy

Abstract

Perkembangan teknologi informasi dan komunikasi telah membawa perubahan signifikan dalam cara manusia berkomunikasi, termasuk dalam penggunaan surat elektronik (email). Namun, meningkatnya penggunaan email juga diikuti oleh maraknya penyebaran email spam, yang dapat mengganggu pengguna dan menimbulkan risiko keamanan. Penelitian ini bertujuan untuk menganalisis klasifikasi email spam dengan menerapkan algoritma Naïve Bayes. Proses penelitian diawali dengan tahap preprocessing data guna meningkatkan kualitas teks sebelum dilakukan klasifikasi dimulai dari tokenisasi, lemmatisasi, penghapusan kata tidak penting (stopword), serta konversi teks menggunakan Term Frequency-Inverse Document Frequency (TF-IDF) agar dapat direpresentasikan dalam bentuk numerik. Selanjutnya, algoritma Naïve Bayes digunakan untuk mengklasifikasikan email ke dalam kategori spam atau non-spam. Kinerja model dianalisis menggunakan confusion matrix serta sejumlah metrik evaluasi, termasuk akurasi, presisi, recall, dan F1-score. Hasil eksperimen menunjukkan bahwa model awal memperoleh akurasi sebesar 88%, namun memiliki nilai False Negative yang cukup tinggi akibat ketidakseimbangan kelas pada dataset, di mana jumlah email non-spam lebih banyak dibandingkan email spam. Untuk mengatasi permasalahan ini, diterapkan teknik penyeimbangan kelas menggunakan Synthetic Minority Over-sampling Technique (SMOTE). Setelah penerapan teknik ini, model mengalami peningkatan performa dengan akurasi mencapai 98% serta penurunan signifikan pada nilai False Negative. Hasil penelitian ini menunjukkan bahwa algoritma Naïve Bayes memiliki kinerja yang baik dalam mengklasifikasikan email spam setelah dilakukan penyesuaian terhadap ketidakseimbangan data.

Item Type: Thesis (Skripsi)
Uncontrolled Keywords: Naïve Bayes, klasifikasi spam, email, preprocessing, evaluasi model : Naïve Bayes, spam classification, email, preprocessing, model evaluation
Subjects: 000 Karya Umum > 000-009 Ilmu Umum dan Komputer > 006.3 Kecerdasan Buatan
Divisions: Fakultas Teknik dan Komputer > Teknik Informatika
Depositing User: Susila Novmbrita
Date Deposited: 12 Jun 2025 03:13
Last Modified: 12 Jun 2025 03:13
URI: http://repository.upbatam.ac.id/id/eprint/6719

Actions (login required)

View Item View Item

Downloads

Downloads per month over past year