Analisa Perbandingan 7 Algoritma Klasifikasi Menggunakan Dataset Sensus Penduduk

  • Tri Santosa Wijanarko Program Studi Bisnis Digital, Sekolah Tinggi Ilmu Ekonomi (STIE) Widya Manggala Semarang
Keywords: Algoritma Klasifikasi, Rapidminer, Dataset Adult, Decision Stump, Decision Tree, Naive Bayes, k-Nearest Neighbor, Random Forest, Rule Based

Abstract

Dalam penelitian ini penulis mencoba melakukan komparasi dari tujuh algoritma klasifikasi dengan mengambil dataset kependudukan dari data yang sudah dipublikasikan. Tujuan dari penelitian ini adalah mengetahui perbandingan performa teknik klasifikasi menggunakan software Rapidminer. Dalam pengujian menggunakan dataset adult yang memiliki 35.500 instance meliputi 15 attribut (6 continous 6 nominal). Dataset adult berisi data mengenai orang dewasa seperti umur, jenis kelamin, etnis, status, edukasi, dan lain-lain. Data-data pada dataset adult diklasifikasikan berdasar gaji yang melebihi Rp. 50.000 dan gaji yang sama dengan atau kurang dari Rp. 50.000. Peneliti mencoba melakukan komparasi dari tujuh algoritma klasifikasi untuk mendapatkan akurasi dari masing-masing algoritma tersebut. Algoritma yang digunakan adalah Decision Tree (C4.5), Decision Stump, Random Tree, Random Forest, Naive Bayes, k-Nearest Neighbor, dan Rule Based. Untuk metode validasi penulis menggunakan k-Fold Cross Validation sedang untuk mengetahui akurasi algoritma antara satu dengan yang lain penulis menggunakan uji beda parametik dengan menggunakan t-test.

References

M. F. bin Othman and T. M. S. Yau, “Comparison of Different Classification Techniques using WEKA for Breast Cancer,” FMBE Proc., vol. 15, pp. 520–523, 2007.
R. S. Wahono, N. S. Herman, and S. Ahmad, “A Comparison Framework of Classification Models for Software Defect Prediction,” vol. 20, no. 10, pp. 1945–1950, 2014, doi: 10.1166/asl.2014.5640.
I. H. Witten, E. Frank, and M. A. Hall, Data Mining “Practical Machine Learning Tools and Techniques,” Third Edit. Burlington: Morgan Kaufmann Publishers, 2011.
I. H. Witten, E. Frank, and M. A. Hall, Data Mining Third Edition. Elsevier Inc., 2011.
R. Kohavi and R. Quinlan, “Decision Tree Discovery,” 1999.
F. Akthar and C. Hahne, Rapidminer 5 “Operator Reference.” 2012.
L. Breiman, “Random Forests,” Mach. Learn., vol. 45, pp. 5–32, 2001.
L. Torgo, Data Mining with R: Learning with Case Studies. English: Chapman and Hall, 2010.
D. Farid, L. Zhang, C. Mofizur, M. A. Hossain, and R. Strachan, “Expert Systems with Applications Hybrid Decision Tree and Naive Bayes Classifiers for Multiclass Classification Tasks,” Expert Syst. Appl., vol. 41, no. 4, pp. 1937–1946, 2014, doi: 10.1016/j.eswa.2013.08.089.
H. Crc and M. Hofmann, RapidMiner: Data Mining use Cases and Business Analytics Applications. CRC Press, 2014.
Published
2022-12-30
How to Cite
Wijanarko, T. S. (2022). Analisa Perbandingan 7 Algoritma Klasifikasi Menggunakan Dataset Sensus Penduduk. Jurnal Cakrawala Informasi, 2(2), 15-25. https://doi.org/10.54066/jci.v2i2.238