ANALISIS KLASIFIKASI BENCANA BANJIR BERDASARKAN CURAH HUJAN MENGGUNAKAN ALGORITMA NAÏVE BAYES

Penulis

  • Slamet Triyanto AMIKOM Yogyakarta
  • Andi Sunyoto Universitas Amikom Yogyakarta
  • M Rudyanto Arief Universitas Amikom Yogyakarta

DOI:

https://doi.org/10.35145/joisie.v5i2.1785

Kata Kunci:

banjir, curah hujan, naïve bayes, datasets, datasets preprocessing, library scikit-learn, rapidminer, akurasi

Abstrak

Penelitian data mining dalam berbagai aspek termasuk dalam bencana, khususnya bencana banjir terus dilakukan. Dengan adanya jumlah curah hujan dan dengan hanya terdapat 2 (dua) kelas dalam bencana banjir yakni Banjir dan Tidak Banjir, maka Naïve Bayes sangat memungkinkan untuk digunakan sebagai algoritma dalam  melakukan perhitungan probability. Dengan akurasi yang baik, maka algoritma Naïve Bayes dalam peneltian ini sangat layak disandingkan dengan berbagai algoritma lainnya khususnya untuk melakukan klasifikasi dengan 2 (dua) kelas. Selain pemilihan algoritma yang tepat, penggunaan dataset yang tepat untuk dilakukan pengujian menjadikan proses mining data dapat memberikan informasi yang tepat. Pengujian menggunakan dataset yang telah diuji dengan algoritma lain sebelumnya, dijadikan pembanding sehingga diketahui dengan pola dan ciri khas dataset diperoleh informasi algoritma data mining yang tepat. Dengan demikian, peningkatan keilmuan khususnya dalam data mining  dapat terus berkembang.  Meskipun tidak dapat dipungkiri dataset yang tersedia perlu untuk dilakukan preprocessing data. Tahap preprocessing data ini dilakukan untuk mendapat dataset yang baik. Kemudian data melwati tahap pembagian/splitting, barulah data diolah menggunakan algoritma naïve bayes. Dalam pengujian menggunakan library dari Scikit-Learn ini ternyata Naïve mampu memberikan akurasi sebesar 79.16%. Berbeda dengan pengujian selanjutnya, Naïve Bayes diterapkan pada RapidMiner sebagai pembanding. Keluaran dari RapidMiner cukup mengejutkan karena akurasi mencapai 98,31%.

Unduhan

Data unduhan belum tersedia.

Referensi

Arjun Singh, & Saxena, A. (2016). A Hybrid Data Model for Prediction of Disaster using Data Mining Approaches. International Journal of Engineering Trends and Technology (IJETT), 384–392.
Azure, M. (2021, November 4). Machine Learning Algorithm Cheat Sheet for Azure Machine Learning designer. https://docs.microsoft.com/enus/azure/machine-learning/algorithm-cheat-sheet
Bustami. (2013). Penerapan Algoritma Naive Bayes Untuk Mengklasifikasi Data Nasabah Asuransi. TECHSI : Jurnal Penelitian Teknik Informatika, 3, 127–146.
Dwiasnati, D., & Devianto, Y. (2021). Optimasi Prediksi Bencana Banjir menggunakan Algoritma SVM untuk penentuan Daerah Rawan Bencana Banjir. Prosiding Seminar Nasional Sistem Informasi Dan Teknologi (SISFOTEK), 5, 202–207.
Han, j, & Kamber, M. (2001). Data Mining: Concepts and Techniques. Morgan Kaufmann Publishers.
https://scikit-learn.org/. (n.d.). Naive Bayes. Retrieved November 20, 2021, from https://scikit-learn.org/stable/modules/naive_bayes.html
Kotu, V., & Deshpande, B. (2014). Predictive Analytics and Data Mining Concepts and Practice with RapidMiner. Morgan Kaufmann is an imprint of Elsevier.
Mukul. (2020). Flood Prediction Model. https://www.kaggle.com/mukulthakur177/flood-prediction-model/
Naik, S., Verma, A., Ashok Patil, S., & Hingmire, A. (2021). Flood Prediction using Logistic Regression for Kerala State. International Journal of Engineering Research & Technology, 36–38.
Netscher, S., & Eder, C. (2018). Variable Definition and Composition of the Dataset. In: Data Processing and Documentation: Generating High Quality Research Data in Quantitative Social Science Research. GESIS Papers, 15–24.
Nugroho, S. P. (2002). Evaluasi Dan Analisis Curah Hujan Sebagai Faktor Penyebab Bencana Banjir Jakarta. Urnal Sains & Teknologi Modifikasi Cuaca, 3, 91–97.
Ordoñez, A. J., Paje, R. E. J., & Naz, R. N. (2018). SMS Classification Method for Disaster Response using Naïve Bayes Algorithm. 2018 International Symposium on Computer, Consumer and Control (IS3C), 233–236. https://doi.org/10.1109/IS3C.2018.00066
Panafrican Emergency Training Centre. (2002). Disasters & Emergencies Definitions.https://apps.who.int/disasters/repo/7656.pdf
Parsons, VanL. (2014). Stratified Sampling. WileyStatsRef:StatisticsReferenceOnline,111.https://doi.org/10.1002/9781118445112
Prihandoko, Bertalya, & Ramadhan, M. I. (2017). An Analysis of Natural Disaster Data by Using K-Means and K- Medoids Algorithm of Data Mining Techniques. 2017 15th International Conference on Quality in Research (QiR) : International Symposium on Electrical and Computer Engineering, 221-225.https://doi.org/10.1109/QIR.2017.8168485
Refonaa, j, Lakshmi, M., & Vivek, v. (2015). Analysis and Prediction Of natural Disaster Using Spatial Data Mining Technique. 2015 International Conference on Circuit, Power and Computing Technologies [ICCPCT], 16.https://doi.org/10.1109/ICCPCT.2015.7159379
Rumini, & Norhikmah. (2019). Prediksi Kegagalan Siswa Dalam Data Mining Dengan Menggunakan Metode Naïve Bayes. Jurnal Mantik Penusa, 3, 42–46.
Salvador, G. ıa, Julián, L., & Francisco, H. (2016). Tutorial on Practical Tips of the Most Influential Data Preprocessing Algorithms in Data Mining. Knowledge-Based Systems, 98, 1–29.
Sesa, W., shalih, O., Syauqi, W.Adi, A., Z.Shabrina, F., Rizqi, A., Widiastomo, Y., S.Putra, A., Karimah, R., Eveline, F., Alfian, A., Hafiz, A., BAgaskoro, Y., Nomita Dewi, A., & Rahmawati, I. (2020). Index Risiko Bencana Indonesia Tahun 2020. Badan Nasional PenanggulanganBencana.https://inarisk.bnpb.go.id/pdf/BUKU%20IRBI%202020%20KP.pdf
Yin, H., & Gai, K. (2015). An Empirical Study on Preprocessing High-dimensional Class-imbalanced Data for Classification. IEEE 17th International Conference on High Performance Computing and Communications (HPCC),1419.https://doi.org/10.1109/HPCC-CSS-ICESS.2015.205
Zhang, H. (2004). The Optimality of Naive Bayes. Proceedings of 17th International Florida Artificial Intelligence Research Society Conference, 562–567.

Unduhan

Diterbitkan

2021-12-30

Terbitan

Bagian

Articles