PENGELOMPOKKAN DAN KLASIFIKASI PENGGUNAAN KONTRASEPSI DI INDONESIA
Keywords: binary logistic regression, CART, contraception, kontrasepsi, regresi logistik biner, SVM
Abstract
The use of contraception is crucial, given the growth rate can decrease. The election to use or not to use contraceptives is one of the problems of classification. Classification problem can be solved by methods of binary Logistic Regression, Support Vector Machine (SVM), and CART (Classification and Regression Trees). However, due to the variable response will be made binary then the done method of grouping in advance with its own assumptions, the k-means cluster and cluster the kernel k-means. In this study data about the use of classification taken contraceptives that were affected by the 9 free variables. Such data is data the secondary National Contraceptive Prevalence Survey results Indonesia in 1987. The number of respondennya is 1.473 people. The end results were obtained grouping the results turned out to be assuming themselves better than other methods. While on the method of classification SVM classification that results obtained are better than the other two methods. However, if the method of grouping and classification are merged, acquired that classification with SVM where the variable response is obtained based on the k-means cluster groupings or clusters of the kernel k-means can make Apperant Error Rate (APER) the least.
Penggunaan kontrasepsi merupakan hal yang penting, mengingat dapat menurunkan laju pertumbuhan. Pemilihan menggunakan atau tidak menggunakan alat kontrasepsi merupakan salah satu permasalahan klasifikasi. Permasalahan klasifikasi dapat diselesaikan salah satunya dengan metode Regresi logistik biner, Support Vector Machine (SVM), dan CART (Classification and Regression Trees). Namun dikarenakan variabel respon akan dijadikan biner maka dilakukan metode pengelompokan terlebih dahulu dengan asumsi sendiri, cluster k-means dan cluster kernel k-means.Dalam penelitian ini diambil data mengenai klasifikasi penggunaan kontrasepsi yang dipengaruhi oleh 9 variabel bebas. Data tersebut adalah data sekunder hasil Survey Prevalensi Kontrasepsi Nasional Indonesia tahun 1987. Jumlah respondennya adalah 1.473 orang. Hasil akhir yang diperoleh ternyata hasil pengelompokan dengan asumsi sendiri lebih baik dibandingkan metode yang lain. Sedangkan pada metode pengklasifikasian diperoleh bahwa hasil klasifikasi SVM lebih baik dibanding dua metode yang lain. Namun apabila metode pengelompokan dan klasifikasi digabung, diperoleh bahwa pengklasifikasian dengan SVM dimana variabel respon diperoleh berdasarkan hasil pengelompokan cluster k-means atau cluster kernel k-means dapat menghasilkan Apperant Error Rate (APER) yang paling kecil.
Downloads
References
Epa Suryanto & Santi Wulan Purnami. (2015). Perbandingan reduced support vector machine dan smooth support vector machine untuk klasifikasi large data. Jurnal sains dan seni ITS, vol. 4, No.1, (2015)
Gunn S. R. (1998). Support vector machines for classification and regression. Technical Report. University of Southampton.
Johnson, R.A., & Winchern, D.W. (2007). Applied multivariate statistical analysis. USA: Pearson education international.
Lim, T.S. (1997). Contraceptive method choice. Diakses pada tanggal 6 April 2012 dari website http://archive.ics.uci.edu.
Nancy, JA. (1999). Contraception: Present and future. Medical journal of Indonesia, vol. 8(1).
Santosa, B. (2007). Data Mining: Teknik pemanfaatan data untuk keperluan bisnis. Yogyakarta: Graha Ilmu.
Sobirin. (2006). Mengenal lebih dalam aneka alat kontrasepsi. Diakses pada tanggal 6 April 2012 dari website http://www.kafka.web.id/forum/kesehatan1.