Category Archives: Data mining

Data Mining dengan pemrograman matlab

Jaringan Syaraf Tiruan untuk Memprediksi Jumlah Penduduk


Salah satu penerapan algoritma jaringan syaraf tiruan adalah untuk sistem prediksi (forecasting). Prediksi dapat dilakukan dalam bentuk urutan waktu (time series) atau dapat pula dilakukan dalam bentuk bukan urutan waktu.

Dalam sistem prediksi urutan waktu, data masukan adalah berupa beberapa data dalam kurun waktu tertentu, sedangkan data keluarannya adalah data pada kurun waktu berikutnya. Pada sistem prediksi ini data keluaran diasumsikan hanya dipengaruhi oleh data-data sebelumnya.

Contoh sistem prediksi urutan waktu:

sistem untuk memprediksi jumlah penduduk pada bulan tertentu di mana data masukannya adalah jumlah penduduk pada 12 bulan sebelumnya.

Untuk sistem prediksi bukan urutan waktu, data masukannya adalah berupa beberapa variabel data yang mempengaruhi nilai data keluaran, sedangkan data keluarannya adalah berupa data pada kurun waktu berikutnya. Pada sistem prediksi ini variabel-variabel yang mempengaruhi nilai data keluaran diikutsertakan untuk melakukan prediksi.

Contoh sistem prediksi bukan urutan waktu:

sistem untuk memprediksi jumlah penduduk pada bulan tertentu di mana data masukannya adalah jumlah penduduk pada 1 bulan sebelumnya, tingkat kesejahteraan penduduk, tingkat keamanan lingkungan, faktor politik, dan faktor-faktor demografi lainnya pada 1 bulan sebelumnya.

-read more->

Jaringan Syaraf Tiruan untuk Identifikasi Jenis Bunga


Jaringan syaraf tiruan (neural network) merupakan algoritma yang mampu melakukan identifikasi suatu kelas berdasarkan ciri masukan yang diberikan. Algoritma ini akan melatihkan ciri masukan yang diberikan pada masing-masing kelas sehingga diperoleh suatu arsitektur jaringan dan bobot-bobot awal yang mampu memetakan ciri masukan ke dalam kelas keluaran.

Terdapat banyak jenis jaringan syaraf tiruan, di antaranya adalah backpropagation, perceptron, probablistik neural network, radial basis network, dll.

Berikut ini merupakan contoh pemrograman matlab (menggunakan matlab r2015b) untuk mengidentifikasi jenis bunga menggunakan algoritma jaringan syaraf tiruan radial basis function (rbfnn). Pada proses pelatihan jaringan digunakan 100 citra latih yang terdiri dari 50 citra bunga dengan jenis kansas state flower dan 50 citra bunga berjenis marguerite daisy. Sedangkan pada proses pengujian digunakan 60 citra uji yang terdiri dari 30 citra bunga kansas state flower dan 50 citra bunga marguerite daisy.

Citra bunga yang digunakan dalam pemrograman ini diunduh dari halaman website http://www.robots.ox.ac.uk/~vgg/data/flowers/17/. Contoh citra bunga yang digunakan ditunjukkan pada gambar berikut.

-read more->

Pembuatan Database Mahasiswa menggunakan MATLAB


Berikut ini merupakan contoh pemrograman GUI Matlab R2015b untuk pembuatan database mahasiswa. Sistem yang dirancang meliputi Form Registrasi Mahasiswa, Form Status Mahasiswa, dan Form Database Mahasiswa. Data mahasiswa disimpan dalam bentuk tabel dengan ekstensi .mat.

Langkah-langkah registrasi dan visualisasi database mahasiswa adalah sebagai berikut:
1. Membuka tampilan menu awal
Pada menu ini terdapat beberapa tombol untuk menuju ke sub menu lain di antaranya adalah Form Registrasi, Form Status, Form Database, dan Sub menu keluar

-read more->

Pembuatan Database menggunakan Matlab dan Ms. Excel


Dalam pembuatan basis data (database), Matlab dapat diintegrasikan dengan beberapa software lain contohnya adalah Microsoft Office Excel 2007. Berikut ini merupakan contoh pemrograman matlab untuk membuat database mahasiswa menggunakan GUI Matlab R2015b.

Sistem basis data yang dirancang terdiri dari 4 buah tampilan GUI yaitu:
1. Tampilan menu Utama (Home)
Pada menu ini disajikan 4 buah tombol untuk masuk ke dalam tampilan submenu yang lain. Submenu yang lain antara lain yaitu Menu Registrasi Mahasiswa, Menu Status Mahasiswa, Menu Database Mahasiswa, dan Menu Keluar.

-read more->

Jaringan Syaraf Tiruan untuk Klasifikasi Citra Daun


Salah satu penerapan dari algoritma jaringan syaraf tiruan adalah untuk proses klasifikasi citra. Berikut ini merupakan pemrograman matlab untuk melakukan klasifikasi terhadap citra daun. Citra daun dikelompokkan ke dalam 4 kelas spesies yaitu Bougainvillea sp, Geranium sp, Magnolia soulangeana, dan Pinus sp. Pada contoh ini digunakan 40 citra daun yang terdiri dari 10 citra pada masing-masing kelas. Contoh dari citra daun yang digunakan ditunjukkan pada gambar di bawah ini:

Langkah-langkah pemrogramannya adalah sebagai berikut:
1. Mempersiapkan citra latih dan citra uji. Pada contoh ini 40 citra daun dibagi menjadi dua bagian yaitu 24 citra untuk citra latih dan 16 citra untuk citra uji.

-read more->

Jaringan Syaraf Tiruan Untuk Pengenalan Pola


Berikut ini merupakan contoh pemrograman matlab untuk mengklasifikasi bentuk suatu objek dalam citra digital menggunakan algoritma jaringan syaraf tiruan propagasi balik (backpropagation neural network).

Pada contoh ini dilakukan pengklasifikasian terhadap bentuk segi-3, segi-4, dan segi-5. Ciri yang digunakan untuk membedakan ketiga jenis bentuk tersebut adalah metric dan eccentricity.

Metric merupakan nilai perbandingan antara luas  dan keliling objek. Sedangkan eccentricity merupakan nilai perbandingan antara jarak foci ellips minor dengan foci ellips mayor suatu objek. (Materi mengenai ekstraksi ciri lebih lanjut dapat dilihat pada laman berikut ini: Ekstraksi Ciri Citra).

Langkah-langkah pemrograman matlab untuk mengklasifikasi bentuk suatu objek dalam citra digital menggunakan matlab adalah sebagai berikut:
1. Menyiapkan data latih untuk proses pelatihan (training). Pada proses ini digunakan 45 citra data latih yang terdiri dari 15 citra segi-3, 15 citra segi-4, dan 15 citra segi-5.

-read more->

Jaringan Syaraf Tiruan untuk Prediksi menggunakan Matlab


Jaringan syaraf tiruan merupakan algoritma klasifikasi yang meniru prinsip kerja dari jaringan syaraf manusia. Algoritma ini memetakan data masukan pada layer masukan menuju target pada layer keluaran melalui neuron-neuron pada layer tersembunyi.

Data masukan dirambatkan maju, dihubungkan oleh bobot-bobot masukan yang sebelumnya telah diinisialisasi secara acak menuju neuron pada layer tersembunyi

Pada layer tersembunyi, data masukan yang telah dihubungkan dengan bobot tersebut kemudian diproses menggunakan fungsi aktivasi. Selanjutnya data hasil olahan dari layer tersembunyi dihubungkan oleh bobot-bobot tersembunyi menuju neuron pada layer keluaran.

Hasil yang diperoleh kemudian dibandingkan dengan data target sehingga diperoleh tingkat kesalahan (error). Apabila tingkat kesalahan yang diperoleh lebih kecil daripada tingkat kesalahan yang sebelumnya telah ditetapkan (target error), maka proses perambatan akan berhenti. Namun apabila tingkat kesalahan masih lebih besar daripada tingkat kesalahan tetapan maka dilakukan proses perambatan balik dengan melakukan pembaharuan bobot.

Salah satu aplikasi dari algoritma jaringan syaraf tiruan adalah untuk kasus prediksi.

Berikut ini merupakan contoh pemrograman matlab untuk memprediksi curah hujan menggunakan algoritma jaringan syaraf tiruan propagasi balik (backpropagation neural network).

Langkah-langkahnya yaitu:

1. Mempersiapkan data curah hujan time series untuk prediksi. Pada contoh ini digunakan data rata-rata curah hujan tiap bulan di kota Semarang pada tahun 2005 s.d 2007. Pada algoritma jaringan syaraf tiruan propagasi balik ini digunakan fungsi aktivasi sigmoid biner di mana fungsi ini bernilai antara 0 s.d 1. Namun fungsi sigmoid biner tersebut sejatinya tidak pernah mencapai angka 0 maupun 1. Oleh sebab itu, data curah hujan perlu dinormalisasi terlebih dahulu salah satu contohnya ke dalam range 0,1 s.d 0,9 menggunakan persamaan berikut ini:


di mana:
X’ = data hasil normalisasi
X = data asli/data awal
a = nilai maksimum data asli
b = nilai minimum data asli

Data curah hujan asli dan setelah dinormalisasi tampak pada gambar di bawah ini:

-read more->

Pengolahan Citra Digital untuk Mendeteksi Warna dan Bentuk Obyek


Berikut ini merupakan pemrograman GUI Matlab untuk mendeteksi warna dan bentuk suatu obyek pada citra digital.

Proses deteksi warna diawali dengan mengkonversi ruang warna citra RGB (Red, Green, Blue) menjadi HSV (Hue, Saturation, Value). Selanjutnya proses klasifikasi warna dilakukan berdasarkan pengelompokan nilai Hue.

Sedangkan proses deteksi bentuk diawali dengan mengkonversi ruang warna citra RGB menjadi grayscale. Setelah itu dilakukan thresholding sehingga diperoleh citra biner. Kemudian dilakukan ekstraksi ciri morfologi dari citra biner berdasarkan parameter eccentricity dan metric. Proses klasifikasi citra dilakukan berbasis aturan (rule based) sederhana.

1. Membuka tampilan GUI awal

-read more->

Algoritma k-means clustering dan Naive Bayes classifier untuk Pengenalan Pola Tesktur


K-means Clustering merupakan salah satu metode data clustering non hirarki yang berusaha mempartisi data yang ada ke dalam satu atau lebih cluster/kelompok. Metode ini mempartisi data ke dalam cluster/kelompok sehingga data yang memiliki karakteristik yang sama dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai karakteristik yang berbeda dikelompokkan ke dalam kelompok yang lain.

Sedangkan Naive Bayes Classifier merupakan salah satu metode machine learning yang memanfaatkan perhitungan probabilitas dan statistik. Metode ini dikemukakan oleh ilmuwan Inggris yaitu Thomas Bayes untuk memprediksi probabilitas di masa depan berdasarkan pengalaman di masa sebelumnya.

Berikut ini merupakan pemrograman matlab (menggunakan Matlab R2015b) mengenai pola tekstur citra menggunakan algoritma k means clustering dan naive bayes classifier. Citra yang digunakan adalah citra tekstur Brodatz sejumlah 112 buah seperti tampak pada gambar di bawah ini:

-read more->

k-means clustering menggunakan matlab


Data clustering merupakan salah satu metode data mining yang bersifat tanpa arahan (unsupervised).

Ada dua jenis data clustering yang sering digunakan dalam proses pengelompokan data yaitu hierarchical (hirarki) data clustering dan non-hierarchical (non hirarki) data clustering.

K-means merupakan salah satu metode data clustering non hirarki yang berusaha mempartisi data yang ada ke dalam satu atau lebih cluster/kelompok.

Metode ini mempartisi data ke dalam cluster/kelompok sehingga data yang memiliki karakteristik yang sama dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai karakteristik yang berbeda dikelompokkan ke dalam kelompok yang lain.

Ilustrasi algoritma k-means ditunjukkan pada gambar di bawah ini:


-read more->

%d bloggers like this: