Pohon Keputusan



Pohon Keputusan
adalah pohon yang digunakan sebagai prosedur penalaran untuk mendapatkan jawaban dari masalah yang dimasukkan. Pohon yang dibentuk tidak selalu berupa pohon biner. Jika semua fitur dalam data set menggunakan 2 macam nilai kategorikal maka bentuk pohon yang didapatkan berupa pohon biner. Jika dalam fitur berisi lebih dari 2 macam nilai kategorikal atau menggunakan tipe numerik maka bentuk pohon yang didapatkan biasanya tidak berupa pohon biner.

Kefleksibelan membuat metode ini atraktif, khususnya karena memberikan keuntungan berupa visualisasi saran (dalam bentuk pohon keputusan) yang membuat prosedur prediksinya dapat diamati (Gorunescu, 2011). Contoh pohon keputusan ditunjukkan pada Gambar 2.6.

Karakteristik dari pohon keputusan seperti pada Gambar 2.6 dibentuk sejumlah elemen sebagai berikut (Tan dkk, 2006):

  • Node akar, tidak mempunyai lengan masukan dan mempunyai nol atau lebih lengan keluaran.
  • Node internal, setiap node yang bukan daun (nonterminal) yang mempunyai tepat satu lengan masukan dan dua atau lebih lengan keluaran. Node ini menyatakan pengujian yang didasarkan pada nilai fitur.
  • Lengan, setiap cabang menyatakan nilai hasil pengujian di node bukan daun.
  • Node daun (terminal), node yang mempunyai tepat satu lengan masukan dan tidak mempunyai lengan keluaran. Node ini menyatakan label kelas (keputusan).

Pohon keputusan mempunyai tiga pendekatan klasik yaitu:

  1. Pohon klasifikasi, digunakan untuk melakukan prediksi ketika ada data baru yang belum diketahui label kelasnya. Pendekatan ini yang paling banyak digunakan.
  2. Pohon regresi, ketika hasil prediksi dianggap sebagai nilai nyata yang mungkin akan didapatkan.
  3. CART (atau C&RT), ketika masalah klasifikasi dan regresi digunakan bersama-sama.

Pohon keputusan yang diinduksi tidak selalu sama pada beberapa percobaan karena urutan atau cara pemilihan fitur sebagai pemecah cabang. Ada banyak pilihan algoritma untuk menginduksi pohon keputusan seperti Hunt, CART (C&RT), ID3, C4.5, SLIQ, SPRINT, QUEST, DTREG, THAID, CHAID, dan sebagainya.

Materi mengenai aplikasi algoritma pohon keputusan (decision tree) untuk mengidentifikasi fase perkembangan plasmodium falciparum dalam sel darah merah yang terinfeksi malaria dapat dilihat pada laman berikut ini: link

  1. mas, kalau untuk 6 kelas lebih mengunakan metode klasifikasi apaa yaa mas?
    terima kasih mas

  2. mas, ada tutorial / source code pelatihan dan pengujian menggunakan metode klasifikasi random forest tidak?
    terima kasih

  3. mas, saya sudah melihat halaman tersebut. source code random forest tidak ada. tetapi saya menggunakan glcm yang ada pada halaman tersebut untuk ekstraksi fitur saya. penelitian saya tentang klasifikasi melanoma dan non melanoma menggunakan metode random forest.
    Ada tidak referensi dari mas mengenai pengujian dan pelatihan random forest untuk penelitian saya?
    terimah kasih mas

  4. mas apakah ada contoh kasus yang penyelesaian ny menggunakan algoritma C4.5 Pohon keputusan selain yang di atas

  5. williamputra396@gmail.com

    mas apakah ada contoh untuk program decision tree C45 ?

Leave a comment