Algoritma
C4.5 merupakan algoritma yang digunakan untuk melakukan pembentukan pohon keputusan. Pohon keputusan tersebut
mampu menghasilkan keputusan kompleks menjadi lebih sederhana.
Secara umum
algoritma C4.5 untuk membangun pohon
keputusan adalah sebagai berikut.
a.
Pilih
atribut sebagai akar.
b.
Buat
cabang untuk tiap-tiap nilai.
c.
Bagi
kasus dalam cabang.
d.
Ulangi
proses untuk setiap cabang sampai semua kasus pada cabang memiliki kelas yang
sama.
Untuk memilih atribut sebagai akar, didasarkan
pada nilai gain tertinggi dari
atribut-atribut yang ada. Untuk menghitung gain digunakan rumus .
Setelah mendapatkan nilai gain, ada satu hal lagi yang perlu dilakukan perhitungan yaitu mencari nilai Entropy. Entropy digunakan untuk menentukan seberapa informative sebuah input atribut untuk menghasilkan output atribut.