Halo temen-temen, apa kabar setelah libur panjang ini? Bagi
yang masih kuliah di STMKG ya hehe. Baiklah, yuk langsung bahas sekuel bahasan
jaringan saraf tiruan keenam, yaitu tentang parzen window. Metode
parzen window dikenal juga sebagai metode Parzen-Rosenblatt
window digunakan secara luas dalam pendekatan nonparametric untuk
mengestimasi/memperkirakan nilai fungsi densitas peluang (pdf, probability density function, p(x) untuk titik spesifik x dari sampel titik xn.
Well, secara sederhana, parzen didefinisikan sebagai modifikasi
persamaan peluang dengan menganggap setiap data adalah sebuah himpunan data. Definisi lain menjelaskan bahwa parzen
merupakan rata-rata dari total jumlah parzen dari masing-masing rerata (mu, µ) setiap data dengan sigma (σ) diatur konstan. Sementara, pada pdf normal (Gaussian/fungsi kernel),
seluruh data digambarkan sebagai satu himpunan dalam kurva distribusi normal. Masih
bingung? Baik, jika sebelumnya kita tahu pdf digambarkan dalam grafik
distribusi normal misal sebagai berikut:
Kita tahu distribusi normal fungsi kernel diatas dibentuk dari nilai µ 25.8 untuk satu himpunan data suhu. Sementara
itu, pada konsep parzen window, setiap elemen nilai yang menyusun himpunan data
suhu masing-masing dibuat fungsi kernel-nya (pdf) dengan menjadikan nilai elemen tersebut sebagai nilai
rata-rata (µ) untuk membentuk “pdf-pdf yang banyak (sebanyak jumlah data)”.
Selanjutnya setiap fungsi kernel yang tumpang tindih tersebut (lihat gambar 2)
akan dihitung nilai rata-rata “barunya” untuk menggambarkan parzen window yang juga merupakan rata-rata
densitas data. Sehingga nilai peluang (pn(x))
yang dihasilkan akan “lebih teliti” dibandingkan jika kita mencari nilai
peluang berdasarkan Gaussian kernel pada kurva distribusi normal.
Secara matematis, peluang
kelas bersyarat (the class-conditional
probability, P(Xnew|Ci), dengan menggunakan parzen (Zeinali
dan Story, 2017) dihitung dengan menggunakan:
dimana:
Xnew : nilai input baru
Ci : cardinality dari himpunan bagian Ci
ωi,j : Gaussian kernel dari Xci,j (multivariate normal, nonsingular)
d : dimensi data, misal
data memiliki 3 variabel prediktor maka d=3
σ : parameter sebaran (spread parameter)
yang diatur konstan dan ditentukan berdasarkan eksperimen dengan nilai antara 0
dan 1.
||Xnew
– Xci,j|| :
Jarak Euclidian, perhitungan nilai ini sangat penting dalam pembobotan parzen :
Temen-temen sebagian
mungkin familiar dengan jarak Euclid,
beberapa mungkin tahu konsepnya namun tidak tahu namanya, beberapa lainnya
mungkin masih asing dengan ini hehe. Baiklah, jika misal saya tanya berapa jarak orang berbobot 50 kg dan 60 kg?
Maka, kita biasanya
langsung refleks menjawab 10 kg.
Pertanyaannya, darimana
angka 10 tersebut muncul? Apakah dari nilai 60kg – 50 kg?
Tidak salah memang,
namun kurang lengkap juga. Nilai 10 tersebut sebenarnya didapatkan dari
perhitungan berikut:
r
= [(x1 – x2)2]1/2
dimana, r adalah jarak euclid, x1
adalah nilai pertama dan x2 adalah nilai kedua, maka nilai 10 diatas
didapatkan dari
r = [(x1 – x2)2]1/2
r = [(50 – 60)2]1/2
r = [(-10)2]1/2
r = (100)1/2
r = 10
Jadiiii, seperti itulah
konsep Parzen Window secara mudahnya dijelaskan. Semoga pembaca bisa menjadi
lebih mengerti, yaa! See you in my next,
post! ^^
Terimakasih informasinya..
BalasHapus