Minggu, 08 September 2019

KONSEP DASAR JST 6: PARZEN WINDOW


Halo temen-temen, apa kabar setelah libur panjang ini? Bagi yang masih kuliah di STMKG ya hehe. Baiklah, yuk langsung bahas sekuel bahasan jaringan saraf tiruan keenam, yaitu tentang parzen window. Metode parzen window dikenal juga sebagai metode Parzen-Rosenblatt window digunakan secara luas dalam pendekatan nonparametric untuk mengestimasi/memperkirakan nilai fungsi densitas peluang (pdf, probability density function, p(x) untuk titik spesifik x dari sampel titik xn.
Well, secara sederhana, parzen didefinisikan sebagai modifikasi persamaan peluang dengan menganggap setiap data adalah sebuah himpunan data. Definisi lain menjelaskan bahwa parzen merupakan rata-rata dari total jumlah parzen dari masing-masing rerata (mu, µ) setiap data dengan sigma (σ) diatur konstan. Sementara, pada pdf normal (Gaussian/fungsi kernel), seluruh data digambarkan sebagai satu himpunan dalam kurva distribusi normal. Masih bingung? Baik, jika sebelumnya kita tahu pdf digambarkan dalam grafik distribusi normal misal sebagai berikut:


Kita tahu distribusi normal fungsi kernel diatas dibentuk dari nilai µ 25.8 untuk satu himpunan data suhu. Sementara itu, pada konsep parzen window, setiap elemen nilai yang menyusun himpunan data suhu masing-masing dibuat fungsi kernel-nya (pdf) dengan menjadikan nilai elemen tersebut sebagai nilai rata-rata (µ) untuk membentuk “pdf-pdf yang banyak (sebanyak jumlah data)”. Selanjutnya setiap fungsi kernel yang tumpang tindih tersebut (lihat gambar 2) akan dihitung nilai rata-rata “barunya” untuk menggambarkan parzen window yang juga merupakan rata-rata densitas data. Sehingga nilai peluang (pn(x)) yang dihasilkan akan “lebih teliti” dibandingkan jika kita mencari nilai peluang berdasarkan Gaussian kernel pada kurva distribusi normal.


Secara matematis, peluang kelas bersyarat (the class-conditional probability, P(Xnew|Ci), dengan menggunakan parzen (Zeinali dan Story, 2017) dihitung dengan menggunakan:
dimana:
Xnew    : nilai input baru
Ci         : cardinality dari himpunan bagian Ci
ωi,j       : Gaussian kernel dari Xci,j (multivariate normal, nonsingular)
d          : dimensi data, misal data memiliki 3 variabel prediktor maka d=3
σ     : parameter sebaran (spread parameter) yang diatur konstan dan ditentukan berdasarkan eksperimen dengan nilai antara 0 dan 1.
||Xnew – Xci,j||  : Jarak Euclidian, perhitungan nilai ini sangat penting dalam pembobotan parzen    : 

Temen-temen sebagian mungkin familiar dengan jarak Euclid, beberapa mungkin tahu konsepnya namun tidak tahu namanya, beberapa lainnya mungkin masih asing dengan ini hehe. Baiklah, jika misal saya tanya berapa jarak orang berbobot 50 kg dan 60 kg?
Maka, kita biasanya langsung refleks menjawab 10 kg.
Pertanyaannya, darimana angka 10 tersebut muncul? Apakah dari nilai 60kg – 50 kg?
Tidak salah memang, namun kurang lengkap juga. Nilai 10 tersebut sebenarnya didapatkan dari perhitungan berikut:
r = [(x1 – x2)2]1/2
dimana, r adalah jarak euclid, x1 adalah nilai pertama dan x2 adalah nilai kedua, maka nilai 10 diatas didapatkan dari
r = [(x1 – x2)2]1/2
r = [(50 – 60)2]1/2
r = [(-10)2]1/2
r = (100)1/2
r = 10
Jadiiii, seperti itulah konsep Parzen Window secara mudahnya dijelaskan. Semoga pembaca bisa menjadi lebih mengerti, yaa! See you in my next, post! ^^


1 komentar: