5 Model Regresi Linier Lanjutan
Ketika terjadi perubahan kuantitas sebuah variabel yang ada di dalam sebuah sistem, kita biasanya ingin tahu dampak dari perubahan itu terhadap kuantitas variabel-variabel lain yang ada di sistem tersebut. Hubungan perubahan ini mungkin cukup dimodelkan dengan hubungan fungsional sederhana. Bisa jadi juga hubungan perubahan ini lebih kompleks sehingga hubungan fungsional sederhana harus dikembangkan agar kita dapat menganalisisnya. Persamaan umum model regresi dengan variabel respons \(y\) dan prediktor x sebanyak \(p\): \(x_1, x_2, ... , x_p\) adalah:
\[\begin{equation} y = \beta_0 + \beta_1x_1 + ... + \beta_px_p + \epsilon \tag{5.1} \end{equation}\]
dimana \(\epsilon\) terdistribusi secara normal. Persamaan di atas dapat dikembangkan berdasarkan tiga bagian penyusunnya. Bagian pertama adalah variabel responsnya \(y\), kedua adalah bagian residunya \(\epsilon\), dan ketiga adalah variabel prediktornya \(x\):
Generalized Linear Models (GLM): Model linier standard tidak dapat mengakomodasi variabel respons \(y\) yang tidak normal seperti data dalam bentuk proporsi, persentase, binari, kategori dan count. Di dalam kasus variabel respons yang kita hadapi seperti ini kita gunakan generalized linear model.
Mixed Effect Model: Model ini kita gunakan jika data kita tersusun secara hierarkis atau berkelompok. Misal untuk data pengamatan berulang, panel data, longitudinal dan data berjenjang yang mengakibatkan suatu struktur korelasi pada komponen errornya \(\epsilon\).
Model Regresi Nonparametrik (Nonparametric Regression Model): Pada model linier, variabel prediktor \(x\) dikombinasikan secara linier untuk memodelkan dampaknya pada variabel respons. Akan tetapi kadang kala, linieritas ini tidak cukup menangkap struktur data sehingga diperlukan fleksibilitas lebih. Metode-metode yang dapat mengakomodasi ini misalnya additive model, trees and neural networks memungkinkan pemodelan yang lebih fleksibel pada respons yang mengkombinasikan prediktor secara nonparametrik.