class: middle, title-slide <!-- top logo (comment to remove or edit on `conf/css/style.css:23`) --> <div class="lab-logo"></div> <!-- <div class="uni-logo"></div> --> # Regresi Linier <hr width="100%" align="left" size="1.3" color="gold"></hr> ## <span style="color:gold">Ekonometrika Sesi 2</span> ### Tedy Herlambang .small[<br> ] <br><br><br><br><br> [<i class="fas fa-blog" style="color:#e7e8e2"></i> bangtedy](https://bangtedy.github.io) [<i class="fa fa-twitter fa-lg" style="color:#e7e8e2"></i> @t_hlb](https://twitter.com/t_hlb) --- # Capaian Pembelajaran 1. Menjelaskan ide dasar regresi 2. Menjelaskan asumsi-asumsi OLS 3. Menentukan estimator OLS yang BLUE 4. Menentukan ketepatan estimator OLS dan kebaikan regresi metode OLS 5. Menjelaskan arti koefisien regresi 6. Menjelaskan teknik variabel dummy dan mengartikan koefisiennya. --- # Pembelajaran Sesi sebelumnya Orang ekonomi seringkali tertarik menganalisis hubungan antara kuantitas berbeda: - Hubungan antara tingkat pendapatan rumah tangga dengan konsumsinya - Hubungan antara gaji seseorang dengan pendapatannya - Hubungan antara tingkat bunga jangka panjang dengan jangka pendek Ekonometrika mengkuantifikasi hubungan ini dengan menggunakan: - Data yang tersedia - Menggunakan teknik statistika - Menginterpretasikan atau mengeksploitasi hasil secara tepat. > Ekonometrika: interaksi antara teori ekonomi, data dan metode statistika. Inilah yang menjadi tantangan sekaligus menariknya ekonometrika! --- class: center, middle > <span style="color:gold">‘Econometrics is much easier without data’</span> > <span style="color:blue">Belajar ekonometrika seperti belajar naik sepeda: praktik sangat penting</span> > <span style="color:brown">Praktik sangat krusial dalam proses memahami berbagai metode, bagaimana dan kapan menggunakan metode-metode itu, yang benar/salah.</span> --- # Regresi Linier Sederhana - Kombinasi model regresi linier dengan *Ordinary Least Squares (OLS)* menjadi batu loncatan di dalam ekonometrika - Regresi menjadi alat yang paling penting yang dipakai ekonomi untuk memahami hubungan antara dua atau lebih variabel. + Misalkan variabel-variabel tingkat pengangguran dan suku bunga, pasokan uang, inflasi, nilai tukar, neraca perdagangan, dimana hubungan antara variabel-variabel in kompleks. --- # Seorang mahasiswa mencoba membuat model harga rumah - Hal-hal apa saja yang mempengaruhi harga rumah: + luas rumah, + jumlah kamar, + luas tanah, + lokasi rumah (dekat dengan sekolah, tempat ibadah, jalan tol, dll), + jumlah kamar mandi (mungkin) + dll --- # Notasi Teoritis `$$Y=f(X_1,X_2,X_i,..., \epsilon),$$` - Y: variabel dependen, - `\(X_1, X_2, . . ., X_i\)`: variabel variabel independen, - `\(\epsilon\)`: residu dari model (sebagian dari variabilitas dari variabel dependen yang tidak dijelaskan oleh model). Jika diasumsikan hubungan antar variabel itu linier maka: `$$Y=\beta_0 + \beta_1X_1 + \beta_2X_2+ ... \beta_iX_i + \epsilon,$$` - `\(\beta_0, \beta_1, \beta_2\)`: koefisien model/parameter struktural yang mengkuantifikasi arah dan kekuatan hubungan statistik antara variabel independen dan dependen. - `\(\epsilon\)`: residu dari model --- # Catatan - Jika di dalam aktualitas kita bisa mengetahui nilai-nilai `\(\beta_0, \beta_1, \beta_2\)`, maka kita akan tahu hubungan antara Y dengan `\(X_i\)`. - Di dalam praktik, informasi ini tidak kita miliki - Jika di dalam model regresi hubungan antara Y dengan X memang linier, di dunia sebenarnya, kita tidak akan pernah menemukan bahwa data terletak persis pada garis lurus. - Model regresi selalu hanya merupakan aproksimasi/pendekatan dari hubungan yang sebenarnya (hubungan yang sebenarnya mungkin saja berbeda dari pendekatan implisit model regresi linier). - Faktor kesalahan pengukuran membuat data tersebar dekat tetapi tidak persis berada di garis regresi. --- # Sebuah model pasti mengandung kesalahan - *missing variables* (atau karena kita tidak bisa mengamatinya) - kesulitan mengukur, mengumpulkan atau bahkan data tidak mungkin dapat dikumpulkan - penghilangan variabel ini dari model regresi membuat model mengandung kesalahan `\(\epsilon\)`. --- # Prosedur Membangun Model Regresi<sup>*</sup>: 1. Menentukan variabel dependen yang perilakunya ingin dijelaskan di dalam model. 2. Menentukan kandidat variabel independen yang relevan (variabel independen yang diperkirakan memiliki hubungan statistik dan teoritis dengan variabel dependen). 3. Analisis pendahuluan dan *plotting* data (cek pencilan data, data yang hilang, salah input dll) 4. Membuang calon-calon variabel dependen yang *redundant* atau tidak signifikan dengan cara: + Metode statistik (e.g., the procedure of “general to specific modeling”). + Teori ekonomi, pendapat ahli atau penilain subyektif 5. Estimasi final parameter model 6. Verifikasi kebenaran dan kecocokan model dengan data aktual 7. Penerapan model yang diperoleh --- # Elemen-elemen Dasar Model Regresi Linier Koefisien Model: - Intersep/konstanta: nilai yang diharapkan dari variabel dependen jika nilai variabel independen sama dengan nol. Perpotongan garis regresi dengan sumbu axis. - Koefisien kemiringan/slope: kuantifikasi arah dan ukuran dampak variabel independen tertentu terhadap variabel dependen. Standard errors of individual structural parameters --- # Bagaimana menentukan signifikansi statistik dari masing-masing koefisien model regresi Cek t-statistics of individual coefficients - Dihitung dengan membagi koefisien dengan standar errornya. --- # Koefisien Determinasi `\(R^2\)` - Mengukur goodness of fit dari model dibandingkan dengan data aktual. - R-squared equaling zero artinya: - R-squared equaling unity artinya: - Mungkinkan di dalam riset ekonomi mendapatkan `\(R^2\)` sama dengan 0 atau 1? Koefisien Determinasi yang Disesuaikan (the adjusted R-squared) --- # Evaluasi Regresi dan Model - Normality of errors. - Homoscedasticity of Errors. - Absence of Outlying --- # [Kasus 1: Model Pengeluaran Pangan](https://rdrr.io/github/ccolonescu/PoEdata/man/food.html) **Deskripsi Kasus** Data frame terdiri dari 40 pengamatan pada dua variabel yaitu: - food_exp: weekly food expenditure in $ - income: weekly income in $100 - Data ini bisa dipanggil dari **PoEdata** R library. - Kita akan melihat pengaruh kenaikan pendapatan terhadap kenaikan pengeluaran pangan per minggu: `$$food-exp=\beta_1 + \beta_2income + e$$` --- # Data bisa dipanggil dari PoEdata package, dan kita plot ```r library(PoEdata) data(food) attach(food) plot(income, food_exp) ``` <img src="sesi2_files/figure-html/plot-food-1.png" width="504" style="display: block; margin: auto;" /> --- Estimasi model ```r (summary (lm(food_exp ~ income, data = food))) # # Call: # lm(formula = food_exp ~ income, data = food) # # Residuals: # Min 1Q Median 3Q Max # -223.025 -50.816 -6.324 67.879 212.044 # # Coefficients: # Estimate Std. Error t value Pr(>|t|) # (Intercept) 83.416 43.410 1.922 0.0622 . # income 10.210 2.093 4.877 1.95e-05 *** # --- # Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 # # Residual standard error: 89.52 on 38 degrees of freedom # Multiple R-squared: 0.385, Adjusted R-squared: 0.3688 # F-statistic: 23.79 on 1 and 38 DF, p-value: 1.946e-05 ``` --- # Sehingga model yang diperoleh adalah: `$$food-exp = 83.416 + 10.210 income$$` --- # Latihan: Perhatikan halaman 2.23 Tabel 2.1.1 Anda diminta menghitung regresi sederhana besarnya pengaruh pengeluaran iklan terhadap volume penjualan. Datanya adalah sebagai berikut: <table class=" lightable-classic table table-striped" style="font-family: Cambria; width: auto !important; margin-left: auto; margin-right: auto; font-size: 24px; margin-left: auto; margin-right: auto;"> <caption style="font-size: initial !important;"></caption> <thead> <tr> <th style="text-align:right;"> perusahaan </th> <th style="text-align:right;"> penjualan </th> <th style="text-align:right;"> iklan </th> </tr> </thead> <tbody> <tr> <td style="text-align:right;"> 1 </td> <td style="text-align:right;"> 100 </td> <td style="text-align:right;"> 1000 </td> </tr> <tr> <td style="text-align:right;"> 2 </td> <td style="text-align:right;"> 20 </td> <td style="text-align:right;"> 250 </td> </tr> <tr> <td style="text-align:right;"> 3 </td> <td style="text-align:right;"> 60 </td> <td style="text-align:right;"> 500 </td> </tr> <tr> <td style="text-align:right;"> 4 </td> <td style="text-align:right;"> 15 </td> <td style="text-align:right;"> 100 </td> </tr> <tr> <td style="text-align:right;"> 5 </td> <td style="text-align:right;"> 80 </td> <td style="text-align:right;"> 750 </td> </tr> <tr> <td style="text-align:right;"> 6 </td> <td style="text-align:right;"> 85 </td> <td style="text-align:right;"> 800 </td> </tr> <tr> <td style="text-align:right;"> 7 </td> <td style="text-align:right;"> 50 </td> <td style="text-align:right;"> 450 </td> </tr> <tr> <td style="text-align:right;"> 8 </td> <td style="text-align:right;"> 40 </td> <td style="text-align:right;"> 300 </td> </tr> </tbody> </table> --- # Plot Data Penjualan dan Pengeluaran Iklan .pull-left[ ```r plot(iklan$iklan, iklan$penjualan, ylim=c(0, max(iklan$penjualan)), xlim=c(0, max(iklan$iklan)), xlab="Pengeluaran iklan dalam juta rupiah", ylab="Volume penjualan dalam juta unit", type = "p") ``` ] .pull-right[ ![](sesi2_files/figure-html/plot-iklan-1.png) ] --- # Estimasi Model .pull-left[ ```r model.iklan <- lm(penjualan~iklan, data = iklan) plot(iklan$iklan, iklan$penjualan, xlab="Pengeluaran iklan dalam juta rupiah", ylab="Volume penjualan dalam juta unit", type = "p") abline(model.iklan, col="blue") ``` ] .pull-right[ ![](sesi2_files/figure-html/plot-estimasi-1.png) ] --- ```r summary(model.iklan) # # Call: # lm(formula = penjualan ~ iklan, data = iklan) # # Residuals: # Min 1Q Median 3Q Max # -9.7414 -0.8892 0.7358 2.0880 5.5994 # # Coefficients: # Estimate Std. Error t value Pr(>|t|) # (Intercept) 5.082276 3.881881 1.309 0.238 # iklan 0.098637 0.006541 15.079 5.36e-06 *** # --- # Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 # # Residual standard error: 5.333 on 6 degrees of freedom # Multiple R-squared: 0.9743, Adjusted R-squared: 0.97 # F-statistic: 227.4 on 1 and 6 DF, p-value: 5.362e-06 ``` --- # Kasus: Gaji Karyawan di Indonesia Misalkan Anda ingin membuat model tentang faktor-faktor yang mempengaruhi gaji karyawan di Indonesia. 1. Variabel-variabel independen apa yang akan Anda masukkan ke dalam model? 2. Bagaimana perkiraan Anda tentang arah hubungan dan kekuatan pengaruh dari variabel-variabel pada no.1? 3. Bagaimana Anda akan mengumpulkan data variabel pada pertanyaan no.1? --- # Wooldridge, Contoh 2.3: Gaji CEO dan Return on Equity (ROE) Pada kasus ini, penulis membuat model pengaruh ROE terhadap gaji yang diterima CEO. Model yang diduga adalah `\(gaji = \beta_0 + \beta_1 roe + e\)`. Persamaan regresi linier dengan OLS yang didapatkan adalah `\(\widehat{gaji}= 963.1913 + 18.50119 roe\)`. - Asumsikan bahwa persamaan diatas sudah tepat dan signifikan. Jelaskan makna dari koefisien-koefisien yang didapat! - Jika ROE sebuah perusahaan adalah sebesar 10 satuan, berapa gaji yang akan didapat oleh CEO-nya? --- Halaman ini memang sengaja dibiarkan kosong. --- class: inverse, right, bottom # Kso'on, find me at... <hr width="45%" align="right" size="0.3" color="orange"></hr> [<i class="fa fa-twitter fa-lg" style="color:#fc911e"></i> <span style="color:#fc911e"> @t_hlb </span>](https://twitter.com/t_hlb) [<i class="fas fa-blog" style="color:#fc911e"></i><span style="color:#fc911e"> bangtedy.github.io</span>](https://bangtedy.github.io)