Jumat, 10 April 2015

EKONOMETRIKA BAB 5 ANALISIS REGRESI SEDERHANA



 Paper pengantar ekonometrika
ANALISIS REGRESI SEDERHANA

Oleh :
Nama Kelompok :
         
Nurbaiza Marlisa    ( 1305102010028 )
Syarifah Ulfami       ( 1305102010054 )
Ismatur Rahmi        ( 1305102010076 )
May Setyo Ningsih ( 1305102010077 )
Naziratil Husna       ( 1305102010080 )
Delsan Maulana      ( 1305102010090 )


logo_unsyiah_fromacehdesain1


FAKULTAS PERTANIAN
UNIVERSITAS SYIAH KUALA
DARUSSALAM-BANDA ACEH
   2015
ANALISIS REGRESI SEDERHANA

5.1 Hubungan Stokastik dan Nir-stokastik
            Hubungan antara X dab Y yang terbentuk y=f(x) dikatakan ‘deterministik” (pasti) atau ‘nir-stokastik , jika suatu nilai variabel bebas (X) terdapat suatu nilai variabel terikat (Y) . Suatu hubungan antara X dan Y dikatakan ‘sytokastik’ jika suatu nilai X tertentu terdapat distribusi probalitas meneyluruh dari nilai Y. Dengan demikian, dalam kasus stokastik ini, setiap nilai X tertentu variabel terikat y dapat memilki beberapa nilai dengan probalitas yang tertentu .
Contoh : permintaan akan sutau barang tertentu, diasumsikan tergantung pada harga barang itu saja (faktor penentu lainnya dianggapo kosntan , atau cateris paribus ) dan bentuk funsginya adalah linier
                        Q = f(p) = α +βp
Dengan data p dan q tertentu misalnya diperoleh α = 25 dan β=-2 sehingga persamaaan permintaan itu menjadi .
                        Q = 25 – 2p
Hubungan antara p dan q di atas menunjukkan setiapp nilai p tertentu , misalnya 2 satuan hanya ada satu nilai q , yaitu = 21 satuan . jika harga p adalah  5 satuan, maka jumlah barang yang diminta menjadi 15 satuan dan seterusnya .
            Hubungan diatas disebut hubungan ‘deterministrik’ , karena setiap harga barang hanya ada satu jumlah  barang yang diminta atau dijual.
            Q = 25 -2p + U
Hubungan q = 25 -2p =U adalah hubungan stokastik karena terdapat variabel gangguan (U). Dalam hubungan stokastik , nilai variabel bebas (p) yang berebda-beda menimbulkan distribusi probalitas p=1 diperoleh distribusi probalitas I dari nilai-nilai q dengan rerta= 24 dan varian= 0,5. Jikan p = 2, diperoleh distribusi probabilitas bariabel terikat berbeda menurut reratanya, tetatapi buikan variannya.

5.2 Model Regresi Linier Sederhana
Hubungan atau persamaan dalam teori ekonomi biasanya mempunyai spesifikasi hubunga yang pasti  atau hubungan deterministik diantara variabel-variabel. Mengingat bahwa hubungan yang pasti tidak pernah ada dalam ekonomi maka faktor-faktor stokastik harus ada dalam hubungan ekonomi. Dengan semakin banyaknya tuntutan akan perlunya menguji teori-teori ekonomi, variabel stokastik juga perlu diuji keberadaannya didalam hubungan ekonomi.
Bentuk paling sederhana dari hubungan stokastik antara dua variabel X dan Y disebut “model regresi linier”
Yi = α + βXi + Ui                                                       (i= 1 , … , n)
Y disebut variabel terikat , X adalah variabel bebas atau variabel penjelas , U adalah variabel gangguan stokastik , α, β adalah parameter – parameter regresi . Subskrip I menunjukkan pengamatan yang ke-i. Parameter α dan β ditaksir atas dasar data yang tersedia untuk variabel x dan y.
Alasan penyisipan faktor U tersebut :
1.      Karenakesalahandalampersamaan
2.      Karenakesalahandalampengukuran
3.      Karenaketidaksempurnaanspesifikasibentukmatematis model
4.      Karena agregasi

Untuk sebuah model regresi linier sederhana , spesifikasi ini dikelompokkan menjadi lisa asumsi dasar , biasanya dikenal sebagai “asumsi-asumsi model regresi linier”
1.      Asumsi1 .Uiadalahsebuahvariabel random riildanmemilkidistribusi normal
2.      Asumsi 2 nilaireratadariUisetiapperiodetertentuadalahnol
E[Ui] = 0                                                         (i=1, …. n)
3.      Asumsi 3 variandariUiadalahkonstansetiapperiode
E[Ui2] = 2                                                    2 adalah konstan
4.      Asumsi 4 faktordarigangguanpengamatan yang berebda-beda (Ui , Uj) tidaktergantung
E[Ui,Uj]=0                                                        (i≠J)
Asumsiinidikenalsebagaiasumsi ‘nir-otokorelasi’
5.      Variabel-variabelpenjelas/bebasadalahvariabelnir-stokastikdandiukurtanpakesalahn ;Uitidaktergantungpadavariabelpenjelas/bebas.
E[Xi,Uj]= Xi E[Uj] = 0                                       untukseluruhI,j =1 ,….,n.

5.3               PenaksiranParameter-parameter Regresi
Yang dimaksudkan penaksiran α dan β dengan metode kusrat terkecil atau kuadrat terkecil klasik adalah menemukan nilai-nilai taksiran α dan β yang meminumkan jumlah kuadrat residu : Σie2
Dari garis regresi sampel Y= α + βXi + ei ; diperolah :
      ei = Yi (α + βXi)
dan
             = 
Nilai-nilai α dan β yang bmeminumkan jumlah kuadrat, diperoleh dengan menurunkan secara parsial fungsi kuadrat residual  dan menyamakan turunan ini dengan nol .

Maka :
            β= 
5.4. Sifat-sifat Penaksir Kuadar Terkecil
(a). Linear (Linearity)
                   
                                                                                                     (dari 5.5)
Atau :
                    karena                           
Sehingga :
Anggaplah bahwa :
                                                                                                                     (i=1,---,n)
Maka :
                                                       (dari 5.6)
Begitu  juga dengan (5.3) yang memberikan :

Sehingga :
                                                                                                 (dari 5.7)
Jadi baik  merupakan fungsi linier dari Y.

(b). Unbiasedness
                                                                                                               (dari 5.6)
     
          =∑ki(α+βXi+Ui)                                              
          =α∑ki+β∑kiXi+∑kiUi                                                                                      (5.8)                                     
                                                                               (5.9)               
                                                         
                                                                                                 (5.10)
                                                                                              (5.11)

(c). Varian Minimum dari       dan 
            Sekarang harus dibuktikan      dan      memiliki varian sampel terkecil dibandingkan denganbpenaksir-penaksir linier tidak bias lainnya.
Maka 
                                                                                             (5.12)
                                                                          (5.13)
Untuk membuktikan bahwa      memiliki varian minimum , perlu dibandingkan varian    dengan varian beberapa penaksir β  ( katakan lah      ) yang tidak bias.
Misalkan :  dimana konstanta Wi ≠  Ki , tetapi  Wi=Ki+ Ci
Sehingga :
            = ∑wi(α+βXi+Ui)
α∑wi+β∑wiXi+∑wiUi                                                                                           (5.14)       
Karena diasumsikan penaksir yang tidak bias, berarti pada persamaan diatas cwi=0 dan ∑wiXi=1
Jadi telah ditunjukkan , jika  merupakan penaksir yang tidak bias, hasil hasil berikut berlaku:
∑wi=0, ∑wiXi=1, ∑ci=0, ∑ciXi=0                                                                            (5.15)
Varian dari  yang diasumsikan menjadi:
                                                                                                                (5.14)
Sedangkan:
            
Pentingnya Sifat BLU :
(a). Linier.Sifat ini dibutuhkan untuk memudahkan perhitungan dalam penaksiran .
(b). Unbiasedness : Secara sendirian sifat ini tidak berguna. Satu-satunya jaminan dari sifat ini adalah bila jumlah sampel sangat besar, penaksir parameter diperoleh dari sampel besar kira-kira lenih mendekati nilai parameter sebenarnya .
(c). Best : Sifat varian terkecil secara sendirian tidak dibutuhkan, karena suatu taksiran memiliki varian nol , namun memiliki penyimpangan yang besar. Sifat varian minimum yang dibutuhkan , bila dikombinasikan dengan sifat tidak bias . Pentingnya sifat ini kelohatan bila di terapkan dalam uji signifikansi baku ( standar ) terhadap α dan β, serta membuat interval keyakinan taksiran-taksiran.
Penaksir linier kuadrat terkecil yang memenuhi persyaratan seluruh asumsi klasik dinamakan penaksir yang BLUE (Best Linier Unbiased Estimator). Kesimpulan ini merupakan teorema Gauss – Markov.

5.5 Penaksir Maksimum Likelihood
            Ada dua hal penting yang diaamati dari hasil penurunan (derivasi) sub bab 5.3 dan 5.4 yaitu :
a.       Untuk membuktikan sifat BLU penaksir kuadrat terkecil, tidak asumsi klasik dipergunakan. Misalnya, untuk membuktikan sifat linierritas diperlukan asusmsi kovarian antara faktor gangguan dan variabel bebas E[XiUj]=0
b.      Untuk membuktikan sifat-sifat BLU tidak perlu dibuat asumsi bentuk spesifik dari distribusi faktor-faktor gangguan. Kenyataannya asumsi normalitas dari U tidak diperlukan untuk membuktikan  dan  sebagai BLUE.



5.6 Distribusi Sampel Penaksir Kuadrat Terkecil
Oleh karena penaksir-penaksir kuadrat terkecil merupakan kombinasi linier variabel-variabel normal Y1, Y2, Y3, …. Yn tidak saling tergantung maka  dan  makan dan juga berdistribusi normal, dengan sifat-sifat sebagai berikut :
i.                     dan adalah penaksir-penaksir yang tidak bias, yaitu rerata masing-masing sama dengan nilai α dan β yang sebenarnya.
ii.                  Varian dari setiap penaksir diketahui

5.7  Interval Keyakinan dan Uji Hipotesis
            Penyusutan interval keyakinan penting untuk memperoleh ketepatan  dan Untuk itu , semua informasi yang berhubungan dengan distribusi  dan sudah dibahas dalam hal ini :
  dan  
Dalam kasus maka:
,  
Sehingga:
,  
                                                                                                           (5.23)
Dengan cara yang sama , pengujian atas β dilakukan sebagai berikut:
,dan  
                                                                                                             (5.24)

5.8 Goodness of Fit
            Disini akan dibahas tentang garis regresi sebagai suatu keseluruhan dan diuji kebenaran letak taksirannya (goodness of fit). Dalam hal ini pertama ,  mengukur proporsi variasi variable terikat yang dijelaskan oleh variable-variabel bebasnya. Kedua,nilai  tergantung jumlah kuadrat factor residu.

5.9 Pelaporan Hasil-hasil Analisi Regresi
            Hasil-hasil analisis regresi dapat dilaporkan dalam bentuk (format) yang konvensional. Dalam praktek, koefesien-koefisien regresi bersama-sama dengan kesalahan standart nilai harus dilaporkan. Beberapa pakar ekonometrika sering menyertakan t-ratio dari koofisien taksiran sebagai pengganti kesalahan standart.

5.10 Aplikasi (Penerapan)
Contoh 1:
            Tentukan hasil-hasil regresi dari data 20 pasang pengamatan atas X dan Y.
            ∑Xi = 228, ∑Yi= 3121, ∑XiYi=38927, ∑X= 3204
Jawaban :
i.                    Penaksiran 
∑Xi= 228 ; n=20 ; sehingga 
∑Yi = 3121 ; n=20 ; sehingga 
Dari (5.5), = 156,05 – (5,54) (11,40) = 92,95
Maka hasl taksiran regresi adalah :
              92,95 = 5,54 Xi
(ii). Penaksiran Varian
Var (=  ) dan Var  ) = 
Oleh karena  tidak diketahui, maka dapat disubsitusikan  yang tidak bias bagi varian factor gangguan ke dalam persamaan diatas sehingga :
Var (=  ) dan Var  ) = 
Dimana ,  = 
            
                = 
Sehingga :
            Var  = 70,82 [  = 4,38
dan
            Var (
(iii) Penetapan interval Keyakinan
            Misalnya, ingin ditetapkan suatu interval keyakinan untuk pada tingkat probabilitas p = 0,95. Dengan kata lain, ingin diperolah nilai t yang membatasi 0,025 area di kedua sisi distribusi. Dengan derajat bebas = 18m, lihat baris ke-18 dan kolom dengan tanda ‘0,025’ pada table-t. Nilai oada koordinat adalah 2,101.
            Oleh karena itu , 95% interval keyakinan untuk  adalah :
92,95 – (2,101)(4,38)  (2,101)(4,38)
83,75  α 
Dan : 5,54 – (2,101)(0,34)  β  5,54 +(2,101)(4,38)
            4,38  β 

(iv). Pengujian Hipotesis
Diketahui Ho : β = 0
               Ho ≠ 0
Diatas telah ditentukan daerah penerimaan pada tingkat signifikansi 5% sebagai :
            - [SE() ≤  ≤ +  [SE()]
Atau :
            -≤  + 
             =  = 16,29 ;   (n=18) = 2,101
Oleh karena nilai 16,29 terletak diluar daerah penerimaan , maka hipotesis yang menyatakan tidak ada hubungan antara X dan Y, yakni Ho, ditolak.





Contoh :
Tabel berikut menyajikan produk nasional bruto (X) dan permintaan makanan (Y) diukur dalam satuan-satuan arbitrary. Data tersebut berasal dari sebuah Negara yang sedang berkembang, yang meliputi periode 10 tahun. Taksir fungsi perminataan akan makanan : Y = α+ βX + U





Tabel 5.1
Data dan Perhitungan untuk Penaksiran Fungsi Makanan : Y = α + βX + U












n
Yi
Xi
Xi2
Xi.Yi
Yi=(Y1-Y1 ̅)
Xi=(X1-X ̅)
Xi.Yi
Xi2
Ŷ=(α ̂+ β ̂X1)
ei =( Y1-Ŷ)
ei2
1
6
50
2500
300
-2,8
-9,6
26,88
92,16
6,846
-0,846
0,715716
2
7
52
2704
364
-1,8
-7,6
13,68
57,76
7,2526
-0,2526
0,06380676
3
8
55
3025
440
-0,8
-4,6
3,68
21,16
7,8625
0,1375
0,01890625
4
10
59
3481
590
1,2
-0,6
-0,72
0,36
8,6757
1,3243
1,75377049
5
8
57
3249
456
-0,8
-2,6
2,08
6,76
8,2691
-0,2691
0,07241481
6
9
58
3364
522
0,2
-1,6
-0,32
2,56
8,4724
0,5276
0,27836176
7
10
62
3844
620
1,2
2,4
2,88
5,76
9,2856
0,7144
0,51036736
8
9
65
4225
585
0,2
5,4
1,08
29,16
9,8955
-0,8955
0,80192025
9
11
68
4624
748
2,2
8,4
18,48
70,56
10,5054
0,4946
0,24462916
10
10
70
4900
700
1,2
10,4
12,48
108,16
10,912
-0,912
0,831744
JUMLAH
88
596
35916
5325
-7,1054E-15
-1,42109E-14
80,2
394,4
87,9768
0,0232
5,29163684
RATA-RATA
8,8
59,6
3591,6
532,5
-7,1054E-16
-1,42109E-15
8,02
39,44
8,79768
0,00232
0,529163684












β
0,203347










α
-3,31947











Ringkasan hasil analisi regresinya adalah :
= -3,32 + 0,2033 Xi                                                            = 0,76
SE (
t*               -1,35 4,98
            = 0,76 menunujukkan bahwa 76% variasi total pada Y dapat dijelaskan oleh variasi X. pada tingkat signifikansi 5% hanya yang berarti secara statistic, sedangkan  tidak signifikan.

Welcome to SHAZAM - Version 10.0 -  APR+2008 SYSTEM=WIN-NT  PAR= 22480 - 03/11/15 21:26:40
 |_SAMPLE 1 10
 |_READ Y X
    2 VARIABLES AND       10 OBSERVATIONS STARTING AT OBS      1

 |_*
 |_*CREATING SOME VARIABLE

 |_OLS Y X/MAX DN

 REQUIRED MEMORY IS PAR=       1 CURRENT PAR=   22480
  OLS ESTIMATION
        10 OBSERVATIONS     DEPENDENT VARIABLE= Y
 ...NOTE..SAMPLE RANGE SET TO:      1,     10

  R-SQUARE =   0.7550     R-SQUARE ADJUSTED =   0.7244
 VARIANCE OF THE ESTIMATE-SIGMA**2 =  0.52916
 STANDARD ERROR OF THE ESTIMATE-SIGMA =  0.72743
 SUM OF SQUARED ERRORS-SSE=   5.2916
 MEAN OF DEPENDENT VARIABLE =   8.8000
 LOG OF THE LIKELIHOOD FUNCTION = -11.0070

 MODEL SELECTION TESTS - SEE JUDGE ET AL. (1985,P.242)
  AKAIKE (1969) FINAL PREDICTION ERROR - FPE =     0.63499
     (FPE IS ALSO KNOWN AS AMEMIYA PREDICTION CRITERION - PC)
  AKAIKE (1973) INFORMATION CRITERION - LOG AIC = -0.23647
  SCHWARZ (1978) CRITERION - LOG SC =             -0.17595
 MODEL SELECTION TESTS - SEE RAMANATHAN (1998,P.165)
  CRAVEN-WAHBA (1979)
     GENERALIZED CROSS VALIDATION - GCV =          0.82681
  HANNAN AND QUINN (1979) CRITERION =              0.73871
  RICE (1984) CRITERION =                          0.88193
  SHIBATA (1981) CRITERION =                       0.74082
  SCHWARZ (1978) CRITERION - SC =                  0.83866
  AKAIKE (1974) INFORMATION CRITERION - AIC =      0.78941

                      ANALYSIS OF VARIANCE - FROM MEAN
                       SS         DF            MS                 F
 REGRESSION        16.308          1.       16.308                30.820
 ERROR             5.2916         10.      0.52916               P-VALUE
 TOTAL             21.600          9.       2.4000                 0.000

                      ANALYSIS OF VARIANCE - FROM ZERO
                       SS         DF            MS                 F
 REGRESSION        790.71          2.       395.35               747.138
 ERROR             5.2916         10.      0.52916               P-VALUE
 TOTAL             796.00         10.       79.600                 0.000


                              ASYMPTOTIC
 VARIABLE   ESTIMATED  STANDARD   T-RATIO        PARTIAL STANDARDIZED ELASTICITY
   NAME    COEFFICIENT   ERROR   --------   P-VALUE CORR. COEFFICIENT  AT MEANS
 X         0.20335     0.3663E-01   5.552     0.000 0.891    0.8689     1.3772
 CONSTANT  -3.3195      2.195      -1.512     0.130-0.471    0.0000    -0.3772
 VARIANCE-COVARIANCE MATRIX OF COEFFICIENTS
 X         0.13417E-02
 CONSTANT -0.79964E-01   4.8188
              X            CONSTANT

 CORRELATION MATRIX OF COEFFICIENTS
 X          1.0000
 CONSTANT -0.99449       1.0000
              X            CONSTANT

     OBS.   OBSERVED     PREDICTED   CALCULATED
      NO.    VALUE        VALUE       RESIDUAL
       1    6.0000       6.8479     -0.84787              *    I
       2    7.0000       7.2546     -0.25456                  * I
       3    8.0000       7.8646      0.13540                   I*
       4    10.000       8.6780       1.3220                   I        *
       5    8.0000       8.2713     -0.27130                  * I
       6    9.0000       8.4746      0.52535                   I   *
       7    10.000       9.2880      0.71197                   I    *
       8    9.0000       9.8981     -0.89807              *    I
       9    11.000       10.508      0.49189                   I  *
      10    10.000       10.915     -0.91481              *    I

 DURBIN-WATSON = 2.1966    VON NEUMANN RATIO = 2.4406    RHO = -0.29136
 RESIDUAL SUM =  0.44409E-14  RESIDUAL VARIANCE =  0.52916
 SUM OF ABSOLUTE ERRORS=   6.3732
 R-SQUARE BETWEEN OBSERVED AND PREDICTED = 0.7550
 RUNS TEST:    7 RUNS,    5 POS,    0 ZERO,    5 NEG  NORMAL STATISTIC =  0.6708
 COEFFICIENT OF SKEWNESS =   0.2471 WITH STANDARD DEVIATION OF 0.6870
 COEFFICIENT OF EXCESS KURTOSIS =  -0.9781 WITH STANDARD DEVIATION OF 1.3342

 JARQUE-BERA NORMALITY TEST- CHI-SQUARE(2 DF)=    0.5753 P-VALUE= 0.750

      GOODNESS OF FIT TEST FOR NORMALITY OF RESIDUALS -  6 GROUPS
 OBSERVED  0.0  3.0  2.0  4.0  1.0  0.0
 EXPECTED  0.2  1.4  3.4  3.4  1.4  0.2
 CHI-SQUARE =    3.2183 WITH  2 DEGREES OF FREEDOM, P-VALUE= 0.200

 ..COMPLETED..