ZIRA'S BLOG: April 2015

EKONOMETRIKA BAB 5 ANALISIS REGRESI SEDERHANA

 Paper pengantar ekonometrika

ANALISIS REGRESI SEDERHANA

Oleh :

Nama Kelompok :

Nurbaiza Marlisa    ( 1305102010028 )

Syarifah Ulfami       ( 1305102010054 )

Ismatur Rahmi        ( 1305102010076 )

May Setyo Ningsih ( 1305102010077 )

Naziratil Husna       ( 1305102010080 )

Delsan Maulana      ( 1305102010090 )

FAKULTAS PERTANIAN

UNIVERSITAS SYIAH KUALA

DARUSSALAM-BANDA ACEH
   2015

ANALISIS REGRESI SEDERHANA

5.1 Hubungan Stokastik dan Nir-stokastik

            Hubungan antara X dab Y yang terbentuk y=f(x) dikatakan ‘deterministik” (pasti) atau ‘nir-stokastik , jika suatu nilai variabel bebas (X) terdapat suatu nilai variabel terikat (Y) . Suatu hubungan antara X dan Y dikatakan ‘sytokastik’ jika suatu nilai X tertentu terdapat distribusi probalitas meneyluruh dari nilai Y. Dengan demikian, dalam kasus stokastik ini, setiap nilai X tertentu variabel terikat y dapat memilki beberapa nilai dengan probalitas yang tertentu .

Contoh : permintaan akan sutau barang tertentu, diasumsikan tergantung pada harga barang itu saja (faktor penentu lainnya dianggapo kosntan , atau cateris paribus ) dan bentuk funsginya adalah linier

                        Q = f(p) = α +βp

Dengan data p dan q tertentu misalnya diperoleh α = 25 dan β=-2 sehingga persamaaan permintaan itu menjadi .

                        Q = 25 – 2p

Hubungan antara p dan q di atas menunjukkan setiapp nilai p tertentu , misalnya 2 satuan hanya ada satu nilai q , yaitu = 21 satuan . jika harga p adalah  5 satuan, maka jumlah barang yang diminta menjadi 15 satuan dan seterusnya .

            Hubungan diatas disebut hubungan ‘deterministrik’ , karena setiap harga barang hanya ada satu jumlah  barang yang diminta atau dijual.

            Q = 25 -2p + U

Hubungan q = 25 -2p =U adalah hubungan stokastik karena terdapat variabel gangguan (U). Dalam hubungan stokastik , nilai variabel bebas (p) yang berebda-beda menimbulkan distribusi probalitas p=1 diperoleh distribusi probalitas I dari nilai-nilai q dengan rerta= 24 dan varian= 0,5. Jikan p = 2, diperoleh distribusi probabilitas bariabel terikat berbeda menurut reratanya, tetatapi buikan variannya.

5.2 Model Regresi Linier Sederhana

Hubungan atau persamaan dalam teori ekonomi biasanya mempunyai spesifikasi hubunga yang pasti  atau hubungan deterministik diantara variabel-variabel. Mengingat bahwa hubungan yang pasti tidak pernah ada dalam ekonomi maka faktor-faktor stokastik harus ada dalam hubungan ekonomi. Dengan semakin banyaknya tuntutan akan perlunya menguji teori-teori ekonomi, variabel stokastik juga perlu diuji keberadaannya didalam hubungan ekonomi.

Bentuk paling sederhana dari hubungan stokastik antara dua variabel X dan Y disebut “model regresi linier”

Yi = α + βXi + Ui                                                       (i= 1 , … , n)

Y disebut variabel terikat , X adalah variabel bebas atau variabel penjelas , U adalah variabel gangguan stokastik , α, β adalah parameter – parameter regresi . Subskrip I menunjukkan pengamatan yang ke-i. Parameter α dan β ditaksir atas dasar data yang tersedia untuk variabel x dan y.

Alasan penyisipan faktor U tersebut :

1.      Karenakesalahandalampersamaan

2.      Karenakesalahandalampengukuran

3.      Karenaketidaksempurnaanspesifikasibentukmatematis model

4.      Karena agregasi

Untuk sebuah model regresi linier sederhana , spesifikasi ini dikelompokkan menjadi lisa asumsi dasar , biasanya dikenal sebagai “asumsi-asumsi model regresi linier”

1.      Asumsi1 .Uiadalahsebuahvariabel random riildanmemilkidistribusi normal

2.      Asumsi 2 nilaireratadariUisetiapperiodetertentuadalahnol

E[Ui] = 0                                                         (i=1, …. n)

3.      Asumsi 3 variandariUiadalahkonstansetiapperiode

E[Ui2] = 2                                                    2 adalah konstan

4.      Asumsi 4 faktordarigangguanpengamatan yang berebda-beda (Ui , Uj) tidaktergantung

E[Ui,Uj]=0                                                        (i≠J)

Asumsiinidikenalsebagaiasumsi ‘nir-otokorelasi’

5.      Variabel-variabelpenjelas/bebasadalahvariabelnir-stokastikdandiukurtanpakesalahn ;Uitidaktergantungpadavariabelpenjelas/bebas.

E[Xi,Uj]= Xi E[Uj] = 0                                       untukseluruhI,j =1 ,….,n.

5.3               PenaksiranParameter-parameter Regresi

Yang dimaksudkan penaksiran α dan β dengan metode kusrat terkecil atau kuadrat terkecil klasik adalah menemukan nilai-nilai taksiran α dan β yang meminumkan jumlah kuadrat residu : Σie2

Dari garis regresi sampel Y= α + βXi + ei ; diperolah :

      ei = Yi (α + βXi)

dan

             = 

Nilai-nilai α dan β yang bmeminumkan jumlah kuadrat, diperoleh dengan menurunkan secara parsial fungsi kuadrat residual  dan menyamakan turunan ini dengan nol .

Maka :

            β= 

5.4. Sifat-sifat Penaksir Kuadar Terkecil

(a). Linear (Linearity)

                                                                                                     (dari 5.5)

Atau :

                    karena                           

Sehingga :

Anggaplah bahwa :

                                                                                                                     (i=1,---,n)

Maka :

                                                       (dari 5.6)

Begitu  juga dengan (5.3) yang memberikan :

Sehingga :

                                                                                                 (dari 5.7)

Jadi baik  merupakan fungsi linier dari Y.

(b). Unbiasedness

                                                                                                               (dari 5.6)

          =∑ki(α+βXi+Ui)                                              

          =α∑ki+β∑kiXi+∑kiUi                                                                                      (5.8)                                     

                                                                               (5.9)               

                                                                                                 (5.10)

                                                                                              (5.11)

(c). Varian Minimum dari       dan 

            Sekarang harus dibuktikan      dan      memiliki varian sampel terkecil dibandingkan denganbpenaksir-penaksir linier tidak bias lainnya.

Maka 

                                                                                             (5.12)

                                                                          (5.13)

Untuk membuktikan bahwa      memiliki varian minimum , perlu dibandingkan varian    dengan varian beberapa penaksir β  ( katakan lah      ) yang tidak bias.

Misalkan :  dimana konstanta Wi ≠  Ki , tetapi  Wi=Ki+ Ci

Sehingga :

            = ∑wi(α+βXi+Ui)

= α∑wi+β∑wiXi+∑wiUi                                                                                           (5.14)       

Karena diasumsikan penaksir yang tidak bias, berarti pada persamaan diatas cwi=0 dan ∑wiXi=1

Jadi telah ditunjukkan , jika  merupakan penaksir yang tidak bias, hasil hasil berikut berlaku:

∑wi=0, ∑wiXi=1, ∑ci=0, ∑ciXi=0                                                                            (5.15)

Varian dari  yang diasumsikan menjadi:

                                                                                                                (5.14)

Sedangkan:

Pentingnya Sifat BLU :

(a). Linier.Sifat ini dibutuhkan untuk memudahkan perhitungan dalam penaksiran .

(b). Unbiasedness : Secara sendirian sifat ini tidak berguna. Satu-satunya jaminan dari sifat ini adalah bila jumlah sampel sangat besar, penaksir parameter diperoleh dari sampel besar kira-kira lenih mendekati nilai parameter sebenarnya .

(c). Best : Sifat varian terkecil secara sendirian tidak dibutuhkan, karena suatu taksiran memiliki varian nol , namun memiliki penyimpangan yang besar. Sifat varian minimum yang dibutuhkan , bila dikombinasikan dengan sifat tidak bias . Pentingnya sifat ini kelohatan bila di terapkan dalam uji signifikansi baku ( standar ) terhadap α dan β, serta membuat interval keyakinan taksiran-taksiran.

Penaksir linier kuadrat terkecil yang memenuhi persyaratan seluruh asumsi klasik dinamakan penaksir yang BLUE (Best Linier Unbiased Estimator). Kesimpulan ini merupakan teorema Gauss – Markov.

5.5 Penaksir Maksimum Likelihood

            Ada dua hal penting yang diaamati dari hasil penurunan (derivasi) sub bab 5.3 dan 5.4 yaitu :

a.       Untuk membuktikan sifat BLU penaksir kuadrat terkecil, tidak asumsi klasik dipergunakan. Misalnya, untuk membuktikan sifat linierritas diperlukan asusmsi kovarian antara faktor gangguan dan variabel bebas E[XiUj]=0

b.      Untuk membuktikan sifat-sifat BLU tidak perlu dibuat asumsi bentuk spesifik dari distribusi faktor-faktor gangguan. Kenyataannya asumsi normalitas dari U tidak diperlukan untuk membuktikan  dan  sebagai BLUE.

5.6 Distribusi Sampel Penaksir Kuadrat Terkecil

Oleh karena penaksir-penaksir kuadrat terkecil merupakan kombinasi linier variabel-variabel normal Y1, Y2, Y3, …. Yn tidak saling tergantung maka  dan  makan dan juga berdistribusi normal, dengan sifat-sifat sebagai berikut :

i.                     dan adalah penaksir-penaksir yang tidak bias, yaitu rerata masing-masing sama dengan nilai α dan β yang sebenarnya.

ii.                  Varian dari setiap penaksir diketahui

5.7  Interval Keyakinan dan Uji Hipotesis

            Penyusutan interval keyakinan penting untuk memperoleh ketepatan  dan Untuk itu , semua informasi yang berhubungan dengan distribusi  dan sudah dibahas dalam hal ini :

  dan  

Dalam kasus maka:

,  

Sehingga:

,  

                                                                                                           (5.23)

Dengan cara yang sama , pengujian atas β dilakukan sebagai berikut:

,dan  

                                                                                                             (5.24)

5.8 Goodness of Fit

            Disini akan dibahas tentang garis regresi sebagai suatu keseluruhan dan diuji kebenaran letak taksirannya (goodness of fit). Dalam hal ini pertama ,  mengukur proporsi variasi variable terikat yang dijelaskan oleh variable-variabel bebasnya. Kedua,nilai  tergantung jumlah kuadrat factor residu.

5.9 Pelaporan Hasil-hasil Analisi Regresi

            Hasil-hasil analisis regresi dapat dilaporkan dalam bentuk (format) yang konvensional. Dalam praktek, koefesien-koefisien regresi bersama-sama dengan kesalahan standart nilai harus dilaporkan. Beberapa pakar ekonometrika sering menyertakan t-ratio dari koofisien taksiran sebagai pengganti kesalahan standart.

5.10 Aplikasi (Penerapan)

Contoh 1:

            Tentukan hasil-hasil regresi dari data 20 pasang pengamatan atas X dan Y.

            ∑Xi = 228, ∑Yi= 3121, ∑XiYi=38927, ∑X= 3204

Jawaban :

i.                    Penaksiran 

∑Xi= 228 ; n=20 ; sehingga 

∑Yi = 3121 ; n=20 ; sehingga 

Dari (5.5), = 156,05 – (5,54) (11,40) = 92,95

Maka hasl taksiran regresi adalah :

              92,95 = 5,54 Xi

(ii). Penaksiran Varian

Var () =  ) dan Var  ) = 

Oleh karena  tidak diketahui, maka dapat disubsitusikan  yang tidak bias bagi varian factor gangguan ke dalam persamaan diatas sehingga :

Var () =  ) dan Var  ) = 

Dimana ,  = 

            = 

                = 

Sehingga :

            Var  = 70,82 [  = 4,38

dan

            Var (

(iii) Penetapan interval Keyakinan

            Misalnya, ingin ditetapkan suatu interval keyakinan untuk pada tingkat probabilitas p = 0,95. Dengan kata lain, ingin diperolah nilai t yang membatasi 0,025 area di kedua sisi distribusi. Dengan derajat bebas = 18m, lihat baris ke-18 dan kolom dengan tanda ‘0,025’ pada table-t. Nilai oada koordinat adalah 2,101.

            Oleh karena itu , 95% interval keyakinan untuk  adalah :

92,95 – (2,101)(4,38)  (2,101)(4,38)

83,75  α 

Dan : 5,54 – (2,101)(0,34)  β  5,54 +(2,101)(4,38)

            4,38  β 

(iv). Pengujian Hipotesis

Diketahui Ho : β = 0

               Ho ≠ 0

Diatas telah ditentukan daerah penerimaan pada tingkat signifikansi 5% sebagai :

            - [SE() ≤  ≤ +  [SE()]

Atau :

            -≤  + 

             =  = 16,29 ;   (n=18) = 2,101

Oleh karena nilai 16,29 terletak diluar daerah penerimaan , maka hipotesis yang menyatakan tidak ada hubungan antara X dan Y, yakni Ho, ditolak.

Contoh :

Tabel berikut menyajikan produk nasional bruto (X) dan permintaan makanan (Y) diukur dalam satuan-satuan arbitrary. Data tersebut berasal dari sebuah Negara yang sedang berkembang, yang meliputi periode 10 tahun. Taksir fungsi perminataan akan makanan : Y = α+ βX + U

Tabel 5.1

Data dan Perhitungan untuk Penaksiran Fungsi Makanan : Y = α + βX + U

n

Yi

Xi

Xi2

Xi.Yi

Yi=(Y1-Y1 ̅)

Xi=(X1-X ̅)

Xi.Yi

Xi2

Ŷ=(α ̂+ β ̂X1)

ei =( Y1-Ŷ)

ei2

1

6

50

2500

300

-2,8

-9,6

26,88

92,16

6,846

-0,846

0,715716

2

7

52

2704

364

-1,8

-7,6

13,68

57,76

7,2526

-0,2526

0,06380676

3

8

55

3025

440

-0,8

-4,6

3,68

21,16

7,8625

0,1375

0,01890625

4

10

59

3481

590

1,2

-0,6

-0,72

0,36

8,6757

1,3243

1,75377049

5

8

57

3249

456

-0,8

-2,6

2,08

6,76

8,2691

-0,2691

0,07241481

6

9

58

3364

522

0,2

-1,6

-0,32

2,56

8,4724

0,5276

0,27836176

7

10

62

3844

620

1,2

2,4

2,88

5,76

9,2856

0,7144

0,51036736

8

9

65

4225

585

0,2

5,4

1,08

29,16

9,8955

-0,8955

0,80192025

9

11

68

4624

748

2,2

8,4

18,48

70,56

10,5054

0,4946

0,24462916

10

10

70

4900

700

1,2

10,4

12,48

108,16

10,912

-0,912

0,831744

JUMLAH

88

596

35916

5325

-7,1054E-15

-1,42109E-14

80,2

394,4

87,9768

0,0232

5,29163684

RATA-RATA

8,8

59,6

3591,6

532,5

-7,1054E-16

-1,42109E-15

8,02

39,44

8,79768

0,00232

0,529163684

β

0,203347

α

-3,31947

Ringkasan hasil analisi regresinya adalah :

= -3,32 + 0,2033 Xi                                                            = 0,76

SE (

t*               -1,35 4,98

            = 0,76 menunujukkan bahwa 76% variasi total pada Y dapat dijelaskan oleh variasi X. pada tingkat signifikansi 5% hanya yang berarti secara statistic, sedangkan  tidak signifikan.

Welcome to SHAZAM - Version 10.0 -  APR+2008 SYSTEM=WIN-NT  PAR= 22480 - 03/11/15 21:26:40

 |_SAMPLE 1 10

 |_READ Y X

    2 VARIABLES AND       10 OBSERVATIONS STARTING AT OBS      1

 |_*

 |_*CREATING SOME VARIABLE

 |_OLS Y X/MAX DN

 REQUIRED MEMORY IS PAR=       1 CURRENT PAR=   22480

  OLS ESTIMATION

        10 OBSERVATIONS     DEPENDENT VARIABLE= Y

 ...NOTE..SAMPLE RANGE SET TO:      1,     10

  R-SQUARE =   0.7550     R-SQUARE ADJUSTED =   0.7244

 VARIANCE OF THE ESTIMATE-SIGMA**2 =  0.52916

 STANDARD ERROR OF THE ESTIMATE-SIGMA =  0.72743

 SUM OF SQUARED ERRORS-SSE=   5.2916

 MEAN OF DEPENDENT VARIABLE =   8.8000

 LOG OF THE LIKELIHOOD FUNCTION = -11.0070

 MODEL SELECTION TESTS - SEE JUDGE ET AL. (1985,P.242)

  AKAIKE (1969) FINAL PREDICTION ERROR - FPE =     0.63499

     (FPE IS ALSO KNOWN AS AMEMIYA PREDICTION CRITERION - PC)

  AKAIKE (1973) INFORMATION CRITERION - LOG AIC = -0.23647

  SCHWARZ (1978) CRITERION - LOG SC =             -0.17595

 MODEL SELECTION TESTS - SEE RAMANATHAN (1998,P.165)

  CRAVEN-WAHBA (1979)

     GENERALIZED CROSS VALIDATION - GCV =          0.82681

  HANNAN AND QUINN (1979) CRITERION =              0.73871

  RICE (1984) CRITERION =                          0.88193

  SHIBATA (1981) CRITERION =                       0.74082

  SCHWARZ (1978) CRITERION - SC =                  0.83866

  AKAIKE (1974) INFORMATION CRITERION - AIC =      0.78941

                      ANALYSIS OF VARIANCE - FROM MEAN

                       SS         DF            MS                 F

 REGRESSION        16.308          1.       16.308                30.820

 ERROR             5.2916         10.      0.52916               P-VALUE

 TOTAL             21.600          9.       2.4000                 0.000

                      ANALYSIS OF VARIANCE - FROM ZERO

                       SS         DF            MS                 F

 REGRESSION        790.71          2.       395.35               747.138

 ERROR             5.2916         10.      0.52916               P-VALUE

 TOTAL             796.00         10.       79.600                 0.000

                              ASYMPTOTIC

 VARIABLE   ESTIMATED  STANDARD   T-RATIO        PARTIAL STANDARDIZED ELASTICITY

   NAME    COEFFICIENT   ERROR   --------   P-VALUE CORR. COEFFICIENT  AT MEANS

 X         0.20335     0.3663E-01   5.552     0.000 0.891    0.8689     1.3772

 CONSTANT  -3.3195      2.195      -1.512     0.130-0.471    0.0000    -0.3772

 VARIANCE-COVARIANCE MATRIX OF COEFFICIENTS

 X         0.13417E-02

 CONSTANT -0.79964E-01   4.8188

              X            CONSTANT

 CORRELATION MATRIX OF COEFFICIENTS

 X          1.0000

 CONSTANT -0.99449       1.0000

              X            CONSTANT

     OBS.   OBSERVED     PREDICTED   CALCULATED

      NO.    VALUE        VALUE       RESIDUAL

       1    6.0000       6.8479     -0.84787              *    I

       2    7.0000       7.2546     -0.25456                  * I

       3    8.0000       7.8646      0.13540                   I*

       4    10.000       8.6780       1.3220                   I        *

       5    8.0000       8.2713     -0.27130                  * I

       6    9.0000       8.4746      0.52535                   I   *

       7    10.000       9.2880      0.71197                   I    *

       8    9.0000       9.8981     -0.89807              *    I

       9    11.000       10.508      0.49189                   I  *

      10    10.000       10.915     -0.91481              *    I

 DURBIN-WATSON = 2.1966    VON NEUMANN RATIO = 2.4406    RHO = -0.29136

 RESIDUAL SUM =  0.44409E-14  RESIDUAL VARIANCE =  0.52916

 SUM OF ABSOLUTE ERRORS=   6.3732

 R-SQUARE BETWEEN OBSERVED AND PREDICTED = 0.7550

 RUNS TEST:    7 RUNS,    5 POS,    0 ZERO,    5 NEG  NORMAL STATISTIC =  0.6708

 COEFFICIENT OF SKEWNESS =   0.2471 WITH STANDARD DEVIATION OF 0.6870

 COEFFICIENT OF EXCESS KURTOSIS =  -0.9781 WITH STANDARD DEVIATION OF 1.3342

 JARQUE-BERA NORMALITY TEST- CHI-SQUARE(2 DF)=    0.5753 P-VALUE= 0.750

      GOODNESS OF FIT TEST FOR NORMALITY OF RESIDUALS -  6 GROUPS

 OBSERVED  0.0  3.0  2.0  4.0  1.0  0.0

 EXPECTED  0.2  1.4  3.4  3.4  1.4  0.2

 CHI-SQUARE =    3.2183 WITH  2 DEGREES OF FREEDOM, P-VALUE= 0.200

 ..COMPLETED..
Tabel 5.1
Data dan Perhitungan untuk Penaksiran Fungsi Makanan : Y = α + βX + U

n	Yi	Xi	Xi²	Xi.Yi	Yi=(Y1-Y1 ̅)	Xi=(X1-X ̅)	Xi.Yi	Xi²	Ŷ=(α ̂+ β ̂X1)	ei =( Y1-Ŷ)	ei²
1	6	50	2500	300	-2,8	-9,6	26,88	92,16	6,846	-0,846	0,715716
2	7	52	2704	364	-1,8	-7,6	13,68	57,76	7,2526	-0,2526	0,06380676
3	8	55	3025	440	-0,8	-4,6	3,68	21,16	7,8625	0,1375	0,01890625
4	10	59	3481	590	1,2	-0,6	-0,72	0,36	8,6757	1,3243	1,75377049
5	8	57	3249	456	-0,8	-2,6	2,08	6,76	8,2691	-0,2691	0,07241481
6	9	58	3364	522	0,2	-1,6	-0,32	2,56	8,4724	0,5276	0,27836176
7	10	62	3844	620	1,2	2,4	2,88	5,76	9,2856	0,7144	0,51036736
8	9	65	4225	585	0,2	5,4	1,08	29,16	9,8955	-0,8955	0,80192025
9	11	68	4624	748	2,2	8,4	18,48	70,56	10,5054	0,4946	0,24462916
10	10	70	4900	700	1,2	10,4	12,48	108,16	10,912	-0,912	0,831744
JUMLAH	88	596	35916	5325	-7,1054E-15	-1,42109E-14	80,2	394,4	87,9768	0,0232	5,29163684
RATA-RATA	8,8	59,6	3591,6	532,5	-7,1054E-16	-1,42109E-15	8,02	39,44	8,79768	0,00232	0,529163684

β	0,203347
α	-3,31947
Jumat, 10 April 2015

EKONOMETRIKA BAB 5 ANALISIS REGRESI SEDERHANA