BilgiTeknoloji.net    
b i l g i   t e k n o l o j i   y a z ı l ı m

Ana Sayfa

Marjinal XML Access Pratik Uygulamalar Projeler Ekonometri Dilimiz Çetrefil İletişim
 

4. DEĞİŞEN VARYANS (Heteroskedasticity)

Ekonometrik Testler ana sayfa


4.1. DEĞİŞEN VARYANS TESTLERİ
      4.1.1. Park Testi
      4.1.2. Glejser Testi
      4.1.3. Harrison – McCabe Testi
      4.1.4. Goldfeld – Quandt Testi (GQ)
      4.1.5. Breusch – Pagan – Godfrey Testi (BPG)
      4.1.6. White Testi
      4.1.7. Bartlett Testi
      4.1.8. Spearman Sıra Korelasyon Testi
      4.1.9. ARCH (LM) ve GARCH Testleri
4.2. DEĞİŞEN VARYANSIN DÜZELTİLMESİ
      4.2.1. Varyansın Bilindiği Durumda Tartılı EKK
      4.2.2. Varyansın Bilinmediği Durumda Değişen Varyansın Yapısı


Değişen varyans hata teriminin varyansının tüm gözlemler için aynı olmaması durumudur.

E( ui2 ) = σ2 ise Sabit varyans
E( ui2 ) = σi2 ise Değişen varyans (Heteroskedasite)

Xi değerlerine bağlı olarak Yi’nin koşullu varyansı, X değişkeni hangi değerleri alırsa alsın değişmemeli, yani sabit varyanslı olmalıdır. Ortalama değişse bile ortalama etrafındaki dağılım değişmemelidir. Aksi halde değişen varyans durumundan söz edilir.

E( ui2 ) = σ2.f(Xi)
 

Değişen Varyansın Nedenleri

1 - Hatasını öğrenen modeller: Araba kullanma tecrübesi arttıkça hem trafik hataları hem de bunların varyansı azalır. Ayrıca dersi alttan alan bir öğrencinin artık hatasını bildiği için ikinci sefer ortalamasını yükseltebilir. Böylece ilk kez alanlarla arasında fark oluşur. (Hele yaş haddinden dolayı okuldan çıkarılıp askere alınmak üzere olan biri olduğunda çok daha fazla çalışması gerekecektir.)

2 - Veri derleme teknikleri: Veri derleme teknikleri geliştikçe varyans küçülür. Yani artık ortalamadan çok fazla sapma oluşmaz.

3 - Dışa düşenlerin varlığı (outliers): Serinin çok uçtaki aşırı değerleri ortalamadan sapmalara neden olur.

4 - Model kurma hataları: Özellikle gerekli açıklayıcı değişkenlerden biri ihmal edildiğinde de değişen varyansa rastlanmaktadır.

Değişen varyans durumunda EKK tahmincileri doğrusal ve sapmasızdır ama etkin değildir. Yani EDST (BLUE) değildir. Parametre tahmincilerinin varyansları da olduğundan büyük çıkar. Bunun sonucunda t testi sonucu olduğundan küçük bulunur. Yani anlamlı bir katsayının anlamsız olarak yorumlanması muhtemeldir.

Basit regresyonda t2 = F olduğu için F testi de yanıltıcı olur.

Değişen varyans araştırması için grafik yöntemi ve bazı testler kullanılmaktadır. Grafik üzerindeki değişkenin durumuna göre hata teriminin artan veya azalan olmaması, sabit olup belli bir ortalama etrafında dağılması gerekir.

PARAMETRİK TESTLER

EKK’ya Dayalı

Park testi
Glejser testi
Golfeld-Quandt testi
Breush-Pagan-Godfrey
White testi
Harrison-Mccabe testi
Bartlett testi
Reset testi

Maksimum Olabilirliğe Dayalı

LR (Olabilirlik oranı) testi
LM (Lagrange çarpanı) testi
Wald testi

Arch-Garch testi

NON-PARAMETRİK TESTLER (Parametrik Olmayan)

Sıra Korelasyon Testi

Peak Testi


Tüm bu testler için geçerli olan hipotezler şunlardır :

H0: E( ui2 ) = σ2 Xi’ye bağlı olarak hata terimlerinin varyansı değişmez. Değişen varyans yoktur.
Ha: E( ui2 ) = σ 2. f (xi) Xi’ye bağlı olarak hata terimlerinin varyansı değişir. Değişen varyans vardır.

 

4.1. DEĞİŞEN VARYANS TESTLERİ

4.1.1. Park Testi

Park testi hata teriminin varyansı ile açıklayıcı değişkenler arasında aşağıdaki gibi bir ilişki olduğunu varsayar:

E(ui2) = σ2 . f(Xi)
σi2 = σ2 . Xi β . eui
lnσi2 = lnσ2 + β.lnXi + ui
ln
σi2 = α+ β.lnXi + ui


Bu test için önce orijinal denklem EKK ile tahmin edilir ve u
i‘ler bulunup ln(ui2) hesaplanır. Sonra ln(ui2) ‘nin bağımlı, açıklayıcı değişkenlerin ln’lerinin bağımsız değişken olduğu yardımcı regresyon modeli EKK ile tahmin edilir.

Bundan sonra yapılacak iş modeldeki bağımsız değişkenlerin katsayılarının anlamlılığını incelemektir. Eğer katsayı anlamsızsa hata teriminin varyansı o açıklayıcı değişkene bağlı olarak değişmemektedir. Yani değişen varyans yoktur. Tersi durumda değişen varyans vardır.

Eğer birden fazla açıklayıcı değişken varsa her bir değişken için ayrı ayrı değişen varyans incelenir veya modeldeki açıklayıcı değişkenleri temsilen bağımlı değişkenin tahmin değerleri kullanılabilir.

Park testinde hata teriminin varyansını temsil için ûi2 ’ler kullanılır. Yani buradaki sapmalar varyansın karşılığı olarak yorumlanmaktadır.

lnσi2 = lnûi2
lnûi2
= α + β.lnXi

β tahmincisine t-testi uygulandığında anlamlı çıkarsa, ui ile Xi arasında anlamlı bir ilişki olur. Dolayısıyla X’e bağlı olarak σ2 de değişim gösterir.

Her Xi değişkeni için bu test ayrı ayrı uygulanır.
 

> ls LOG_VADELI c LOG_GSMH LOG_DOVIZ LOG_TEFE
> genr resid2 = resid
> ls log(resid2^2) c log(LOG_GSMH)

Dependent Variable: LOG(RESID2^2)
Method: Least Squares
Date: 02/09/06 Time: 13:20
Sample: 1987 2004
Included observations: 18

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C

-4.367474

0.913794

-4.779494

0.0002

LOG(LOG_GSMH)

-0.246477

0.553555

-0.445262

0.6621

R-squared

0.012239

Mean dependent var

-4.740045

Adjusted R-squared

-0.049496

S.D. dependent var

1.520954

S.E. of regression

1.558140

Akaike info criterion

3.829301

Sum squared resid

38.84479

Schwarz criterion

3.928232

Log likelihood

-32.46371

F-statistic

0.198258

Durbin-Watson stat

1.605808

Prob(F-statistic)

0.662096


> ls LOG_VADELI c LOG_GSMH LOG_DOVIZ LOG_TEFE
> genr resid2 = resid
> ls log(resid2^2) c log(LOG_TEFE)

Dependent Variable: LOG(RESID2^2)
Method: Least Squares
Date: 02/09/06 Time: 13:21
Sample: 1987 2004
Included observations: 18

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C

-1.359815

3.472543

-0.391590

0.7005

LOG(LOG_TEFE)

-2.447715

2.501092

-0.978659

0.3423

R-squared

0.056480

Mean dependent var

-4.740045

Adjusted R-squared

-0.002490

S.D. dependent var

1.520954

S.E. of regression

1.522847

Akaike info criterion

3.783479

Sum squared resid

37.10499

Schwarz criterion

3.882409

Log likelihood

-32.05131

F-statistic

0.957773

Durbin-Watson stat

1.660597

Prob(F-statistic)

0.342315

 

LOG_GSMH ve LOG_TEFE değişkenleri hata terimleri ile bağlantılı çıkmamıştır.

 

4.1.2. Glejser Testi

Glejser testi değişen varyansı, hata terimlerinin varyansı ile bağımsız değişkenler arasındaki farklı kalıptaki ilişkilerle açıklamaktadır.

Xi bağımsız değişkenleri arasındaki ilişki Glejser testine göre çeşitli fonksiyonel şekillerle ele alınabilir. Park testinden farklı olarak bu testte hata teriminin varyansının temsilcisi, varyans σ2 yerine kalıntıların mutlak değeri |ûi| olarak alınır.

Önce orijinal denklemden kalıntılar hesaplanır. Sonra |ûi| nin bağımlı, diğer değişkenlerden birinin bağımsız olduğu model EKK ile tahmin edilip eğim parametresinin anlamlılığı incelenir.

Eğer eğim parametresi istatistiksel olarak anlamsızsa açıklayıcı değişkenlere göre değişen varyans yoktur. Tersi durumda değişen varyans söz konusudur. Çoklu regresyonlarda değişen varyans bağımsız değişkenlere göre ayrı ayrı incelenir.

 

> ls LOG_VADELI c LOG_GSMH LOG_DOVIZ LOG_TEFE
> genr resid2 = @abs(resid)
> ls resid2 c LOG_GSMH
> ls resid2 c 1/LOG_GSMH
> ls resid2 c @sqrt(LOG_GSMH)
> ls resid2 c 1/@sqrt(LOG_GSMH)
> ls resid2 c LOG_DOVIZ
> ls resid2 c 1/LOG_DOVIZ
> ls resid2 c @sqrt(LOG_DOVIZ)
> ls resid2 c 1/@sqrt(LOG_DOVIZ)
> ls resid2 c LOG_TEFE
> ls resid2 c 1/LOG_TEFE
> ls resid2 c @sqrt(LOG_TEFE)
> ls resid2 c 1/@sqrt(LOG_TEFE)

Dependent Variable: RESID2
Method: Least Squares
Date: 02/09/06 Time: 14:25
Sample(adjusted): 2001 2004
Included observations: 4 after adjusting endpoints

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C

0.364649

0.126745

2.877017

0.1026

1/@SQRT(LOG_DOVIZ)

-0.142178

0.071144

-1.998467

0.1837

R-squared

0.666326

Mean dependent var

0.114230

Adjusted R-squared

0.499489

S.D. dependent var

0.053853

S.E. of regression

0.038099

Akaike info criterion

-3.390380

Sum squared resid

0.002903

Schwarz criterion

-3.697233

Log likelihood

8.780760

F-statistic

3.993870

Durbin-Watson stat

2.647740

Prob(F-statistic)

0.183712

Bir değişken her fonksiyonel şekilde uygulandığında mutlak hata terimleri @abs(resid) ile bağımsız çıkıyorsa bu değişken için değişen varyans yok demektir.

 

4.1.3. Harrison – McCabe Testi

Bu testte değişen varyansa neden olan açıklayıcı değişkenler ve buna karşılık gelen gözlemler küçükten büyüğe sıralanır. Ardından p >k+1 olmak koşuluyla ilk p adet gözlem için regresyon denklemi EKK ile tahmin edilip SSRp bulunur. Sonra tüm gözlem değerleri kullanılarak orijinal regresyon modeli tahmin edilip genel SSR bulunur.

Test istatistiği: HM = SSRbüyük /SSRküçük

Eğer iki değer de eşit olursa değişen varyans yoktur. Bu oran değeri 1’den büyüyerek uzaklaştıkça değişen varyans oluşmaya başlar.

F tablo değerleri kullanılarak değerleri bulunur. (s.d.= n-p ; n-p-k-1)

HM > QHMu ise değişen varyans yoktur,sabit varyans vardır.

HM < QHML ise değişen varyans vardır.

QHML < HM < QHMu ise kararsız. Bu durumda Goldfeld-Quandt ya da Sıra Korelasyon testine başvurulur.

k:4 olduğundan p > k+1 koşulu dolayısıyla p:6 olarak alıyoruz.

Dependent Variable: LOG_VADELI
Method: Least Squares
Date: 02/09/06 Time: 21:52
Sample: 1987 1992
Included observations: 6

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C

-1.930846

4.429123

-0.435943

0.7054

LOG_GSMH

1.247759

0.393929

3.167473

0.0869

LOG_DOVIZ

-0.310270

0.530697

-0.584645

0.6180

LOG_TEFE

0.205791

0.124772

1.649339

0.2409

R-squared

0.999073

Mean dependent var

3.514755

Adjusted R-squared

0.997682

S.D. dependent var

1.010174

S.E. of regression

0.048637

Akaike info criterion

-2.974151

Sum squared resid

0.004731

Schwarz criterion

-3.112978

Log likelihood

12.92245

F-statistic

718.3030

Durbin-Watson stat

3.282296

Prob(F-statistic)

0.001391

SSRp : 0,004731
SSR: 0,314403

HM = 0,314403 / 0,004731 = 66,456

Bu testte amaç varyansın p gözlem ve n gözlem için değişip değişmediğini öğrenmektir.

 

4.1.4. Goldfeld – Quandt Testi (GQ)

Bu test bağımsız değişkenlerin artan değerleri için hata teriminin varyansının da anlamlı bir şekilde artıp artmadığını inceler. Xi ile σi2 arasında doğru yönlü bir ilişki olduğu varsayımına dayanır.

E ( ui2) = σi2 = σ2 . Xi2

İlk aşamada HM testinde olduğu gibi gözlemler açıklayıcı değişkene göre artan ya da azalan sıralanır. Birden fazla açıklayıcı değişken varsa ya herhangi bir açıklayıcı değişkene göre sıralama yapılır ya da her bir açıklayıcı değişken için test ayrı uygulanır. Sıralama yapıldıktan sonra ortadan p=n/5 adet gözlem çıkarılır. Başta ve sonda kalan gözlemler için ayrı tahminler yapılır. Kalan gözlem sayısının EKK tahmini için yeterli olmasına dikkat edilmelidir.

p = 18/5 ≈ 4

Verileri sıralamak için E-views’ta sort komutunu kullanacağız. Fakat bu işlem tüm serinin sırasını bozduğu için ek bir sıra sütunu açmakta fayda var. “data sira” komutu ile yeni bir veri alanı oluşturup buna sıra ile 1-18 arası sayıları yazıyoruz. Artık sort komutu ile gerçek sırayı bozduğumuzda “sort sira” komutu ile ilk haline döndürebiliriz.

> data sira
> Sira alanına 1-18 sayıları giriyoruz.
> sort gsmh
> show gsmh sira
> smpl 1987 1993
> ls LOG_VADELI c LOG_GSMH LOG_DOVIZ LOG_TEFE

Dependent Variable: LOG_VADELI
Method: Least Squares
Date: 02/09/06 Time: 19:57
Sample: 1987 1993
Included observations: 7

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C

-7.310957

10.56338

-0.692104

0.5386

LOG_GSMH

1.639742

0.954357

1.718165

0.1843

LOG_DOVIZ

-0.932105

1.269955

-0.733967

0.5161

LOG_TEFE

0.390927

0.290403

1.346154

0.2709

R-squared

0.994193

Mean dependent var

3.759835

Adjusted R-squared

0.988387

S.D. dependent var

1.127309

S.E. of regression

0.121483

Akaike info criterion

-1.082521

Sum squared resid

0.044275

Schwarz criterion

-1.113429

Log likelihood

7.788822

F-statistic

171.2198

Durbin-Watson stat

1.892736

Prob(F-statistic)

0.000750

> smpl 1998 2004
> ls LOG_VADELI c LOG_GSMH LOG_DOVIZ LOG_TEFE

Dependent Variable: LOG_VADELI
Method: Least Squares
Date: 02/09/06 Time: 19:58
Sample: 1998 2004
Included observations: 7

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C

12.46708

3.899900

3.196770

0.0495

LOG_GSMH

-0.048553

0.460983

-0.105325

0.9228

LOG_DOVIZ

0.848956

0.372377

2.279832

0.1070

LOG_TEFE

-0.414847

0.067144

-6.178489

0.0085

R-squared

0.994295

Mean dependent var

10.37699

Adjusted R-squared

0.988590

S.D. dependent var

0.755476

S.E. of regression

0.080698

Akaike info criterion

-1.900636

Sum squared resid

0.019537

Schwarz criterion

-1.931545

Log likelihood

10.65223

F-statistic

174.2836

Durbin-Watson stat

1.748905

Prob(F-statistic)

0.000730

 

LOG_VADELI = -7.310956721 + 1.639741932*LOG_GSMH - 0.9321052928*LOG_DOVIZ + 0.3909272899*LOG_TEFE
SSR1 = 0,044275

LOG_VADELI = 12.46708285 - 0.04855288298*LOG_GSMH + 0.8489558606*LOG_DOVIZ - 0.4148466033*LOG_TEFE
SSR2 = 0,19537

F = SSRbüyük / SSRküçük

Fhesap = 0,19537 / 0,044275 = 4,413
Ftablo(0,05; 9-2; 9-2) = 3,79

Fhesap < Ftablo ise Ho reddedilemez. Yani değişen varyans yoktur.

4,413 > 3,79 olduğu için modelimizde değişen varyans vardır. Yani karşılaştırılan iki parçanın ortalama hata kareleri birbirinden yeterince farklıdır.

 

4.1.5. Breusch – Pagan – Godfrey Testi (BPG)

Bu test hata terimlerinin normal dağıldığı varsayımına dayanır. Bu nedenle büyük hacimli modellerde uygulamak daha iyidir.

Çalışmanın başında Jarque Bera testini uygulayarak hata terimlerinin normal dağıldığını tespit etmiştik. Bu nedenle bu testi uygulayabiliriz. Aksi halde JB testinde normal dağılmadığını tespit etseydik BPG testini uygulayamazdık.

BPG testinde hata terimlerinin varyansının, açıklayıcı değişkenlerin farklı formlarının fonksiyonu olduğu varsayılır.

σi2(Pi) = β1+ β 2 Z2i+ β 3 Z3i+......+ β m Zm+ Vi

Buradaki Zi değişkenleri değişen varyansa neden olduğu düşünülen açıklayıcı değişkenleri temsil ediyor. Zi’ler açıklayıcı değişkenlerin farklı fonksiyonel şekillerini gösteriyor olabilir. Yani bunlar Xi , 1/Xi , ÖXi şeklinde olabilir.

Bu testin avantajı birden fazla değişkenin değişen varyansa yol açıp açmadığını inceleyebilmesidir.

Ho : a2 = a3 = ..... = am = 0   ise   Değişen varyans vardır.
Ha :
a2 ≠ a3 ≠ ..... ≠ am ≠ 0   ise   Değişen varyans yoktur.

Test uygulanırken önce hata teriminin varyansını temsil eden değişken olan Pi (si2) hesaplanır. Pi’yi bulmak için;

1 - Orijinal denklem EKK ile tahmin edilir ve buradan ûi ‘ler bulunur.
2 - Hata teriminin varyansının maksimum olabilirlik tahmincisi bulunur.

σ2 = toplam(ûi2) / n

3 - Hata teriminin varyansının progsisi bulunur.

Pi = ûi2 / σ2

4 - Pi’nin bağımlı değişken, şüphelenilen değişkenlerin bağımsız değişken olduğu model EKK ile tahmin edilir.

Pi = a1 + a2 Z2i + a3 Z3i + ...... + amZm

5 - BPG = SSEm / 2 => m-1 serbestlik dereceli Ki-kare tablo değeriyle karşılaştırılır.

BPG < K2m-1 ise değişen varyans yoktur.
BPG > K2m-1 ise değişen varyans vardır.
 

> ls LOG_VADELI c LOG_GSMH LOG_DOVIZ LOG_TEFE

SSR = 0.314403

σ2 = 0,314403 / 18 = 0,0175

> genr P = (resid^2)/0.0175
> ls P c LOG_TEFE LOG_DOVIZ

Dependent Variable: P
Method: Least Squares
Date: 02/09/06 Time: 23:22
Sample: 1987 2004
Included observations: 18

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C

-2.341102

9.586372

-0.244212

0.8106

LOG_GSMH

0.577865

1.239998

0.466021

0.6484

LOG_DOVIZ

-0.596548

1.269044

-0.470077

0.6455

LOG_TEFE

-0.382794

0.550600

-0.695229

0.4983

R-squared

0.035796

Mean dependent var

0.998106

Adjusted R-squared

-0.170819

S.D. dependent var

0.919216

S.E. of regression

0.994632

Akaike info criterion

3.020243

Sum squared resid

13.85011

Schwarz criterion

3.218103

Log likelihood

-23.18218

F-statistic

0.173251

Durbin-Watson stat

1.785549

Prob(F-statistic)

0.912701

SSEm = 14.06496
BPG = 14,06496 / 2 = 7,03248

m: 3
K20,05;3-1 = 5,991

BPG > K2 => Bu fonksiyonel şekilde değişen varyans vardır.

 

4.1.6. White Testi

Bu test normallik varsayımına dayanmaz. Test için önce orijinal regresyon denklemi EKK ile tahmin edilir ve ûi2’ler hesaplanır. ûi2’nin bağımlı, orijinal denklemdeki tüm bağımsız değişkenlerin birbirleriyle ikili çarpımlarının bağımsız değişken olduğu yardımcı model EKK ile tahmin edilir. Amaç eğim parametrelerinin birlikte sıfıra eşitliğini test etmektir.

m : yardımcı regresyon denklemindeki bağımsız değişken sayısı.

Ho : b2 = b3 =..... = 0
Ha : b2 | b3 |..... | farklı 0

n.R2 < K2m ) => Değişen varyans yoktur.
n.R2 > K2m => Değişen varyans vardır.
 

> ls LOG_VADELI c LOG_GSMH LOG_DOVIZ LOG_TEFE
> genr residW = resid
> ls residW c LOG_GSMH LOG_DOVIZ LOG_TEFE LOG_GSMH^2 LOG_TEFE^2 LOG_DOVIZ^2

LOG_GSMH*LOG_DOVIZ LOG_GSMH*LOG_TEFE LOG_DOVIZ*LOG_TEFE

Dependent Variable: RESIDW
Method: Least Squares
Date: 02/10/06 Time: 00:03
Sample: 1987 2004
Included observations: 18

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C

-35.16279

68.25199

-0.515191

0.6203

LOG_GSMH

9.487915

16.41714

0.577927

0.5792

LOG_DOVIZ

-10.08649

16.53457

-0.610024

0.5588

LOG_TEFE

2.015395

9.290723

0.216926

0.8337

LOG_GSMH^2

-0.714172

1.075052

-0.664314

0.5252

LOG_TEFE^2

-0.560597

0.344251

-1.628454

0.1421

LOG_DOVIZ^2

-0.845274

1.079536

-0.782997

0.4562

LOG_GSMH*LOG_DOVIZ

1.455419

2.173393

0.669653

0.5219

LOG_GSMH*LOG_TEFE

0.193801

1.339128

0.144722

0.8885

LOG_DOVIZ*LOG_TEFE

-0.262226

1.409169

-0.186086

0.8570

R-squared

0.589358

Mean dependent var

-1.72E-15

Adjusted R-squared

0.127386

S.D. dependent var

0.135994

S.E. of regression

0.127037

Akaike info criterion

-0.988495

Sum squared resid

0.129107

Schwarz criterion

-0.493844

Log likelihood

18.89646

F-statistic

1.275744

Durbin-Watson stat

1.373542

Prob(F-statistic)

0.370989

 

n.R2 = 18 * 0,589358 = 10,608
m:9
K29 =
16,919
n.R2 < 16,919 ise
Değişen varyans yoktur.

 

4.1.7. Bartlett Testi

Bartlett testi k sayıda alt örneklemin tek bir anakütleden gelip gelmediğini inceler. Her bir alt örneklemin varyansı anakütle varyansının tahmincisi olacağından Ho : s2 = s12 = s22 = ..... = sk2 test edilir. Ho reddedilirse değişen varyans vardır.

Test için ilk önce n sayıda gözlem k sayıda alt örneğe bölünür.

q / l < X2k-1 ise Ho reddedilemez. Sabit varyans vardır.
q / l > X2k-1 ise Ho ret. Değişen varyans vardır.
 

> ls LOG_VADELI c LOG_GSMH LOG_DOVIZ LOG_TEFE
> genr resid01 = resid
>show resid01 LOG_GSMH LOG_DOVIZ LOG_TEFE
> View / Test of Equality / Variance

Test for Equality of Variances Between Series
Date: 02/10/06 Time: 00:45
Sample: 1987 2004
Included observations: 18
Method

df

Value

Probability

Bartlett

3

108.5154

0.0000

Levene

(3, 68)

34.46967

0.0000

Brown-Forsythe

(3, 68)

31.71513

0.0000

         
Category Statistics
     

Mean Abs.

Mean Abs.

Variable

Count

Std. Dev.

Mean Diff.

Median Diff.

RESID01

18

0.135994

0.115937

0.115937

LOG_GSMH

18

2.689454

2.329911

2.321092

LOG_DOVIZ

18

2.659098

2.309823

2.309823

LOG_TEFE

18

0.520207

0.348804

0.327723

All

72

3.810306

1.276119

1.268644

Bartlett weighted standard deviation: 1.910044

 

4.1.8. Spearman Sıra Korelasyon Testi

Değişkenler arasındaki ilişkinin ölçülmesini sağlayan non-parametrik bir testtir. Küçük veya büyük örnekler için uygulanabilir.

Hata terimlerinin bağımsız değişkenlerle ilgisini araştırmak için kullanılır. Tüm bağımsız değişkenler için bu ilişki araştırılmalıdır.

Uygulamada önce orijinal model EKK yoluyla tahmin edilerek ûi kalıntıları bulunur. Sonra kalıntıların mutlak değeri |ûi| için sıra bozulmadan değer büyüklüğü sırasına göre herbiri için sıra numarası verilir. Karşılaştırılacak açıklayıcı değişken için de aynısı yapılır.

Birden fazla açıklayıcı değişken varsa her açıklayıcı değişken için ayrı bir rs değeri hesaplanacaktır.

Sıra korelasyon katsayısının anlamlılığını t-testi ile araştıracağız.

Ho: ρs = 0 ise rs istatistiksel olarak anlamsızdır, varyans sabittir.
Ha: ρs ≠ 0 ise rs istatistiksel olarak anlamlıdır, varyans değişir.


 

Şimdiye kadarki testler hakkında notlar:

Şimdiye kadarki testlerin çoğu her X için ayrı ayrı uygulanıyordu.
(VALD ve BPG hariç.)

Testlerin bir kısmı yardımcı regresyonun yapısından değişen varyans hakkında varsayımda bulunur.
(PARK yapar, GLEJSER yapmaz.)

İkinci gruptakiler X’in sıralanmasına dayanır. Küçük değerlerle büyük değerler arasındaki varyans farklı mı?
(GOLDFELD-QUANDT)

Parametrik olmayan
(SIRA KORELASYON)

Birden fazla X’in değişen varyansa neden olup olmadıkları aynı anda incelenir.
(BPG ve WHITE)

ARCH testi diğerlerinden çok farklı.
 

4.1.9. ARCH (LM) ve GARCH Testleri

(Auto-Regresive Conditional Heteroskedasticity - ARCH)
(Oto-regresif Koşullu Değişen Varyans - ORKDV)

Kalıntıların kendi geçmiş değerlerinin değişen varyansa yol açtığı varsayımına dayanır. Bu, hata teriminin varyansında ardışık bağımlılık (otokorelasyon) anlamına gelmektedir. Otokorelasyon daha çok zaman serilerinde, değişen varyans ise daha çok yatay kesit verilerinde karşılaşılan bir sorundur. Ancak hisse senedi fiyatları, döviz kurları, enflasyon oranları gibi finansal zaman serilerinde tahmin hataları bazı dönemlerde küçük, bazı dönemlerde büyük olabilmekte, bu da hata teriminin varyansının sabit değil dönemden döneme değişir olduğunu göstermektedir. Eğer st2 ve st-12 ilişkiliyse ARCH(1) söz konusudur.
 

Rölativite: Değişkenlik.
Otokorelasyon: Hata terimlerinin ardışık değerlerinin ilişkili olması.
Değişen Varyans: Hata terimi varyansının otokorelasyonlu olması, yani geçmiş değerleriyle ilişkili olması.
 

ARCH etkisi (ORKDV) varsa çözüm olarak ARCH modelleri kullanılabilir.

ARCH(p) => ût2 = a0 + a1 û2t-1 + a2 û2t-2 + ...... + ap û2t-p + vt
 

Bu modelin R2 değeri bulunup n.R2 ile K2p tablo değeri ile karşılaştırılır.

Ho : a1 = a2 = ....... = ap = 0
Ha :
a1 | a2 | ....... | ap |
farklı 0

n . R2 < K2p ise Ho reddedilemez. ARCH (p) etkisi yoktur.
n . R2 > K2p ise Ho reddedilir. ARCH (p) etkisi vardır. Yani otoregresif koşullu değişen varyanstan söz edilir.


Arch modelinin genelleştirilmiş haline GARCH (Genelleştirilmiş Otoregresif Koşullu Değişen Varyans - GORKDV) denir. Burada hata terimlerinin t dönemindeki koşullu varyansı, yalnız geçmişteki kareli hata terimlerine değil aynı zamanda geçmişteki koşullu varyanslara da bağlıdır.
 

> View / Residual Tests / ARCH LM Test

ARCH Test:
F-statistic

0.004516

Probability

0.947310

Obs*R-squared

0.005116

Probability

0.942977

         
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 02/10/06 Time: 02:40
Sample(adjusted): 1988 2004
Included observations: 17 after adjusting endpoints

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C

0.016129

0.006045

2.668380

0.0175

RESID^2(-1)

0.016890

0.251338

0.067200

0.9473

R-squared

0.000301

Mean dependent var

0.016434

Adjusted R-squared

-0.066346

S.D. dependent var

0.015954

S.E. of regression

0.016475

Akaike info criterion

-5.263821

Sum squared resid

0.004071

Schwarz criterion

-5.165796

Log likelihood

46.74248

F-statistic

0.004516

Durbin-Watson stat

1.836139

Prob(F-statistic)

0.947310

 

ARCH testimizi doğru uyguladığımızı test etmek için biz de hata terimi karesinin gecikmeli değerleri arasındaki ilişkiyi kendi EKK’mızı uygulayıp bazı verileri karşılaştırarak görelim.

> ls LOG_VADELI c LOG_GSMH LOG_DOVIZ LOG_TEFE
> genr resid2 = resid^2
> ls resid2 c resid2(-1)

Dependent Variable: RESID2
Method: Least Squares
Date: 02/10/06 Time: 02:44
Sample(adjusted): 1988 2004
Included observations: 17 after adjusting endpoints

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C

0.016129

0.006045

2.668380

0.0175

RESID2(-1)

0.016890

0.251338

0.067200

0.9473

R-squared

0.000301

Mean dependent var

0.016434

Adjusted R-squared

-0.066346

S.D. dependent var

0.015954

S.E. of regression

0.016475

Akaike info criterion

-5.263821

Sum squared resid

0.004071

Schwarz criterion

-5.165796

Log likelihood

46.74248

F-statistic

0.004516

Durbin-Watson stat

1.836139

Prob(F-statistic)

0.947310

 

ARCH sonuçlarındaki Obs*R-squared değeri bize n.R2’yi veriyor.

n.R2 = 0,005116
p: 1 (Gecikme uzunluğu)
K21 = 3,841

n.R2 < 3,841 => Ho reddedilemez. ARCH(1) etkisi yoktur.
 

ARCH(2) için;

> View / Residual Tests / ARCH LM Test / (Lags to include : 2)

ARCH Test:
F-statistic

1.557039

Probability

0.247626

Obs*R-squared

3.092032

Probability

0.213095

         
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 02/10/06 Time: 02:54
Sample(adjusted): 1989 2004
Included observations: 16 after adjusting endpoints

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C

0.022956

0.007006

3.276569

0.0060

RESID^2(-1)

0.087632

0.248214

0.353052

0.7297

RESID^2(-2)

-0.426950

0.244776

-1.744253

0.1047

R-squared

0.193252

Mean dependent var

0.017100

Adjusted R-squared

0.069137

S.D. dependent var

0.016232

S.E. of regression

0.015660

Akaike info criterion

-5.308000

Sum squared resid

0.003188

Schwarz criterion

-5.163140

Log likelihood

45.46400

F-statistic

1.557039

Durbin-Watson stat

2.303737

Prob(F-statistic)

0.247626

 

n.R2 = 3,092032
p: 1 (Gecikme uzunluğu)
K22 = 5,991

n.R2 < 5,991 => Ho reddedilemez. ARCH(2) etkisi de yoktur.

 

4.2. DEĞİŞEN VARYANSIN DÜZELTİLMESİ

Değişen varyans durumunda EKK tahmincileri etkinlik özelliğini kaybettiğinden EKK tahmin sonuçlarına güvenilemez. Dolayısıyla hata terimlerinin sabit varyansa sahip olmadığı tespit edilirse mutlaka düzeltme yapılmalıdır.

Varyans s i2 biliniyorsa:
- Varyans biliniyorsa Tartılı EKK (TEKK) uygulanır.

Varyans s i2 bilinmiyorsa:
- Önce değişen varyansın yapısı ile ilgili varsayımlarda bulunulur. Sonra TEKK uygulanır.
- Model tam logaritmik olarak tahmin edilir.
- Ancak model başlangıçta tam logaritmikse ve değişen varyans çıktıysa TEKK uygulanmaz.

Uygulamada varyans genelde bilinmez. Orjinal denklem tam logaritmik ise tekrar logaritmik yapmaya gerek yoktur. Ayrıca logaritmik değerler daha düşük olduğu için DV ile karşılaşma ihtimali pek yoktur.

Verilerdeki uç değerler DV’ye neden olabilir.

 

4.2.1. Varyansın Bilindiği Durumda Tartılı EKK

Bu durum teoride geçerlidir. Pratikte varyansın bilinmesi genelde mümkün değildir.

Uygulamada orjinal model varyansın kareköküne (si) bölünür.

Böylece bu yeni model EKK ile tahmin edildilğinde yeni hata terimlerinin varyansı ûi / si olacaktır. Ayrıca yeni modelde sabit parametre ortadan kalkar. Artık hata terimleri de sabit varyanslı olmuştur.

 

4.2.2. Varyansın Bilinmediği Durumda Değişen Varyansın Yapısı

1) E (ui2) = si2 = s2. Xi2

Hata teriminin varyansı açıklayıcı değişkenin karesiyle orantılı olarak değişiyor. Bu gibi durumlarda modelin tamamı, varyansın yanındaki ifadenin kareköküne bölünür.

si2 = s2. LOG_TEFEi2 için;
Yi = Yi / LOG_TEFEi

Modelimiz tümden LOG_TEFEi2değerine bölünmelidir. Bu durumda LOG_TEFE değerleri kendisine bölündüğü için oluşan 1 değerleri sabit terime kaymış olacak.
 

> ls LOG_VADELI/LOG_TEFE c LOG_GSMH/LOG_TEFE LOG_DOVIZ/LOG_TEFE

Dependent Variable: LOG_VADELI/LOG_TEFE
Method: Least Squares
Date: 02/10/06 Time: 04:43
Sample: 1987 2004
Included observations: 18

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C

-0.419499

0.099111

-4.232633

0.0007

LOG_GSMH/LOG_TEFE

1.456593

0.043424

33.54314

0.0000

LOG_DOVIZ/LOG_TEFE

-0.316280

0.054612

-5.791381

0.0000

R-squared

0.997390

Mean dependent var

1.853325

Adjusted R-squared

0.997042

S.D. dependent var

1.053146

S.E. of regression

0.057276

Akaike info criterion

-2.730844

Sum squared resid

0.049209

Schwarz criterion

-2.582448

Log likelihood

27.57759

F-statistic

2866.216

Durbin-Watson stat

1.259207

Prob(F-statistic)

0.000000

 

Düzeltme için model, değişen varyansa neden olan açıklayıcı değişkene bölünür. (Amaç si2 = s2 eşitliğine ulaşmak olduğu için; Var( ui / Xi ) = 1/ Xi2 . s2 .Xi2 = s2 bulunur.)

Özellikle Goldfeld – Quant testi sonucu değişen varyans bulunmuşsa bu varsayım kullanılmalıdır.

 

2) E (ui2) = si2 = s2. Xi

si2 = s2. LOG_TEFEi için;

Yi = Yi / √ LOG_TEFEi

 

> ls LOG_VADELI/@sqrt(LOG_TEFE) c LOG_GSMH/@sqrt(LOG_TEFE) LOG_DOVIZ/@sqrt(LOG_TEFE) LOG_TEFE/@sqrt(LOG_TEFE)

Dependent Variable: LOG_VADELI/@SQRT(LOG_TEFE)
Method: Least Squares
Date: 02/10/06 Time: 04:50
Sample: 1987 2004
Included observations: 18

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C

6.341259

1.597453

3.969607

0.0014

LOG_GSMH/@SQRT(LOG_TEFE)

0.700124

0.192268

3.641400

0.0027

LOG_DOVIZ/@SQRT(LOG_TEFE)

0.457552

0.197949

2.311465

0.0365

LOG_TEFE/@SQRT(LOG_TEFE)

-1.993024

0.407217

-4.894260

0.0002

R-squared

0.998247

Mean dependent var

3.615339

Adjusted R-squared

0.997871

S.D. dependent var

1.774053

S.E. of regression

0.081848

Akaike info criterion

-1.974775

Sum squared resid

0.093787

Schwarz criterion

-1.776915

Log likelihood

21.77298

F-statistic

2657.558

Durbin-Watson stat

1.538226

Prob(F-statistic)

0.000000

 

3) E(ui2) = si2 = s2. ( E(yi) )2

si2 = s2. E(LOG_VADELİi)2 için;

Yi = Yi / LOG_VADELİi

 

> ls LOG_VADELI/LOG_VADELI c LOG_GSMH/LOG_VADELI LOG_DOVIZ/LOG_VADELI LOG_TEFE/LOG_VADELI

Dependent Variable: LOG_VADELI/LOG_VADELI
Method: Least Squares
Date: 02/10/06 Time: 04:55
Sample: 1987 2004
Included observations: 18

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C

1.000000

4.01E-14

2.49E+13

0.0000

LOG_GSMH/LOG_VADELI

-1.92E-13

4.96E-14

-3.869550

0.0015

LOG_DOVIZ/LOG_VADELI

2.07E-14

5.58E-15

3.710904

0.0021

Mean dependent var

1.000000

S.D. dependent var

0.000000

S.E. of regression

7.12E-15

Sum squared resid

7.61E-28

Durbin-Watson stat

0.416537

     

 

Modele bu şekilde TEKK uygulandığında değişen varyans sorunu giderilmiş olur.

 

MODELİN TAM LOGARİTMİK OLARAK TAHMİN EDİLMESİ

Logaritmik dönüşüm değişken değerleri arasındaki farkı azaltır. Ancak orijinal model tam logaritmikse veya değişkenlerin içinde negatif değerler ya da sıfır değeri varsa bu düzeltme yöntemi kullanılamaz. Bizim orijinal modelimiz de tam logaritmik olduğundan bu düzeltme yöntemi kullanılmayacaktır.

 

Ekonometrik Testler ana sayfa

Serkan ŞAHİNOĞLU
http://BilgiTeknoloji.net
25.05.2006


http://BilgiTeknoloji.net