|
|
||||||||||||
|
4. DEĞİŞEN VARYANS (Heteroskedasticity)
E( ui2
) = σ2
ise
Sabit varyans Xi değerlerine bağlı olarak Yi’nin koşullu varyansı, X değişkeni hangi değerleri alırsa alsın değişmemeli, yani sabit varyanslı olmalıdır. Ortalama değişse bile ortalama etrafındaki dağılım değişmemelidir. Aksi halde değişen varyans durumundan söz edilir. E( ui2 )
= σ2.f(Xi) Değişen Varyansın Nedenleri 1 - Hatasını öğrenen modeller: Araba kullanma tecrübesi arttıkça hem trafik hataları hem de bunların varyansı azalır. Ayrıca dersi alttan alan bir öğrencinin artık hatasını bildiği için ikinci sefer ortalamasını yükseltebilir. Böylece ilk kez alanlarla arasında fark oluşur. (Hele yaş haddinden dolayı okuldan çıkarılıp askere alınmak üzere olan biri olduğunda çok daha fazla çalışması gerekecektir.) 2 - Veri derleme teknikleri: Veri derleme teknikleri geliştikçe varyans küçülür. Yani artık ortalamadan çok fazla sapma oluşmaz. 3 - Dışa düşenlerin varlığı (outliers): Serinin çok uçtaki aşırı değerleri ortalamadan sapmalara neden olur. 4 - Model kurma hataları: Özellikle gerekli açıklayıcı değişkenlerden biri ihmal edildiğinde de değişen varyansa rastlanmaktadır. Değişen varyans durumunda EKK tahmincileri doğrusal ve sapmasızdır ama etkin değildir. Yani EDST (BLUE) değildir. Parametre tahmincilerinin varyansları da olduğundan büyük çıkar. Bunun sonucunda t testi sonucu olduğundan küçük bulunur. Yani anlamlı bir katsayının anlamsız olarak yorumlanması muhtemeldir. Basit regresyonda t2 = F olduğu için F testi de yanıltıcı olur. Değişen varyans araştırması için grafik yöntemi ve bazı testler kullanılmaktadır. Grafik üzerindeki değişkenin durumuna göre hata teriminin artan veya azalan olmaması, sabit olup belli bir ortalama etrafında dağılması gerekir. PARAMETRİK TESTLER EKK’ya Dayalı Park testi Maksimum Olabilirliğe Dayalı LR (Olabilirlik oranı) testi Arch-Garch testi NON-PARAMETRİK TESTLER (Parametrik Olmayan) Sıra Korelasyon Testi Peak Testi
H0: E( ui2
) = σ2
Xi’ye bağlı olarak hata terimlerinin varyansı değişmez. Değişen varyans yoktur.
4.1.DEĞİŞEN VARYANS TESTLERİ4.1.1. Park TestiPark testi hata teriminin varyansı ile açıklayıcı değişkenler arasında aşağıdaki gibi bir ilişki olduğunu varsayar: E(ui2) =
σ2 . f(Xi)
Bundan sonra yapılacak iş modeldeki bağımsız değişkenlerin katsayılarının anlamlılığını incelemektir. Eğer katsayı anlamsızsa hata teriminin varyansı o açıklayıcı değişkene bağlı olarak değişmemektedir. Yani değişen varyans yoktur. Tersi durumda değişen varyans vardır. Eğer birden fazla açıklayıcı değişken varsa her bir değişken için ayrı ayrı değişen varyans incelenir veya modeldeki açıklayıcı değişkenleri temsilen bağımlı değişkenin tahmin değerleri kullanılabilir. Park testinde hata teriminin varyansını temsil için ûi2 ’ler kullanılır. Yani buradaki sapmalar varyansın karşılığı olarak yorumlanmaktadır. lnσi2
= lnûi2 β tahmincisine t-testi uygulandığında anlamlı çıkarsa, ui ile Xi arasında anlamlı bir ilişki olur. Dolayısıyla X’e bağlı olarak σ2 de değişim gösterir.Her Xi değişkeni için bu test ayrı ayrı uygulanır. > ls LOG_VADELI c LOG_GSMH LOG_DOVIZ LOG_TEFE
LOG_GSMH ve LOG_TEFE değişkenleri hata terimleri ile bağlantılı çıkmamıştır.
4.1.2. Glejser TestiGlejser testi değişen varyansı, hata terimlerinin varyansı ile bağımsız değişkenler arasındaki farklı kalıptaki ilişkilerle açıklamaktadır. Xi bağımsız değişkenleri arasındaki ilişki Glejser testine göre çeşitli fonksiyonel şekillerle ele alınabilir. Park testinden farklı olarak bu testte hata teriminin varyansının temsilcisi, varyans σ2 yerine kalıntıların mutlak değeri |ûi| olarak alınır.
Önce orijinal denklemden kalıntılar hesaplanır. Sonra |ûi| nin bağımlı, diğer değişkenlerden birinin bağımsız olduğu model EKK ile tahmin edilip eğim parametresinin anlamlılığı incelenir. Eğer eğim parametresi istatistiksel olarak anlamsızsa açıklayıcı değişkenlere göre değişen varyans yoktur. Tersi durumda değişen varyans söz konusudur. Çoklu regresyonlarda değişen varyans bağımsız değişkenlere göre ayrı ayrı incelenir.
> ls LOG_VADELI c LOG_GSMH LOG_DOVIZ LOG_TEFE
Bir değişken her fonksiyonel şekilde uygulandığında mutlak hata terimleri @abs(resid) ile bağımsız çıkıyorsa bu değişken için değişen varyans yok demektir.
4.1.3. Harrison – McCabe TestiBu testte değişen varyansa neden olan açıklayıcı değişkenler ve buna karşılık gelen gözlemler küçükten büyüğe sıralanır. Ardından p >k+1 olmak koşuluyla ilk p adet gözlem için regresyon denklemi EKK ile tahmin edilip SSRp bulunur. Sonra tüm gözlem değerleri kullanılarak orijinal regresyon modeli tahmin edilip genel SSR bulunur. Test istatistiği: HM = SSRbüyük /SSRküçük Eğer iki değer de eşit olursa değişen varyans yoktur. Bu oran değeri 1’den büyüyerek uzaklaştıkça değişen varyans oluşmaya başlar. F tablo değerleri kullanılarak değerleri bulunur. (s.d.= n-p ; n-p-k-1) HM > QHMu ise değişen varyans yoktur,sabit varyans vardır. HM < QHML ise değişen varyans vardır. QHML < HM < QHMu ise kararsız. Bu durumda Goldfeld-Quandt ya da Sıra Korelasyon testine başvurulur. k:4 olduğundan p > k+1 koşulu dolayısıyla p:6 olarak alıyoruz.
SSRp : 0,004731 HM = 0,314403 / 0,004731 = 66,456 Bu testte amaç varyansın p gözlem ve n gözlem için değişip değişmediğini öğrenmektir.
4.1.4. Goldfeld – Quandt Testi (GQ)Bu test bağımsız değişkenlerin artan değerleri için hata teriminin varyansının da anlamlı bir şekilde artıp artmadığını inceler. Xi ile σi2 arasında doğru yönlü bir ilişki olduğu varsayımına dayanır. E ( ui2) = σi2 = σ2 . Xi2 İlk aşamada HM testinde olduğu gibi gözlemler açıklayıcı değişkene göre artan ya da azalan sıralanır. Birden fazla açıklayıcı değişken varsa ya herhangi bir açıklayıcı değişkene göre sıralama yapılır ya da her bir açıklayıcı değişken için test ayrı uygulanır. Sıralama yapıldıktan sonra ortadan p=n/5 adet gözlem çıkarılır. Başta ve sonda kalan gözlemler için ayrı tahminler yapılır. Kalan gözlem sayısının EKK tahmini için yeterli olmasına dikkat edilmelidir. p = 18/5 ≈ 4 Verileri sıralamak için E-views’ta sort komutunu kullanacağız. Fakat bu işlem tüm serinin sırasını bozduğu için ek bir sıra sütunu açmakta fayda var. “data sira” komutu ile yeni bir veri alanı oluşturup buna sıra ile 1-18 arası sayıları yazıyoruz. Artık sort komutu ile gerçek sırayı bozduğumuzda “sort sira” komutu ile ilk haline döndürebiliriz. > data sira
> smpl 1998 2004
LOG_VADELI = -7.310956721 + 1.639741932*LOG_GSMH -
0.9321052928*LOG_DOVIZ + 0.3909272899*LOG_TEFE LOG_VADELI = 12.46708285 - 0.04855288298*LOG_GSMH +
0.8489558606*LOG_DOVIZ - 0.4148466033*LOG_TEFE F = SSRbüyük / SSRküçük Fhesap = 0,19537 / 0,044275 = 4,413 Fhesap < Ftablo ise Ho reddedilemez. Yani değişen varyans yoktur. 4,413 > 3,79 olduğu için modelimizde değişen varyans vardır. Yani karşılaştırılan iki parçanın ortalama hata kareleri birbirinden yeterince farklıdır.
4.1.5. Breusch – Pagan – Godfrey Testi (BPG)Bu test hata terimlerinin normal dağıldığı varsayımına dayanır. Bu nedenle büyük hacimli modellerde uygulamak daha iyidir. Çalışmanın başında Jarque Bera testini uygulayarak hata terimlerinin normal dağıldığını tespit etmiştik. Bu nedenle bu testi uygulayabiliriz. Aksi halde JB testinde normal dağılmadığını tespit etseydik BPG testini uygulayamazdık. BPG testinde hata terimlerinin varyansının, açıklayıcı değişkenlerin farklı formlarının fonksiyonu olduğu varsayılır. σi2(Pi) = β1+ β 2 Z2i+ β 3 Z3i+......+ β m Zm+ Vi Buradaki Zi değişkenleri değişen varyansa neden olduğu düşünülen açıklayıcı değişkenleri temsil ediyor. Zi’ler açıklayıcı değişkenlerin farklı fonksiyonel şekillerini gösteriyor olabilir. Yani bunlar Xi , 1/Xi , ÖXi şeklinde olabilir.Bu testin avantajı birden fazla değişkenin değişen varyansa yol açıp açmadığını inceleyebilmesidir. Ho : a2 = a3 = ..... = am = 0 ise Değişen varyans vardır.Ha : a2 ≠ a3 ≠ ..... ≠ am ≠ 0 ise Değişen varyans yoktur. Test uygulanırken önce hata teriminin varyansını temsil eden değişken olan Pi ( si2) hesaplanır. Pi’yi bulmak için;1 - Orijinal denklem EKK ile tahmin edilir ve buradan
ûi ‘ler bulunur. σ2 = toplam(ûi2) / n 3 - Hata teriminin varyansının progsisi bulunur. Pi = ûi2 / σ2 4 - Pi’nin bağımlı değişken, şüphelenilen değişkenlerin bağımsız değişken olduğu model EKK ile tahmin edilir. Pi = a1 + a2 Z2i + a3 Z3i + ...... + amZm 5 - BPG = SSEm / 2 => m-1 serbestlik dereceli Ki-kare tablo değeriyle karşılaştırılır. BPG < K2m-1 ise değişen
varyans yoktur. > ls LOG_VADELI c LOG_GSMH LOG_DOVIZ LOG_TEFE SSR = 0.314403 σ2 = 0,314403 / 18 = 0,0175> genr P = (resid^2)/0.0175
SSEm = 14.06496 m: 3 BPG > K2 => Bu fonksiyonel şekilde değişen varyans vardır.
4.1.6. White TestiBu test normallik varsayımına dayanmaz. Test için önce orijinal regresyon denklemi EKK ile tahmin edilir ve ûi2’ler hesaplanır. ûi2’nin bağımlı, orijinal denklemdeki tüm bağımsız değişkenlerin birbirleriyle ikili çarpımlarının bağımsız değişken olduğu yardımcı model EKK ile tahmin edilir. Amaç eğim parametrelerinin birlikte sıfıra eşitliğini test etmektir. m : yardımcı regresyon denklemindeki bağımsız değişken sayısı. Ho : b2 = b3
=..... = 0 n.R2 < K2m ) => Değişen varyans yoktur.n.R2 > K2m => Değişen varyans vardır. > ls LOG_VADELI c LOG_GSMH LOG_DOVIZ LOG_TEFE LOG_GSMH*LOG_DOVIZ LOG_GSMH*LOG_TEFE LOG_DOVIZ*LOG_TEFE
n.R2 = 18 * 0,589358 = 10,608
4.1.7. Bartlett TestiBartlett testi k sayıda alt örneklemin tek bir anakütleden gelip gelmediğini inceler. Her bir alt örneklemin varyansı anakütle varyansının tahmincisi olacağından Ho : s2 = s12 = s22 = ..... = sk2 test edilir. Ho reddedilirse değişen varyans vardır. Test için ilk önce n sayıda gözlem k sayıda alt örneğe bölünür.
q / l < X2k-1 ise Ho reddedilemez. Sabit varyans vardır.q / l > X2k-1 ise Ho ret. Değişen varyans vardır. > ls LOG_VADELI c LOG_GSMH LOG_DOVIZ LOG_TEFE
4.1.8. Spearman Sıra Korelasyon TestiDeğişkenler arasındaki ilişkinin ölçülmesini sağlayan non-parametrik bir testtir. Küçük veya büyük örnekler için uygulanabilir. Hata terimlerinin bağımsız değişkenlerle ilgisini araştırmak için kullanılır. Tüm bağımsız değişkenler için bu ilişki araştırılmalıdır. Uygulamada önce orijinal model EKK yoluyla tahmin edilerek ûi kalıntıları bulunur. Sonra kalıntıların mutlak değeri |ûi| için sıra bozulmadan değer büyüklüğü sırasına göre herbiri için sıra numarası verilir. Karşılaştırılacak açıklayıcı değişken için de aynısı yapılır.
Birden fazla açıklayıcı değişken varsa her açıklayıcı değişken için ayrı bir rs değeri hesaplanacaktır. Sıra korelasyon katsayısının anlamlılığını t-testi ile araştıracağız. Ho: ρs = 0 ise rs istatistiksel olarak anlamsızdır, varyans sabittir.Ha: ρs ≠ 0 ise rs istatistiksel olarak anlamlıdır, varyans değişir.
Şimdiye kadarki testler hakkında notlar: Şimdiye kadarki testlerin çoğu her X için ayrı ayrı
uygulanıyordu. Testlerin bir kısmı yardımcı regresyonun yapısından
değişen varyans hakkında varsayımda bulunur. İkinci gruptakiler X’in sıralanmasına dayanır. Küçük
değerlerle büyük değerler arasındaki varyans farklı mı? Parametrik olmayan Birden fazla X’in değişen varyansa neden olup olmadıkları
aynı anda incelenir. ARCH testi diğerlerinden çok farklı. 4.1.9. ARCH (LM) ve GARCH Testleri(Auto-Regresive Conditional Heteroskedasticity - ARCH) Kalıntıların kendi geçmiş değerlerinin değişen varyansa
yol açtığı varsayımına dayanır. Bu, hata teriminin varyansında ardışık
bağımlılık (otokorelasyon) anlamına gelmektedir. Otokorelasyon daha çok zaman
serilerinde, değişen varyans ise daha çok yatay kesit verilerinde karşılaşılan
bir sorundur. Ancak hisse senedi fiyatları, döviz kurları, enflasyon oranları
gibi finansal zaman serilerinde tahmin hataları bazı dönemlerde küçük, bazı
dönemlerde büyük olabilmekte, bu da hata teriminin varyansının sabit değil
dönemden döneme değişir olduğunu göstermektedir. Eğer
st2 ve st-12
ilişkiliyse ARCH(1) söz konusudur. Rölativite: Değişkenlik. ARCH etkisi (ORKDV) varsa çözüm olarak ARCH modelleri kullanılabilir. ARCH(p) => ût2 = a0 + a1
û2t-1 + a2 û2t-2 + ...... + ap û2t-p + vt Bu modelin R2 değeri bulunup n.R2 ile K2p tablo değeri ile karşılaştırılır. Ho : a1 =
a2 = ....... = ap = 0 n . R2 < K2p ise Ho
reddedilemez. ARCH (p) etkisi yoktur.
> View / Residual Tests / ARCH LM Test
ARCH testimizi doğru uyguladığımızı test etmek için biz de hata terimi karesinin gecikmeli değerleri arasındaki ilişkiyi kendi EKK’mızı uygulayıp bazı verileri karşılaştırarak görelim. > ls LOG_VADELI c LOG_GSMH LOG_DOVIZ LOG_TEFE
ARCH sonuçlarındaki Obs*R-squared değeri bize n.R2’yi veriyor. n.R2 = 0,005116
n.R2 < 3,841 => Ho
reddedilemez. ARCH(1) etkisi yoktur. ARCH(2) için; > View / Residual Tests / ARCH LM Test / (Lags to include : 2)
n.R2 = 3,092032 n.R2 < 5,991 => Ho reddedilemez. ARCH(2) etkisi de yoktur.
4.2.DEĞİŞEN VARYANSIN DÜZELTİLMESİDeğişen varyans durumunda EKK tahmincileri etkinlik özelliğini kaybettiğinden EKK tahmin sonuçlarına güvenilemez. Dolayısıyla hata terimlerinin sabit varyansa sahip olmadığı tespit edilirse mutlaka düzeltme yapılmalıdır. Varyans
s i2
biliniyorsa: Varyans
s i2
bilinmiyorsa: Uygulamada varyans genelde bilinmez. Orjinal denklem tam logaritmik ise tekrar logaritmik yapmaya gerek yoktur. Ayrıca logaritmik değerler daha düşük olduğu için DV ile karşılaşma ihtimali pek yoktur. Verilerdeki uç değerler DV’ye neden olabilir.
4.2.1. Varyansın Bilindiği Durumda Tartılı EKKBu durum teoride geçerlidir. Pratikte varyansın bilinmesi genelde mümkün değildir. Uygulamada orjinal model varyansın kareköküne (si) bölünür.
Böylece bu yeni model EKK ile tahmin edildilğinde yeni hata terimlerinin varyansı ûi / si olacaktır. Ayrıca yeni modelde sabit parametre ortadan kalkar. Artık hata terimleri de sabit varyanslı olmuştur.
4.2.2. Varyansın Bilinmediği Durumda Değişen Varyansın Yapısı 1) E (ui2) = si2 = s2. Xi2Hata teriminin varyansı açıklayıcı değişkenin karesiyle orantılı olarak değişiyor. Bu gibi durumlarda modelin tamamı, varyansın yanındaki ifadenin kareköküne bölünür. si2 = s2. LOG_TEFE i2 için;Yi = Yi / LOG_TEFEi Modelimiz tümden LOG_TEFEi2değerine bölünmelidir.
Bu durumda LOG_TEFE değerleri kendisine bölündüğü için oluşan 1 değerleri sabit
terime kaymış olacak. > ls LOG_VADELI/LOG_TEFE c LOG_GSMH/LOG_TEFE LOG_DOVIZ/LOG_TEFE
Düzeltme için model, değişen varyansa neden olan açıklayıcı değişkene bölünür. (Amaç si2 = s2 eşitliğine ulaşmak olduğu için; Var( ui / Xi ) = 1/ Xi2 . s2 .Xi2 = s2 bulunur.) Özellikle Goldfeld – Quant testi sonucu değişen varyans bulunmuşsa bu varsayım kullanılmalıdır.
2) E (ui2) = si2 = s2. Xi si2 = s2. LOG_TEFE i için;Yi = Yi / √ LOG_TEFEi
> ls LOG_VADELI/@sqrt(LOG_TEFE) c LOG_GSMH/@sqrt(LOG_TEFE) LOG_DOVIZ/@sqrt(LOG_TEFE) LOG_TEFE/@sqrt(LOG_TEFE)
3) E(ui2) = si2 = s2. ( E(yi) )2 si2 = s2. E(LOG_VADELİi )2 için;Yi = Yi / LOG_VADELİi
> ls LOG_VADELI/LOG_VADELI c LOG_GSMH/LOG_VADELI LOG_DOVIZ/LOG_VADELI LOG_TEFE/LOG_VADELI
Modele bu şekilde TEKK uygulandığında değişen varyans sorunu giderilmiş olur.
MODELİN TAM LOGARİTMİK OLARAK TAHMİN EDİLMESİ Logaritmik dönüşüm değişken değerleri arasındaki farkı azaltır. Ancak orijinal model tam logaritmikse veya değişkenlerin içinde negatif değerler ya da sıfır değeri varsa bu düzeltme yöntemi kullanılamaz. Bizim orijinal modelimiz de tam logaritmik olduğundan bu düzeltme yöntemi kullanılmayacaktır.
Serkan ŞAHİNOĞLU |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||