Multikollinearlıq fenomeni aşağıdakı kimidir. salam tələbə. Stokastik prosesin stasionarlığının əlamətləri. Ağ səs-küy nədir? səh.100

Çoxsaylı reqressiya tənliyini qurarkən amillərin multikollinearlığı problemi yarana bilər. multikollinearlıq funksional (açıq) və ya stoxastik (gizli) formada özünü göstərə bilən iki və ya daha çox izahlı dəyişənin xətti əlaqəsi adlanır.
Seçilmiş əlamətlər arasındakı əlaqənin müəyyən edilməsi və əlaqənin yaxınlığının kəmiyyətcə qiymətləndirilməsi metodlardan istifadə etməklə həyata keçirilir. korrelyasiya təhlili. Bu problemləri həll etmək üçün əvvəlcə təxmin edirik, sonra onun əsasında qismən və çoxlu korrelyasiya və təyinetmə əmsalları təyin edilir və onların əhəmiyyəti yoxlanılır. Korrelyasiya təhlilinin son məqsədi reqressiya tənliyinin sonrakı qurulması üçün x 1 , x 2 ,…,x m amil xüsusiyyətlərinin seçilməsidir.

Əgər faktor dəyişənləri ciddi funksional asılılıqla bağlıdırsa, onda onlar danışırlar tam multikollinearlıq. Bu halda faktorial dəyişənlərin matrisinin sütunları arasında X xətti olur asılı sütunlar, və matrisin təyinedicilərinin xassəsinə görə det(X T X) = 0 , yəni (X T X) matris degenerativdir və buna görə də tərs matris yoxdur. OLS qiymətləndirmələrinin qurulmasında (X T X) -1 matrisindən istifadə olunur. Beləliklə, tam multikollinearlıq ilkin reqressiya modelinin parametrlərini birmənalı qiymətləndirməyə imkan vermir.

Modelə daxil edilən amillərin multikollinearlığı hansı çətinliklərə gətirib çıxarır və onları necə həll etmək olar?

Multikollinearlıq arzuolunmaz nəticələrə səbəb ola bilər:

  1. parametr təxminləri etibarsız olur. Böyük standart səhvləri aşkar edirlər. Müşahidələrin həcminin dəyişməsi ilə təxminlər dəyişir (yalnız miqyasda deyil, həm də işarədə), bu da modeli təhlil və proqnozlaşdırma üçün yararsız edir.
  2. çoxlu reqressiyanın parametrlərini amillərin "saf" formada fəaliyyət xüsusiyyətləri kimi şərh etmək çətindir, çünki amillər korrelyasiya olunur; xətti reqressiya parametrləri iqtisadi mənasını itirir;
  3. amillərin fəaliyyət göstəricisinə təcrid olunmuş təsirini müəyyən etmək qeyri-mümkün olur.

Amil dəyişənlərinin bəzi stoxastik asılılıqla əlaqəli olduğu multikollinearlıq növü deyilir. qismən.Əgər amil dəyişənləri arasında yüksək korrelyasiya varsa, o zaman matrisa (X T X) degenerasiyaya yaxındır, yəni det(X T X) ≈ 0.
(X T X) -1 matrisi pis kondisioner olacaq ki, bu da OLS qiymətləndirmələrinin qeyri-sabitliyinə gətirib çıxarır. Qismən multikollinearlıq aşağıdakı nəticələrə gətirib çıxarır:

  • parametr qiymətləndirmələrinin fərqlərinin artması interval qiymətləndirmələrini genişləndirir və onların düzgünlüyünü pisləşdirir;
  • azalma t- əmsalların statistikası amillərin əhəmiyyəti haqqında yanlış nəticələrə gətirib çıxarır;
  • LSM qiymətləndirmələrinin qeyri-sabitliyi və onların dispersiyaları.

Qismən multikollinearlığın aşkarlanması üçün dəqiq kəmiyyət meyarları yoxdur. Multikollinearlığın mövcudluğu matrisin determinantının (X T X) sıfıra yaxınlığı ilə sübut edilə bilər. Qoşalaşmış korrelyasiya əmsallarının qiymətləri də araşdırılır. Əgər interfaktorial korrelyasiya matrisinin determinantı birliyə yaxındırsa, multikollinearlıq yoxdur.

Güclü çarpaz faktorial korrelyasiyanı aradan qaldırmaq üçün müxtəlif yanaşmalar mövcuddur. Onlardan ən sadəsi, modelin keyfiyyətinə cüzi ziyan vurmaq şərti ilə, multikollinearlığa ən çox cavabdeh olan amilin (və ya amillərin) modeldən çıxarılmasıdır (yəni, nəzəri təyinetmə əmsalı -R 2 y(x1...) xm) cüzi azalacaq) .

Multikollinearlıqdan xilas olmaq üçün hansı tədbir mümkün deyil?
a) nümunənin ölçüsünü artırmaq;
b) qalanlarla yüksək korrelyasiyaya malik dəyişənlərin xaric edilməsi;
c) modelin spesifikasiyasının dəyişməsi;
d) təsadüfi komponentin çevrilməsi.

Qoşalaşmış (xətti) və qismən korrelyasiya əmsalları

Bağlantının sıxlığı, məsələn, dəyərlər nümunəsi ilə x və y dəyişənləri arasında (x i, y i), i=1,n, (1)
burada x və y orta qiymətlər, S x və S y müvafiq nümunələrin standart kənarlaşmalarıdır.

Cütlük korrelyasiya əmsalı –1 ilə +1 arasında dəyişir. Mütləq dəyərdə birliyə nə qədər yaxındırsa, x və y arasındakı statistik asılılıq xətti funksional olana bir o qədər yaxındır. Əmsalın müsbət qiyməti əlamətlər arasındakı əlaqənin birbaşa olduğunu göstərir (x artdıqca y-nin qiyməti artır), mənfi qiymət tərs əlaqəni göstərir (x artdıqca y-nin dəyəri azalır).
Korrelyasiya əmsalının mümkün qiymətlərinin aşağıdakı keyfiyyət şərhini verə bilərik: əgər |r|<0.3 – связь практически отсутствует; 0.3≤ |r| < 0.7 - связь средняя; 0.7≤ |r| < 0.9 – связь сильная; 0.9≤ |r| < 0.99 – связь весьма сильная.
Faktorların multikollinearlığını qiymətləndirmək üçün x 1 , x 2 ,…, x m amil əlamətləri ilə asılı (nəticə) əlamətinin qoşalaşmış korrelyasiya əmsallarının matrisi istifadə olunur ki, bu da hər bir göstərici-amilin təsir dərəcəsini qiymətləndirməyə imkan verir. x j asılı dəyişən y, eləcə də amillər arasında əlaqələrin sıxlığı . Ümumi halda korrelyasiya matrisi formaya malikdir
.
Matris simmetrikdir, onun diaqonalında vahidlər var. Əgər matrisin faktorlararası korrelyasiya əmsalı r xjxi >0,7 olarsa, bu çoxlu reqressiya modelində multikollinearlıq mövcuddur.
Xüsusiyyətlərin əlaqəsinin qurulduğu ilkin məlumatlar müəyyən bir ümumi kütlədən bir nümunə olduğundan, bu məlumatlardan hesablanan korrelyasiya əmsalları seçici olacaq, yəni yalnız əlaqəni qiymətləndirir. Hesablamaların nəticələrinin təsadüfi olub-olmaması sualına cavab verən bir əhəmiyyət testi lazımdır.
Cütlük Korrelyasiya əmsallarının əhəmiyyəti tərəfindən yoxlanılır t- Tələbə meyarı. Ümumi korrelyasiya əmsalının sıfıra bərabərliyi haqqında fərziyyə irəli sürülür: H 0: ρ = 0. Sonra parametrlər təyin edilir: əhəmiyyət səviyyəsi α və sərbəstlik dərəcələrinin sayı v = n-2. Bu parametrlərdən istifadə edərək, Tələbə paylanmasının kritik nöqtələri cədvəlinə əsasən, t cr tapılır və mövcud məlumatlara əsasən, kriteriyanın müşahidə olunan dəyəri:
, (2)
burada r tədqiqat üçün seçilmiş məlumatlardan hesablanmış qoşa korrelyasiya əmsalıdır. Qoşalaşmış korrelyasiya əmsalı əhəmiyyətli hesab edilir (əmsalın sıfıra bərabər olması fərziyyəsi rədd edilir) γ = 1- α etibarlılıq ehtimalı ilə, əgər t Obs modulu t kritindən böyükdürsə.
Əgər dəyişənlər bir-biri ilə korrelyasiya edirsə, onda korrelyasiya əmsalının qiyməti digər dəyişənlərin təsiri ilə qismən təsirlənir.

Qismən korrelyasiya əmsalı digər amillərin təsiri aradan qaldırıldıqda nəticə ilə müvafiq amil arasında xətti əlaqənin sıxlığını xarakterizə edir. Qismən korrelyasiya əmsalı digər amillərin sabit dəyəri ilə iki dəyişən arasındakı əlaqənin yaxınlığını qiymətləndirir. Əgər, məsələn, r yx 1| x2 (x 2-nin sabit təsiri ilə y və x 1 arasında qismən korrelyasiya əmsalı), bu o deməkdir ki, y və x 1 arasındakı xətti əlaqənin kəmiyyət ölçüsü müəyyən edilir və bu, x 2-nin bu işarələrə təsiri olduqda baş verəcəkdir. aradan qaldırılır. Yalnız bir amil istisna edilərsə, alırıq birinci dərəcəli qismən korrelyasiya əmsalı.
Cüt və qismən korrelyasiya əmsallarının qiymətlərinin müqayisəsi sabit faktorun təsir istiqamətini göstərir. Əgər qismən korrelyasiya əmsalı r yx 1| olarsa x2 müvafiq cüt əmsaldan kiçik olacaq r yx 1 , bu o deməkdir ki, y və x 1 işarələri arasındakı əlaqə müəyyən dərəcədə sabit dəyişən x 2-nin onlara təsiri ilə bağlıdır. Və əksinə, cüt əmsalla müqayisədə qismən əmsalın daha böyük qiyməti sabit dəyişən x 2-nin təsiri ilə y və x 1 arasındakı əlaqəni zəiflətdiyini göstərir.
Bir amilin (x 1) təsirini istisna etdikdə iki dəyişən (y və x 2) arasındakı qismən korrelyasiya əmsalı aşağıdakı düsturla hesablana bilər:
. (3)
Digər dəyişənlər üçün düsturlar oxşar şəkildə qurulur. Sabit x 2 üçün
;
sabit x 3 üçün
.
Qismən korrelyasiya əmsallarının əhəmiyyəti cütlük korrelyasiya əmsallarına bənzər şəkildə yoxlanılır. Yeganə fərq, v = n - l -2-yə bərabər qəbul edilməli olan sərbəstlik dərəcələrinin sayıdır, burada l sabit amillərin sayıdır.

Addım-addım reqressiya

Çoxsaylı reqressiya modelinə daxil olan x 1 , x 2 , …, x m amillərinin seçilməsi ekonometrik modelləşdirmənin ən mühüm mərhələlərindən biridir. Faktorların modelə ardıcıl (addım-addım) daxil edilməsi (və ya xaric edilməsi) üsulu, mümkün dəyişənlər toplusundan modelin keyfiyyətini artıracaqları dəqiq seçməyə imkan verir.
Metod həyata keçirilərkən, korrelyasiya matrisi ilk addımda hesablanır. Qoşalaşmış korrelyasiya əmsalları əsasında kollinear amillərin mövcudluğu aşkar edilir. r xjxi >0,7 olarsa x i və x j faktorları kollinear kimi tanınır. Bir-biri ilə əlaqəli amillərdən yalnız biri modelə daxil edilmişdir. Faktorlar arasında kollinear amillər yoxdursa, o zaman əhəmiyyətli təsir göstərən hər hansı amillər y.

İkinci mərhələdə nəticə işarəsi ilə cüt korrelyasiya əmsalının maksimum mütləq qiymətinə malik olan bir dəyişənlə reqressiya tənliyi qurulur.

Üçüncü mərhələdə, əvvəllər təqdim edilmiş dəyişənin sabit təsiri ilə asılı dəyişən ilə qismən korrelyasiya əmsalının ən böyük mütləq qiymətinə malik olan yeni dəyişən modelə daxil edilir.
Modelə əlavə amil daxil edildikdə təyinetmə əmsalı artmalı, qalıq dispersiya isə azalmalıdır. Əgər bu baş vermirsə, yəni çoxlu təyinetmə əmsalı bir qədər artırsa, yeni amilin tətbiqi yersiz hesab olunur.

Nümunə №1. Bölgədəki 20 müəssisə üçün bir işçiyə düşən məhsulun y (min rubl) işçilərin ümumi sayındakı yüksək ixtisaslı işçilərin payından x1 (ilin sonunda vəsaitlərin dəyərinin %-i) və ondan asılılığını öyrənirik. yeni əsas vəsaitlərin istifadəyə verilməsi x2 (%) .

Y X1 X2
6 10 3,5
6 12 3,6
7 15 3,9
7 17 4,1
7 18 4,2
8 19 4,5
8 19 5,3
9 20 5,3
9 20 5,6
10 21 6
10 21 6,3
11 22 6,4
11 23 7
12 25 7,5
12 28 7,9
13 30 8,2
13 31 8,4
14 31 8,6
14 35 9,5
15 36 10

Tələb olunur:

  1. Bir işçiyə düşən məhsul və yüksək ixtisaslı işçilərin nisbəti arasında korrelyasiya sahəsi qurun. X1 və Y göstəriciləri arasındakı əlaqənin sıxlığı və forması haqqında fərziyyə irəli sürün.
  2. Sıxlığı qiymətləndirin xətti əlaqə bir işçiyə düşən məhsul və yüksək ixtisaslı işçilərin nisbəti arasında etibarlılıq 0,9.
  3. Oranları hesablayın xətti tənlik bir işçiyə düşən məhsulun yüksək ixtisaslı işçilərin nisbətindən asılılığının reqressləri.
  4. Etibarlılığı 0,9 olan reqressiya tənliyinin parametrlərinin statistik əhəmiyyətini yoxlayın və onlar üçün inam intervalları qurun.
  5. Determinasiya əmsalını hesablayın. Fişerin F-testindən istifadə edərək, 0,9 etibarlılığı ilə reqressiya tənliyinin statistik əhəmiyyətini qiymətləndirin.
  6. İşçilərin 24%-nin yüksək ixtisaslı olduğu müəssisə üçün hər işçiyə 0,9 məhsulun etibarlılığı ilə nöqtə və interval proqnozu verin.
  7. Xətti çoxsaylı reqressiya tənliyinin əmsallarını hesablayın və onun parametrlərinin iqtisadi mənasını izah edin.
  8. Etibarlılığı 0,9 olan çoxsaylı tənliyin əmsallarının statistik əhəmiyyətini təhlil edin və onlar üçün etimad intervalları qurun.
  9. Cüt və qismən korrelyasiya əmsallarını tapın. Onları təhlil edin.
  10. Tənzimlənmiş çoxlu təyin əmsalını tapın. Tənzimlənməmiş (ümumi) təyin əmsalı ilə müqayisə edin.
  11. Fişerin F kriteriyasından istifadə edərək reqressiya tənliyinin adekvatlığını 0,9 etibarlılığı ilə qiymətləndirin.
  12. İşçilərin 24%-nin yüksək ixtisaslı olduğu, yeni əsas fondların istifadəyə verilməsinin isə 5%-i olan müəssisə üçün bir işçiyə 0,9 məhsul buraxılışının etibarlılığı ilə nöqtə və interval proqnozunu verin.
  13. Qurulmuş tənliyi multikollinearlığın mövcudluğu üçün yoxlayın: Tələbə meyarı; meyar χ2. Nəticələri müqayisə edin.

Qərar kalkulyatorla edin. 13-cü bəndin həlli aşağıdakı kimidir.
Qoşalaşmış korrelyasiya əmsallarının matrisi R:

- yx 1x2
y 1 0.97 0.991
x 1 0.97 1 0.977
x2 0.991 0.977 1

Multikollinearlıq olduqda korrelyasiya matrisinin determinantı sıfıra yaxındır. Nümunəmiz üçün: det = 0,00081158, bu, güclü multikollinearlığın mövcudluğunu göstərir.
Ən əhəmiyyətli x i amillərini seçmək üçün aşağıdakı şərtlər nəzərə alınır:
- təsirli xüsusiyyətlə amil arasındakı əlaqə interfaktor münasibətindən yüksək olmalıdır;
- amillər arasında əlaqə 0,7-dən çox olmamalıdır. Əgər matrisin faktorlararası korrelyasiya əmsalı r xjxi > 0,7 olarsa, bu çoxlu reqressiya modelində multikollinearlıq mövcuddur .;
- əlamətin yüksək interfaktorial əlaqəsi ilə onların arasında korrelyasiya əmsalı daha aşağı olan amillər seçilir.
Bizim vəziyyətimizdə r x 1 x 2 |r|>0,7-yə malikdir ki, bu da amillərin multikollinearlığını və onlardan birini sonrakı təhlildən çıxarmaq zərurətini göstərir.
Bu matrisin birinci cərgəsinin təhlili çoxlu korrelyasiya modelinə daxil edilə bilən amil xüsusiyyətlərini seçməyə imkan verir. |r yxi | olan faktor əlamətləri 0.3 - əlaqə praktiki olaraq yoxdur; 0,3 ≤ |r| ≤ 0,7 - orta əlaqə; 0,7 ≤ |r| ≤ 0,9 – güclü bağ; |r| > 0,9 - əlaqələr çox güclüdür.
Alınan qoşa korrelyasiya əmsallarının əhəmiyyətini Student t-testindən istifadə edərək yoxlayaq. T-statistika modulunun dəyərləri tapılan kritik dəyərdən çox olan əmsallar əhəmiyyətli hesab olunur.
Düsturdan istifadə edərək r yx 1 üçün t-statistikanın müşahidə olunan dəyərlərini hesablayın:

burada m = 1 reqressiya tənliyindəki amillərin sayıdır.

Tələbə cədvəlinə uyğun olaraq Ttable-i tapırıq
t kritik (n-m-1;α/2) = (18;0,025) = 2,101
t obl > t krit olduğundan korrelyasiya əmsalının 0-a bərabər olması fərziyyəsini rədd edirik. Başqa sözlə, korrelyasiya əmsalı statistik əhəmiyyətlidir
Düsturdan istifadə edərək r yx 2 üçün t-statistikanın müşahidə olunan dəyərlərini hesablayın:

t obl > t krit olduğundan korrelyasiya əmsalının 0-a bərabər olması fərziyyəsini rədd edirik. Başqa sözlə, korrelyasiya əmsalı statistik əhəmiyyətlidir
Beləliklə, (y və x x 1), (y və x x 2) arasındakı əlaqə əhəmiyyətlidir.
X 2 (r = 0.99) əmsalı əldə edilən atributda ən böyük təsirə malikdir, yəni modeli qurarkən ilk olaraq reqressiya tənliyinə daxil olacaqdır.
Multikollinearlığın sınaqdan keçirilməsi və aradan qaldırılması.
Multikollinearlığın öyrənilməsi üçün ən tam alqoritm Farrar-Qlober alqoritmidir. Üç növ multikollinearlığı sınaqdan keçirir:
1. Bütün amillər (χ 2 - xi-kvadrat).
2. Qalanları ilə hər bir amil (Fişer meyarı).
3. Hər bir cüt faktor (Tələbənin t-testi).
Birinci tip statistik meyarlara ("xi-kvadrat" meyarı) uyğun olaraq Farrar-Qlouber metodundan istifadə edərək dəyişənləri multikollinearlığa görə yoxlayaq.
Farrar-Glouber statistikasının dəyərini hesablamaq üçün düstur:
χ 2 = -ln(det[R])
burada m = 2 amillərin sayı, n = 20 müşahidələrin sayı, det[R] qoşalaşmış korrelyasiya əmsalları R matrisinin təyinedicisidir.
ilə müqayisə edin cədvəl dəyəri v = m/2(m-1) = 1 sərbəstlik dərəcəsi və əhəmiyyət səviyyəsi α ilə. Əgər χ 2 > χ cədvəl 2 olarsa, onda amillərin vektorunda multikollinearlıq vardır.
χ cədvəl 2 (1; 0,05) = 3,84146
Dəyişənləri multikollinearlığa görə ikinci növ statistik kriteriyalar (Fişer meyarı) ilə yoxlayaq.

Üçüncü növ statistik testlər (Tələbə testi) ilə dəyişənləri multikollinearlığa görə yoxlayaq. Bunun üçün biz qismən korrelyasiya əmsallarını tapırıq.
Qismən korrelyasiya əmsalları.
Qismən korrelyasiya əmsalı sadə xətti cüt korrelyasiya əmsalından ona görə fərqlənir ki, o, digər amillərin (x j) onlara təsirini aradan qaldırmaq şərti ilə müvafiq əlamətlərin (y və x i) qoşa korrelyasiyasını ölçür.
Qismən əmsallar əsasında belə nəticəyə gəlmək olar ki, reqressiya modelinə dəyişənlərin daxil edilməsi əsaslandırılıb. Əgər əmsalın qiyməti kiçikdirsə və ya əhəmiyyətsizdirsə, bu o deməkdir ki, bu amil ilə nəticələnən dəyişən arasındakı əlaqə ya çox zəifdir, ya da tamamilə yoxdur, ona görə də amil modeldən çıxarıla bilər.


Rabitə sıxlığı aşağıdır.
r yx 1 /x 2 korrelyasiya əmsalının əhəmiyyətini müəyyən edək. Gördüyünüz kimi modelə x 1 daxil olmaq şərti ilə y və x 2 arasındakı əlaqə azalmışdır. Buradan belə nəticəyə gəlmək olar ki, x 2 reqressiya tənliyinə daxil edilmiş məlumatlar uyğunsuz olaraq qalır.
Belə nəticəyə gəlmək olar ki, reqressiya tənliyini qurarkən x 1 , x 2 amilləri seçilməlidir.

Nümunə №2. 30 müşahidə əsasında ikili korrelyasiya əmsallarının matrisi aşağıdakı kimi oldu:

yx 1x2x 3
y1,0
x 10,30 1,0
x20,60 0,10 1,0
x 30,40 0,15 0,80 1,0
Faktorların multikollinearlığını qiymətləndirin. Standart miqyasda reqressiya tənliyini qurun və nəticə çıxarın.

Qeyd edək ki, bəzi hallarda multikollinearlıq onu müəyyən etmək və aradan qaldırmaq üçün əhəmiyyətli səylər göstərmək o qədər də ciddi "şər" deyil. Əsasən, hər şey tədqiqatın məqsədindən asılıdır.
Modelin əsas vəzifəsi asılı dəyişənin gələcək dəyərlərini proqnozlaşdırmaqdırsa, R2 (gt; 0.9) kifayət qədər böyük təyin əmsalı ilə, multikollinearlığın olması adətən modelin proqnozlaşdırıcı keyfiyyətlərinə təsir göstərmir ( əgər gələcəkdə korrelyasiya olunan dəyişənlər arasında əvvəlki kimi eyni əlaqələr qalarsa ).
Əgər izahedici dəyişənlərin hər birinin asılı dəyişənə təsir dərəcəsini müəyyən etmək lazımdırsa, o zaman standart xətaların artmasına səbəb olan multikollinearlıq dəyişənlər arasında həqiqi əlaqələri təhrif edə bilər. Bu vəziyyətdə multikollinearlıq əsas problemdir.
Hər halda işləyən multikollinearlığın aradan qaldırılması üçün vahid metod yoxdur. Bu onunla bağlıdır ki, multikollinearlığın səbəb və nəticələri birmənalı deyil və əsasən seçmənin nəticələrindən asılıdır.
Dəyişən(ləri) modeldən xaric edin
Multikollinearlığı aradan qaldırmağın ən sadə üsulu bir və ya bir neçə korrelyasiya dəyişənlərinin modeldən xaric edilməsidir. Bu üsulu tətbiq edərkən bir qədər ehtiyatlı olmaq lazımdır. Bu vəziyyətdə spesifikasiya xətaları mümkündür, ona görə də tətbiq olunan ekonometrik modellərdə multikollinearlıq ciddi problemə çevrilənə qədər izahedici dəyişənlərin istisna edilməməsi arzu edilir.
Daha çox məlumat və ya yeni nümunə əldə edilir
Multikollinearlıq birbaşa nümunədən asılı olduğundan, ola bilsin ki, fərqli nümunə ilə multikollinearlıq olmasın və ya o qədər də ciddi olmasın. Bəzən multikollinearlığı azaltmaq üçün nümunənin ölçüsünü artırmaq kifayətdir. Məsələn, illik datadan istifadə edirsinizsə, rüblük dataya dəyişə bilərsiniz. Məlumatların həcminin artırılması reqressiya əmsallarının dispersiyalarını azaldır və beləliklə, onların statistik əhəmiyyətini artırır. Bununla belə, yeni bir nümunə əldə etmək və ya köhnəni genişləndirmək həmişə mümkün deyil və ya ciddi xərclərlə əlaqələndirilir. Bundan əlavə, bu yanaşma avtokorrelyasiyanı gücləndirə bilər. Bu problemlər bu metodun tətbiqini məhdudlaşdırır.
Model spesifikasiyasının dəyişməsi
Bəzi hallarda multikollinearlıq problemi modelin spesifikasiyasını dəyişdirməklə həll edilə bilər: ya modelin forması dəyişdirilir, ya da ilkin modeldə nəzərə alınmayan, lakin asılı dəyişənə əhəmiyyətli dərəcədə təsir edən izahedici dəyişənlər əlavə edilir. . Bu üsul əsaslandırılıbsa, onda onun istifadəsi kvadrat sapmaların cəmini azaldır və bununla da reqressiyanın standart xətasını azaldır. Bu, əmsalların standart xətalarının azalmasına gətirib çıxarır.
Bəzi parametrlər haqqında ilkin məlumatlardan istifadə
Bəzən çoxlu reqressiya modeli qurarkən ilkin məlumatlardan, xüsusən də bəzi reqressiya əmsallarının məlum dəyərlərindən istifadə edə bilərsiniz.
Çox güman ki, bəzi ilkin (adətən daha sadə) modellər və ya əvvəllər əldə edilmiş nümunə əsasında oxşar model üçün hesablanmış əmsalların qiymətləri işlənib hazırlanmış model üçün istifadə oluna bilər. Bu an modellər.
Ən əhəmiyyətli izahedici dəyişənlərin seçilməsi. Elementlərin sıra ilə birləşdirilməsi qaydası
Daha az izahlı dəyişənlərə keçmək bir-birindən yüksək dərəcədə asılı olan xüsusiyyətlər tərəfindən çatdırılan məlumatların təkrarlanmasını azalda bilər. İzahedici dəyişənlərin multikollinearlığı vəziyyətində məhz bununla qarşılaşırıq.

36. multikolliarlığın aşkarlanması yolları. qismən korrelyasiya

Çoxlu reqressiya aparatının istifadəsində ən böyük çətinliklər, ikidən çox amil xətti əlaqə ilə bir-birinə bağlı olduqda, faktor dəyişənlərinin multikollinearlığı olduqda yaranır.

Xətti çoxlu reqressiya üçün multikollinearlıq modelə daxil olan amil dəyişənləri arasında xətti əlaqənin olmasıdır.

Multikollinearlıq xətti çoxlu reqressiya modelinin qurulmasının əsas şərtlərindən birinin pozulmasıdır.

Matris şəklində multikollinearlıq, X amil dəyişənlərinin matrisinin sütunları arasındakı asılılıqdır:

Vahid vektorunu nəzərə almırsınızsa, bu matrisin ölçüsü * n-dir. Əgər X matrisinin dərəcəsi n-dən kiçikdirsə, model tam və ya ciddi multikollinearlığa malikdir. Amma praktikada tam multikollinearlıq demək olar ki, heç vaxt baş vermir.

Belə nəticəyə gəlmək olar ki, çoxsaylı reqressiya modelində multikollinearlığın olmasının əsas səbəblərindən biri X amil dəyişənlərinin zəif matrisidir.

Amil dəyişənlərinin multikollinearlığı nə qədər güclü olarsa, izah edilən variasiya cəminin ayrı-ayrı amillər üzrə paylanmasının ən kiçik kvadratlar təxminləri bir o qədər etibarlı deyildir.

Multikollinear amillərin modelə daxil edilməsi bir neçə səbəbə görə arzuolunmazdır:

1) çoxsaylı reqressiya əmsallarının əhəmiyyətsizliyi ilə bağlı əsas fərziyyə təsdiqlənə bilər, lakin reqressiya modelinin özü, F-testindən istifadə edərək sınaqdan keçirildikdə, əhəmiyyətli olur, bu, çoxsaylı korrelyasiya əmsalının həddindən artıq qiymətləndirilmiş dəyərini göstərir;

2) çoxsaylı reqressiya modelinin əmsallarının əldə edilmiş qiymətləndirmələri əsassız olaraq yüksək ola bilər və ya səhv işarələrə malik ola bilər;

3) ilkin məlumatlara bir və ya iki müşahidənin əlavə edilməsi və ya xaric edilməsi modelin əmsallarının qiymətləndirilməsinə güclü təsir göstərir;

4) çoxlu reqressiya modelinə daxil olan multikollinear amillər onu sonrakı istifadə üçün yararsız edə bilər.

Multikollinearlığı aşkar etmək üçün xüsusi üsullar yoxdur, lakin bir sıra empirik üsulların tətbiqi adətdir. Əksər hallarda çoxlu reqressiya təhlili R faktor dəyişənlərinin korrelyasiya matrisinin və ya matrisin (XTX) nəzərə alınması ilə başlayır.

Faktor dəyişənlərinin korrelyasiya matrisi əsas diaqonala görə simmetrik olan faktor dəyişənlərinin cüt korrelyasiyasının xətti əmsallarının matrisidir:

burada rij i-ci və j-ci amil dəyişənləri arasında xətti cüt korrelyasiya əmsalıdır,

Korrelyasiya matrisinin diaqonalında vahidlər var, çünki amil dəyişəninin özü ilə korrelyasiya əmsalı birə bərabərdir.

Multikollinear amilləri müəyyən etmək üçün bu matrisi nəzərdən keçirərkən aşağıdakı qaydalara əməl olunur:

1) amil dəyişənlərinin korrelyasiya matrisində mütləq qiymətdə 0,8-dən çox olan qoşa korrelyasiya əmsalları varsa, o zaman bu çoxlu reqressiya modelində multikollinearlığın olduğu qənaətinə gəlinir;

2) λmin və λmax faktorial dəyişənlərin korrelyasiya matrisinin xüsusi dəyərlərini hesablayın. Əgər λmin‹10-5 olarsa, reqressiya modelində multikollinearlıq var. Əgər nisbət

sonra onlar da belə nəticəyə gəlirlər ki, multikollinear amil dəyişənləri var;

3) amil dəyişənlərinin korrelyasiya matrisinin determinantını hesablayın. Əgər onun dəyəri çox kiçikdirsə, reqressiya modelində multikollinearlıq mövcuddur.

37. multikolliarlıq probleminin həlli yolları

Əgər təxmin edilən reqressiya modeli öyrəniləcəksə iqtisadi əlaqələr, onda multikollinear amillərin aradan qaldırılması məcburidir, çünki onların modeldə olması reqressiya əmsallarının yanlış əlamətlərinə səbəb ola bilər.

Multikollinear amillərlə reqressiya modeli əsasında proqnoz qurarkən vəziyyəti proqnoz xətasının miqyasına görə qiymətləndirmək lazımdır. Əgər onun dəyəri qənaətbəxşdirsə, o zaman model multikollinearlığa baxmayaraq istifadə edilə bilər. Əgər proqnoz xətasının qiyməti böyükdürsə, o zaman reqressiya modelindən multikollinear amillərin aradan qaldırılması proqnozun düzgünlüyünü artırmaq üsullarından biridir.

Çoxlu reqressiya modelində multikollinearlığı aradan qaldırmağın əsas yollarına aşağıdakılar daxildir:

1) ən çox biri sadə yollar multikollinearlığın aradan qaldırılması əlavə məlumatların əldə edilməsindən ibarətdir. Lakin praktikada bəzi hallarda bu metodun həyata keçirilməsi çox çətin ola bilər;

2) dəyişənləri çevirmək üsulu, məsələn, modeldə iştirak edən bütün dəyişənlərin (nəticə də daxil olmaqla) dəyərlərinin əvəzinə onların loqarifmlərini götürə bilərsiniz:

lny=β0+β1lnx1+β2lnx2+ε.

Lakin bu yolla həm də multikollinearlıq amillərinin tam aradan qaldırılmasına təminat verə bilmir;

Əgər nəzərdən keçirilən üsullar amillərin multikollinearlığını aradan qaldırmağa kömək etməmişdirsə, onda onlar reqressiya modelinin naməlum parametrlərinin qiymətləndirilməsi üçün qərəzli metodlardan və ya çoxlu reqressiya modelindən dəyişənlərin xaric edilməsi üsullarından istifadə etməyə keçirlər.

Çoxsaylı reqressiya modelinə daxil olan amil dəyişənlərindən heç biri istisna edilə bilməzsə, reqressiya modelinin əmsallarının qiymətləndirilməsi üçün əsas qərəzli üsullardan biri - silsilənin reqressiyası və ya silsiləsi (silsilə) istifadə olunur.

Silsilənin reqressiya metodundan istifadə edərkən matrisin bütün diaqonal elementlərinə (ХТХ) kiçik τ ədədi əlavə edilir: 10-6 ‹ τ ‹ 0.1. Çoxsaylı reqressiya modelinin naməlum parametrlərinin qiymətləndirilməsi düsturla aparılır:

burada ln eynilik matrisidir.

Silsilənin reqressiyasının tətbiqinin nəticəsi çoxlu reqressiya modelinin əmsallarının müəyyən sayda sabitləşməsi səbəbindən standart xətalarının azalmasıdır.

Əsas komponent təhlili çoxlu reqressiya modelindən dəyişənlərin aradan qaldırılması üçün əsas üsullardan biridir.

Bu üsul reqressiya modelinin faktor dəyişənlərinin multikollinearlığını aradan qaldırmaq və ya azaltmaq üçün istifadə olunur. Metodun mahiyyəti amil dəyişənlərinin sayını ən əhəmiyyətli təsir göstərən amillərə qədər azaltmaqdır. Bu, istifadə etməklə əldə edilir xətti transformasiya bütün faktor dəyişənlərinin xi (i=0,…,n) əsas komponentlər adlanan yeni dəyişənlərə çevrilməsi, yəni X faktorial dəyişənlərin matrisindən F əsas komponentlərinin matrisinə keçid edilir.bütün amil dəyişənlərinin ümumi dispersiyası xi (i=0,…,n), ikinci komponent birinci əsas komponentin təsiri xaric edildikdən sonra qalan dispersiyanın maksimumudur və s.

Dəyişənlərin mərhələli daxil edilməsi üsulu amil dəyişənlərinin bütün mümkün dəsti arasından nəticələnən dəyişənə əhəmiyyətli təsir göstərənlərin seçilməsindən ibarətdir.

Addım-addım keçid üsulu aşağıdakı alqoritmə uyğun olaraq həyata keçirilir:

1) bütün amil dəyişənlərindən reqressiya modelinə nəticə dəyişən ilə cüt korrelyasiya xətti əmsalının ən böyük moduluna uyğun gələn dəyişənlər daxildir;

2) reqressiya modelinə yeni amil dəyişənləri əlavə edildikdə, onların əhəmiyyəti Fişerin F-testindən istifadə etməklə yoxlanılır. Eyni zamanda xk amil dəyişəninin çoxsaylı reqressiya modelinə daxil edilməsinin əsassızlığı ilə bağlı əsas fərziyyə irəli sürülür. Əks fərziyyə çoxlu reqressiya modelinə xk amil dəyişəninin daxil edilməsinin məqsədəuyğunluğu haqqında bəyanatdan ibarətdir. F-kriteriyasının kritik qiyməti Fcrit(a;k1;k2) kimi müəyyən edilir, burada a əhəmiyyətlilik səviyyəsi, k1=1 və k2=n–l sərbəstlik dərəcələrinin sayı, n – seçmə ölçüsü, l - nümunədən təxmin edilən parametrlərin sayı. F-kriteriyasının müşahidə edilən qiyməti düsturla hesablanır:

burada q artıq reqressiya modelinə daxil edilmiş faktor dəyişənlərinin sayıdır.

Əsas fərziyyəni yoxlayarkən aşağıdakı hallar mümkündür.

Fobs›Fcrit, sonra xk amil dəyişəninin çoxlu reqressiya modelinə daxil edilməsinin əsassızlığı ilə bağlı əsas fərziyyə rədd edilir. Buna görə də, bu dəyişənin çoxsaylı reqressiya modelinə daxil edilməsi əsaslandırılmışdır.

F kriteriyasının müşahidə edilən dəyəri (nümunə məlumatlarından hesablanmış) F kriteriyasının kritik qiymətindən az və ya ona bərabərdirsə (Fisher-Snedekor paylanma cədvəlindən müəyyən edilir), yəni reqressiya qəbul edilir. Buna görə də, bu amil dəyişəni keyfiyyətinə xələl gətirmədən modeldən çıxarıla bilər.

3) amil dəyişənlərinin əhəmiyyətinin yoxlanılması Fobs›Fcrit şərtinin təmin olunmadığı ən azı bir dəyişən tapılana qədər aparılır.

38. dummy dəyişənlər. chow testi

Səviyyəni göstərən “əhəmiyyətli” dəyişənlərdən fərqli olaraq “dummy dəyişənlər” termini istifadə olunur. kəmiyyət göstəricisi, davamlı intervaldan dəyərlər alaraq. Bir qayda olaraq, dummy dəyişən keyfiyyət xarakteristikasını əks etdirən göstərici dəyişəndir. Çox vaxt müəyyən bir şərtdən asılı olaraq iki dəyər, 0 və 1 qəbul edən ikili dummy dəyişənlərdən istifadə olunur. Məsələn, bir qrup insan arasında sorğunun nəticəsində 0 müsahibin kişi, 1 isə qadın olduğunu bildirə bilər. Dummy dəyişənlərə bəzən yalnız vahidlərdən (yəni, sabit, kəsişmə) ibarət reqressor, həmçinin zaman trendi daxildir.

Dummy dəyişənlər ekzogen olduğundan GLS-in tətbiqində heç bir çətinlik yaratmır. Dummy dəyişənlər reqressiya modellərinin qurulması və fərziyyələrin sınaqdan keçirilməsi üçün effektiv vasitədir.

Tutaq ki, toplanmış məlumatlar əsasında reqressiya modeli qurulub. Tədqiqatçı yaranan modelə əlavə dummy dəyişənlərin daxil edilməsinə dəyərmi və ya əsas modelin optimal olub-olmaması problemi ilə üzləşir. Bu problem Chow metodu və ya testindən istifadə etməklə həll edilir. Əsas nümunənin hissələrə və ya alt nümunələrə bölünə biləcəyi vəziyyətlərdə istifadə olunur. Bu halda, alt nümunələrin ümumi reqressiya modelindən daha səmərəli olduğu fərziyyəsini sınaqdan keçirə bilərsiniz.

Ümumi reqressiya modelinin məhdudiyyətsiz reqressiya modeli modeli olduğunu fərz edəcəyik. Bu modeli kimi işarə edək BMT. Ayrı-ayrı alt nümunələr məhdudiyyətsiz reqressiya modelinin xüsusi halları hesab olunacaq. Bu özəl alt nümunələri olaraq işarə edirik PR.

Aşağıdakı qeydi təqdim edək:

PR1 ilk alt nümunədir;

PR2 ikinci alt nümunədir;

ESS(PR1) birinci yarımnümunə üçün qalıqların kvadratlarının cəmidir;

ESS(PR2) ikinci alt nümunə üçün kvadrat qalıqların cəmidir;

ESS(UN) üçün qalıqların kvadratlarının cəmidir ümumi model reqressiya.

ümumi reqressiya modelində birinci alt seçmənin müşahidələri üçün kvadrat qalıqların cəmidir;

ümumi reqressiya modelində ikinci alt nümunənin müşahidələri üçün qalıqların kvadratlarının cəmidir.

Xüsusi reqressiya modelləri üçün aşağıdakı bərabərsizliklər doğrudur:

Vəziyyət (ESS(PR1)+ESS(PR2))=ESS(BMT) yalnız xüsusi reqressiya modellərinin əmsalları və məhdudiyyətsiz ümumi reqressiya modelinin əmsalları eyni olduqda yerinə yetirilir, lakin praktikada belə təsadüf çox nadir hallarda olur.

Əsas fərziyyə məhdudiyyətsiz ümumi reqressiya modelinin keyfiyyətinin ifadəsi kimi tərtib edilmişdir daha keyfiyyətliözəl reqressiya modelləri və ya alt nümunələri.

Alternativ və ya əks fərziyyə, ümumi məhdudiyyətsiz reqressiya modelinin keyfiyyətinin xüsusi reqressiya modellərinin və ya alt nümunələrinin keyfiyyətindən daha pis olduğunu bildirir.

Bu fərziyyələr Fisher-Snedekor F-testindən istifadə etməklə yoxlanılır.

F-kriteriyasının müşahidə edilən qiyməti F-kriteriyasının Fişer-Snedekor paylanma cədvəlindən müəyyən edilən kritik qiyməti ilə müqayisə edilir.

a k1=m+1k2=n-2m-2.

F-kriteriyasının müşahidə edilən qiyməti düsturla hesablanır: burada ESS(UN)– ESS(PR1)– ESS(PR2) reqressiya modelini alt nümunələrə böldükdən sonra onun keyfiyyətinin yaxşılaşmasını xarakterizə edən qiymətdir;

m– amil dəyişənlərinin sayı (o cümlədən dummy);

n- ümumi nümunənin həcmi.

F-kriteriyasının müşahidə edilən dəyəri (nümunə məlumatlarından hesablanmış) F-kriteriyasının kritik qiymətindən (Fişer-Snedekor paylama cədvəlindən müəyyən edilir) böyükdürsə, yəni. Fobs>Fcrit, onda əsas fərziyyə rədd edilir və xüsusi reqressiya modellərinin keyfiyyəti ümumi reqressiya modelinin keyfiyyətini üstələyir.

F-kriteriyasının müşahidə edilən qiyməti (nümunə məlumatlarından hesablanmış) F-kriteriyasının kritik qiymətindən az və ya ona bərabərdirsə (Fischer-Snedekor paylanma cədvəlindən müəyyən edilir), yəni. Fob?Fcrit, onda əsas fərziyyə qəbul edilir və ümumi reqressiyanı alt nümunələrə bölməyin mənası yoxdur.

Əsas reqressiyanın və ya məhdud reqressiyanın əhəmiyyəti yoxlanılırsa, formanın əsas hipotezi irəli sürülür:

Bu fərziyyənin etibarlılığı Fisher-Snedekor F-testindən istifadə etməklə yoxlanılır.

Fisher F-testinin kritik dəyəri əhəmiyyətlilik səviyyəsindən asılı olaraq Fisher-Snedekor paylama cədvəlindən müəyyən edilir. a və iki sərbəstlik dərəcəsi k1=m+1k2=n–k–1.

F-kriteriyasının müşahidə edilən qiyməti aşağıdakı formaya çevrilir:

Təklif olunan fərziyyələri sınaqdan keçirərkən aşağıdakı hallar mümkündür.

F-kriteriyasının müşahidə edilən dəyəri (nümunə məlumatlarından hesablanmış) F-kriteriyasının kritik qiymətindən (Fişer-Snedekor paylama cədvəlindən müəyyən edilir) böyükdürsə, yəni. Fobs›Fcrit, onda əsas fərziyyə rədd edilir və reqressiya modelinə əlavə dummy dəyişənlər daxil edilməlidir, çünki məhdud reqressiya modelinin keyfiyyəti əsas və ya məhdud reqressiya modelinin keyfiyyətindən yüksəkdir.

F-kriteriyasının müşahidə edilən qiyməti (nümunə məlumatlarından hesablanmış) F-kriteriyasının kritik qiymətindən az və ya ona bərabərdirsə (Fischer-Snedekor paylanma cədvəlindən müəyyən edilir), yəni. Fob?Fcrit, onda əsas fərziyyə qəbul edilir və əsas reqressiya modeli qənaətbəxşdir, modelə əlavə dummy dəyişənlərin daxil edilməsinin mənası yoxdur.

39. sinxron tənliklər sistemi (endogen, ekzogen, laq dəyişənləri). Sinxron tənliklər sistemlərinin iqtisadi cəhətdən əhəmiyyətli nümunələri

İndiyədək biz izahlı dəyişənlər baxımından asılı (izah olunan) dəyişəni ifadə edən tənliklərlə müəyyən edilən ekonometrik modelləri nəzərdən keçirdik. Bununla belə, ekonometrik metodların köməyi ilə öyrənilən real iqtisadi obyektlər reqressiya tənlikləri və eyniliklər sistemi ilə təsvir edilən ekonometrik model anlayışının genişlənməsinə gətirib çıxarır1.

1 Reqressiya tənliklərindən fərqli olaraq, identikliklər təxmin ediləcək model parametrlərini ehtiva etmir və təsadüfi komponent daxil etmir.

Bu sistemlərin xüsusiyyəti ondan ibarətdir ki, sistemin hər bir tənliyinə “özünün” izahlı dəyişənləri ilə yanaşı, digər tənliklərdən izahlı dəyişənlər də daxil ola bilər. Beləliklə, bizdə bir asılı dəyişən yox, sistemin tənlikləri ilə bağlanmış asılı (izah olunan) dəyişənlər çoxluğu var. Belə bir sistem eyni zamanda eyni dəyişənlərin bəzi tənliklərdə eyni vaxtda asılı, digərlərində isə müstəqil hesab edildiyini vurğulayaraq eyni vaxtda tənliklər sistemi adlanır.

Sinxron tənliklər sistemləri çoxlu bir-biri ilə əlaqəli endogen (obyektin işləməsi çərçivəsində əmələ gələn) və ekzogen (xaricdən təyin olunan) dəyişənləri ehtiva edən iqtisadi obyekti ən dolğun şəkildə təsvir edir. Eyni zamanda, gecikmə dəyişənləri (zamanın əvvəlki nöqtəsində götürülür) endogen və ekzogen kimi çıxış edə bilər.

Belə bir sistemin klassik nümunəsi tələb Qd və təklif Qs modelidir (bax § 9.1), məhsula tələb onun P qiyməti və istehlakçının gəliri ilə müəyyən edildikdə /, məhsulun təklifi ilə müəyyən edilir. onun qiyməti P və tələb və təklif arasında tarazlıq əldə edilir:

Bu sistemdə ekzogen dəyişən istehlakçının gəliridir /, endogen dəyişənlər isə Qd \u003d Q "\u003d Q malına tələb (təklif) və malın qiymətidir (tarazlıq qiyməti) P.

Tələb və təklifin başqa bir modelində Qf təklifini izah edən dəyişən təkcə müəyyən bir zamanda P malının qiyməti ola bilməz /, yəni. Pb həm də malın əvvəlki vaxtdakı qiyməti Ptb yəni. gecikmiş endogen dəyişən:

d" \u003d P4 + P5 ^ + Pb ^ -1 + Є2.

Yuxarıdakıları ümumiləşdirərək deyə bilərik ki, ekonometrik model ekzogen və lag endogen dəyişənlərin dəyərlərindən (başqa sözlə, əvvəlcədən təyin edilmiş, yəni əvvəlcədən təyin edilmiş dəyişənlərdən asılı olaraq) endogen dəyişənlərin davranışını izah etməyə imkan verir.

Ekonometrik model konsepsiyasının nəzərdən keçirilməsini yekunlaşdıraraq aşağıdakıları qeyd etmək lazımdır. Öyrənilən iqtisadi obyektin riyazi-statistik təsvirini ifadə edən hər bir iqtisadi-riyazi modeli ekonometrik hesab etmək olmaz. O, yalnız bu obyekti xarakterizə edən empirik (statistik) məlumatlar əsasında əks etdirdiyi halda ekonometrik olur.

40. dolayı ən kiçik kvadratlar

Əgər struktur formanın i-ci stoxastik tənliyi dəqiq müəyyən edilə bilərsə, onda bu tənliyin parametrləri (tənliyin əmsalları və təsadüfi xətanın dispersiyaları) azaldılmış sistemin parametrlərindən unikal şəkildə bərpa olunur. Buna görə də, belə bir tənliyin parametrlərini qiymətləndirmək üçün ən kiçik kvadratlar üsulu ilə (hər bir tənlik üçün ayrıca) azaldılmış formada olan tənliklərin hər birinin əmsallarını qiymətləndirmək və səhvlərin Q kovariasiya matrisinin qiymətləndirməsini almaq kifayətdir. azaldılmış formanı, sonra isə PG = B və E = GTQT münasibətlərini istifadə edin, onlarda P əvəzinə, azaldılmış P formasının əmsallarının təxmin edilən matrisini və azaldılmış formada səhvlərin təxmin edilən kovariasiya matrisini £ 2 ilə əvəz edin. Bu prosedur dolayı ən kiçik kvadratlar (ILS dolayı ən kiçik kvadratlar) adlanır. Struktur formanın i-ci stoxastik tənliyinin əmsallarının nəticədə qiymətləndirilməsi azaldılmış formanın təxminlərinin ardıcıllıq xassəsini miras alır. Bununla belə, onlar bəzi qeyri-xətti çevrilmələr nəticəsində əldə olunduğuna görə, azaldılmış forma qiymətləndiricilərinin qərəzsizlik və səmərəlilik kimi xassələrini miras almırlar. Müvafiq olaraq, az sayda müşahidə ilə hətta bu təbii təxminlər də nəzərəçarpacaq qərəzli ola bilər. Bu baxımdan, struktur tənliklərin əmsallarının qiymətləndirilməsinin müxtəlif üsullarına baxılarkən, ilk növbədə, alınan qiymətləndirmələrin ardıcıllığının təmin edilməsinə diqqət yetirilir.

41. Sinxron tənliklər sistemlərinin identifikasiyası məsələləri

Modelin düzgün spesifikasiyası ilə tənliklər sisteminin müəyyən edilməsi problemi onun əmsallarının düzgün və birmənalı qiymətləndirilməsinə endirilir. Tənliyin əmsallarının birbaşa qiymətləndirilməsi yalnız reqressiya modelinin qurulması üçün əsas ilkin şərtlərin, xüsusən qalıqlarla əlaqəsi olmayan amil dəyişənlərinin şərtinin təmin edildiyi xarici əlaqəsi olmayan tənliklər sistemlərində mümkündür.

Rekursiv sistemlərdə qalıqların faktoriallarla əlaqəsi problemindən həmişə xilas olmaq mümkündür. dəyişən yol amil dəyişənlərinin dəyərləri kimi əvəzetmələr faktiki deyil, amil dəyişənləri kimi fəaliyyət göstərən endogen dəyişənlərin model qiymətləridir. İdentifikasiya prosesi aşağıdakı kimi həyata keçirilir:

1. Faktor dəyişənləri kimi endogen dəyişənləri ehtiva etməyən tənlik müəyyən edilir. Bu tənliyin endogen dəyişəninin hesablanmış qiyməti tapılır.

2. Əvvəlki addımda aşkar edilmiş endogen dəyişənin amil kimi daxil edildiyi aşağıdakı tənlik nəzərdən keçirilir. Bu endogen dəyişənin model (hesablanmış) dəyərləri bu tənliyi müəyyən etmək imkanını təmin edir və s.

Qısaldılmış formada tənliklər sistemində amil dəyişənlərinin kənarlaşmalarla korrelyasiyası problemi yaranmır, çünki hər bir tənlikdə faktor dəyişənləri kimi yalnız əvvəlcədən təyin edilmiş dəyişənlərdən istifadə olunur. Beləliklə, digər fərziyyələr altında rekursiv sistem həmişə müəyyən edilə bilər.

Sinxron tənliklər sistemini nəzərdən keçirərkən identifikasiya problemi yaranır.

Bu halda identifikasiya sistem əmsallarının azaldılmış formada struktur əmsallara birmənalı şəkildə yenidən hesablanması imkanının müəyyən edilməsi deməkdir.

Struktur model (7.3) bütövlükdə ehtiva edir parametrlər müəyyən edilməlidir. Modelin tam formada verilmiş forması parametrləri ehtiva edir. Buna görə də müəyyən etmək struktur modelin naməlum parametrləri tənliklərdən ibarət ola bilər. Belə sistemlər qeyri-müəyyəndir və ümumi halda struktur modelin parametrləri unikal şəkildə müəyyən edilə bilməz.

Yalnız almaq üçün Mümkün Həll modelin bəzi struktur əmsallarının sistemin sol tərəfindən endogen dəyişənlə zəif əlaqəsinə görə sıfıra bərabər olduğunu qəbul etmək lazımdır. Bu, modelin struktur əmsallarının sayını azaldacaq. Modelin struktur əmsallarının sayını azaltmaq başqa yollarla da mümkündür: məsələn, bəzi əmsalları bir-birinə bərabərləşdirməklə, yəni onların yaradılan endogen dəyişənə təsirinin eyni olduğunu düşünməklə və s.

Müəyyənlik baxımından struktur modelləri üç növə bölmək olar:

müəyyən edilə bilən;

naməlum;

həddindən artıq müəyyən edilə bilən.

Model müəyyən edilə bilən, əgər onun bütün struktur əmsalları modelin azaldılmış formasının əmsalları ilə unikal şəkildə müəyyən edilirsə, yəni struktur modelin parametrlərinin sayı modelin azaldılmış formasının parametrlərinin sayına bərabərdirsə.

Model tanınmaz, əgər kiçildilmiş modelin əmsallarının sayı struktur əmsalların sayından azdırsa və nəticədə modelin azaldılmış formasının əmsalları vasitəsilə struktur əmsalları təxmin etmək mümkün deyilsə.

Model həddindən artıq müəyyən edilə bilər, azaldılmış modelin əmsallarının sayı struktur əmsalların sayından çox olarsa. Bu halda, azaldılmış formanın əmsallarına əsasən, bir struktur əmsalının iki və ya daha çox dəyəri əldə edilə bilər. Həddindən artıq müəyyən edilmiş model, naməlum modeldən fərqli olaraq, praktiki olaraq həll edilə bilər, lakin bunun üçün parametrləri tapmaq üçün xüsusi üsullar tələb olunur.

Struktur modelin növünü müəyyən etmək üçün onun hər bir tənliyini müəyyən etmək üçün yoxlamaq lazımdır.

Sistemin hər bir tənliyi müəyyən edilə bilərsə, model müəyyən edilə bilən hesab olunur. Sistemin tənliklərindən ən azı biri identifikasiya edilə bilməzsə, bütün model müəyyən edilə bilməyən hesab olunur. Həddindən artıq müəyyən edilmiş model, müəyyən edilmiş modellərə əlavə olaraq, ən azı bir həddindən artıq müəyyən edilmiş tənliyi ehtiva edir.

42. Üç addımlı ən kiçik kvadratlar

Reqressiya tənlikləri sistemlərinin qiymətləndirilməsi üçün ən səmərəli prosedur eyni vaxtda qiymətləndirmə metodunu və instrumental dəyişənlər metodunu birləşdirir. Müvafiq metod üç addımlı ən kiçik kvadratlar metodu adlanır. Bu ondan ibarətdir ki, ilk mərhələdə təsadüfi şərtlərin korrelyasiyasını aradan qaldırmaq üçün ilkin modelə (9.2) ümumiləşdirilmiş ən kiçik kvadratlar metodu tətbiq edilir. Sonra yaranan tənliklərə ən kiçik kvadratların iki addımlı üsulu tətbiq edilir.

Aydındır ki, təsadüfi şərtlər (9.2) uyğun gəlmirsə, üç addımlı üsul iki addımlı metoda endirilir, eyni zamanda, B matrisi birdirsə, üç addımlı üsul eyni vaxtda qiymətləndirmə prosedurudur. tənliklər xarici əlaqəsizdir.

Nəzərdən keçirilən modelə üç addımlı metodu tətbiq edirik (9.24):

ai=19,31; Pi=l.77; a2=19,98; p2=0,05; y=1.4. (6,98) (0,03) (4,82) (0,08) (0,016)

P2 əmsalı əhəmiyyətsiz olduğundan, Y-nin X-dən asılılığının tənliyi formaya malikdir:

y \u003d 16,98 + 1,4x

Qeyd edək ki, (9.23) tənliyi ilə praktiki olaraq üst-üstə düşür.

Məlum olduğu kimi, tənliyin təsadüfi terminlərin korrelyasiyasından təmizlənməsi iterativ prosesdir. Müvafiq olaraq, üç addımlı üsuldan istifadə edərkən kompüter proqramı təkrarların sayını və ya tələb olunan dəqiqliyi soruşur. Üç addımlı metodun ən böyük səmərəliliyini təmin edən vacib bir xüsusiyyətini qeyd edirik.

Kifayət qədər çox sayda iterasiya üçün üç addımlı ən kiçik kvadratlar metodunun təxminləri maksimum ehtimal təxminləri ilə üst-üstə düşür.

Məlum olduğu kimi, böyük nümunələr üzrə maksimum ehtimal təxminləri ən yaxşısıdır.

43. dinamikanın iqtisadi silsiləsi anlayışı. Zaman seriyasının multiplikativ və əlavə modelinin ümumi görünüşü.

44. Zaman sıralarının, mövsümi və tsiklik dalğalanmaların trendinin modelləşdirilməsi.

Mövsümi və ya tsiklik dalğalanmaları ehtiva edən zaman sıralarının strukturunun təhlilinə bir neçə yanaşma mövcuddur.

1 YANLAŞMA. Hərəkətli ortalama metodundan istifadə edərək mövsümi komponentin dəyərlərinin hesablanması və zaman seriyasının əlavə və ya multiplikativ modelinin qurulması.

Əlavə modelin ümumi görünüşü: (T - trend komponenti, S - mövsümi, E - təsadüfi).

Multiplikativ modelin ümumi görünüşü:

Mövsümi tərəddüdlərin strukturunun təhlili əsasında modelin seçilməsi (əgər tərəddüdlərin amplitudası təqribən sabitdirsə - əlavə, artır/azalırsa - multiplikativ).

Modellərin qurulması hesablamaya endirilir dəyərlər T, S, E sıranın hər səviyyəsi üçün.

Modelin qurulması:

1. Hərəkətli ortalama üsulu ilə orijinal seriyanın düzülməsi;

2.komponent dəyərinin hesablanması S;

3. Mövsümi komponentin seriyanın ilkin səviyyələrindən çıxarılması və səviyyəli məlumatların əldə edilməsi ( T+E) əlavə və ya ( T*E) multiplikativ modeldə.

4. Səviyyələrin analitik uyğunlaşdırılması ( T+E) və ya ( T*E) və dəyərin hesablanması Təldə edilmiş trend səviyyəsindən istifadə etməklə.

5. Modelin əldə etdiyi dəyərlərin hesablanması ( T+S) və ya ( T*S).

6. Mütləq və/və ya nisbi xətaların hesablanması.

Alınan xəta dəyərlərində avtokorrelyasiya yoxdursa, onlar seriyanın ilkin səviyyələrini əvəz edə və daha sonra səhvlərin zaman seriyasından istifadə edə bilərlər. E orijinal seriyalar və digər zaman seriyalarının əlaqəsini təhlil etmək.

2 YANLAŞMA. Zaman amili və saxta dəyişənlərin daxil edilməsi ilə reqressiya modelinin qurulması. Belə bir modeldə dummy dəyişənlərin sayı bir salınım dövrü ərzində vaxtın anlarının (dövrlərinin) sayından bir az olmalıdır. Məsələn, rüblük məlumatları modelləşdirərkən modelə dörd müstəqil dəyişən - vaxt faktoru və üç dummy dəyişən daxil edilməlidir. Hər bir saxta dəyişən hər hansı bir dövr üçün zaman seriyasının mövsümi (tsiklik) komponentini əks etdirir. Müəyyən bir dövr üçün birinə (1), digərləri üçün isə sıfıra (0) bərabərdir. Dummy dəyişənləri olan modelin dezavantajı çoxlu sayda dəyişənlərin olmasıdır.

45. avtokorrelyasiya funksiyası. Onun istifadəsi trendin və dövri komponentin mövcudluğunu və ya olmamasını aşkar etmək üçün

Zaman sıralarının səviyyələrinin avtokorrelyasiyası.

Zaman seriyalarında tendensiyalar və tsiklik dalğalanmalar varsa, seriyanın hər bir sonrakı səviyyəsi əvvəlkilərdən asılıdır. Zaman sıralarının ardıcıl səviyyələri arasında korrelyasiya asılılığı deyilir silsilənin səviyyələrinin avtokorrelyasiyası.

Kəmiyyətcə, seriyanın səviyyələrinin avtokorrelyasiyası ilkin zaman seriyasının səviyyələri ilə bu seriyanın səviyyələri arasında bir neçə addımla yerdəyişən xətti korrelyasiya əmsalı ilə ölçülür.

Məsələn, bir zaman seriyası verilsin . və silsilələr arasında korrelyasiya əmsalını təyin edək.

Korrelyasiya əmsalını hesablamaq üçün işləyən düsturlardan biri:

Və zaman seriyası, yəni. 2 gecikmə ilə. Bu düsturla müəyyən edilir:

(4)

Qeyd edək ki, gecikmə artdıqca korrelyasiya əmsalını hesablamaq üçün istifadə olunan dəyər cütlərinin sayı azalır. Adətən gecikmə müşahidələrin sayının dörddə birindən çox olmasına icazə verilmir.

Avtokorrelyasiya əmsallarının iki mühüm xassəsini qeyd edirik.

Birincisi, avtokorrelyasiya əmsalları xətti korrelyasiya əmsalı ilə analogiya ilə hesablanır, yəni. onlar yalnız zaman sıralarının iki nəzərdən keçirilən səviyyəsi arasında xətti əlaqənin sıxlığını xarakterizə edirlər. Buna görə də, avtokorrelyasiya əmsalı yalnız xətti (və ya xəttinə yaxın) tendensiyanın mövcudluğunu mühakimə etmək üçün istifadə edilə bilər. Güclü qeyri-xətti tendensiyası olan zaman seriyaları üçün (məsələn, eksponensial) səviyyəli avtokorrelyasiya əmsalı sıfıra yaxınlaşa bilər.

Tutaq ki, biz reqressiya tənliyini nəzərdən keçiririk və onun qiymətləndirilməsi üçün məlumatlar müxtəlif keyfiyyətli obyektlər üçün müşahidələri ehtiva edir: kişilər və qadınlar üçün, ağlar və qaralar üçün. Burada bizi maraqlandıra biləcək sual aşağıdakılardan ibarətdir - doğrudurmu ki, nəzərdən keçirilən model müxtəlif keyfiyyətli obyektlərə aid iki nümunə üçün eynidir? Bu suala Chow testindən istifadə etməklə cavab vermək olar.

Modelləri nəzərdən keçirin:

, i=1,…,N (1);

, i=N+1,…,N+M (2).

Birinci nümunədə N müşahidələr, ikincidə - M müşahidələr. Misal: Y- əmək haqqı, izahedici dəyişənlər - yaş, iş stajı, təhsil səviyyəsi. Mövcud məlumatlardan belə nəticə çıxır ki, əmək haqqının sağ tərəfdəki izahedici dəyişənlərdən asılılığı kişilər və qadınlar üçün eynidir?

Bu fərziyyəni yoxlamaq üçün reqressiyanı məhdudiyyətlərlə və reqressiyanı məhdudiyyətsiz müqayisə etməklə fərziyyələrin yoxlanılmasının ümumi sxemindən istifadə edə bilərsiniz. Burada qeyri-məhdud reqressiya (1) və (2) reqressiyaların birləşməsidir, yəni. ESSUR = ESS 1 + ESS 2, sərbəstlik dərəcələrinin sayı - N + M - 2k. Məhdud reqressiya (yəni, sıfır fərziyyənin yerinə yetirildiyi fərziyyəsi altında reqressiya) mövcud müşahidələrin bütün dəsti üçün reqressiya olacaqdır:

, i = 1,…, N+M (3).

(3) təxmin edərək əldə edirik ESS R. Null hipotezini yoxlamaq üçün aşağıdakı statistikadan istifadə edirik:

Hansı ki, sıfır fərziyyənin etibarlılığı halında, payın sərbəstlik dərəcələrinin sayı ilə Fisher paylanmasına malikdir. k və məxrəc N+ M- 2k.

Əgər sıfır fərziyyə doğrudursa, biz mövcud nümunələri birinə birləşdirə və modeli qiymətləndirə bilərik. N+M müşahidələr. Əgər sıfır fərziyyəni rədd etsək, o zaman iki nümunəni bir yerə birləşdirə bilmərik və bu iki modeli ayrıca qiymətləndirməli olacağıq.


Əvvəllər nəzərdən keçirdiyimiz ümumi xətti modelin öyrənilməsi, gördüyümüz kimi, statistik aparata əsaslanaraq çox vacibdir. Ancaq bütün tətbiqlərdə olduğu kimi, mat. Statistikaya görə, metodun gücü onun əsasında duran və tətbiqi üçün zəruri olan fərziyyələrdən asılıdır. Bir müddət xətti modelin əsasında duran fərziyyələrdən birinin və ya bir neçəsinin pozulduğu vəziyyətləri nəzərdən keçirəcəyik. Bu hallarda alternativ qiymətləndirmə üsullarını nəzərdən keçirəcəyik. Bəzi fərziyyələrin rolunun digərlərinin rolundan daha əhəmiyyətli olduğunu görəcəyik. Müəyyən şərtlərin (fərziyyələrin) pozulmasının hansı nəticələrə gətirib çıxara biləcəyini görməli, onların təmin edilib-edilmədiyini yoxlaya bilməliyik və nəyi bilməliyik. statistik üsullarən kiçik kvadratların klassik üsulu uyğun olmadıqda istifadə edilə bilər və edilməlidir.

1. Dəyişənlər arasında əlaqə xətti xarakter daşıyır və tənlik - modelin dəqiqləşdirilməsi xətaları ilə ifadə edilir (tənliyə əhəmiyyətli izahedici dəyişənlərin daxil edilməməsi, tənliyə lazımsız dəyişənlərin daxil edilməsi, dəyişənlər arasında asılılıq formasının düzgün seçilməməsi);


2. X 1 ,…,X k- deterministik dəyişənlər - stoxastik reqressorlar, xətti müstəqil - tam multikollinearlıq;

4. - heteroskedastiklik;

5. at i ¹ k– səhv avtokorrelyasiyası

Söhbətə başlamazdan əvvəl aşağıdakı anlayışları nəzərdən keçirək: cüt korrelyasiya əmsalı və qismən korrelyasiya əmsalı.

Tutaq ki, bir dəyişənin digər dəyişənə təsirini araşdırırıq ( YX). Bu dəyişənlərin bir-biri ilə necə əlaqəli olduğunu başa düşmək üçün aşağıdakı düsturdan istifadə edərək ikili korrelyasiya əmsalını hesablayırıq:

Əgər korrelyasiya əmsalının qiymətini 1-ə yaxın alsaq, dəyişənlərin bir-biri ilə kifayət qədər güclü əlaqəli olduğu qənaətinə gəlirik.

Bununla belə, tədqiq olunan iki dəyişən arasında korrelyasiya əmsalı 1-ə yaxın olarsa, onlar əslində asılı olmaya bilərlər. Ruhi xəstələrin və radioqəbuledicilərin nümunəsi "yalançı korrelyasiya" deyilən bir nümunədir. Korrelyasiya əmsalının yüksək qiyməti həm də ilk iki dəyişənə güclü təsir göstərən üçüncü dəyişənin mövcudluğu ilə bağlı ola bilər ki, bu da onların yüksək korrelyasiyasının səbəbidir. Buna görə də dəyişənlər arasında “saf” korrelyasiyanın hesablanması problemi yaranır XY, yəni digər dəyişənlərin təsirinin (xətti) istisna edildiyi korrelyasiyalar. Bunun üçün qismən korrelyasiya əmsalı anlayışı təqdim olunur.

Beləliklə, dəyişənlər arasında qismən korrelyasiya əmsalını təyin etmək istəyirik XY, dəyişənin xətti təsiri istisna olmaqla Z. Onu müəyyən etmək üçün aşağıdakı prosedurdan istifadə olunur:

1. Biz reqressiyanı qiymətləndiririk,

2. Biz balansları alırıq,

3. Biz reqressiyanı qiymətləndiririk,

4. Biz balansları alırıq,

5. - qismən korrelyasiya nümunə əmsalı, dəyişənlər arasında əlaqənin dərəcəsini ölçür XY, dəyişənin təsirindən təmizlənir Z.

Birbaşa hesablamalar:

Əmlak:

Qismən korrelyasiya əmsalının qurulması proseduru iki və ya daha çox dəyişənin təsirindən xilas olmaq istədiyimiz hal üçün ümumiləşdirilir.


1. Mükəmməl multikollinearlıq.

Gauss-Markovun tələblərindən biri bizə izah edir ki, izahedici dəyişənlər heç bir dəqiq əlaqə ilə əlaqələndirilməməlidir. Əgər dəyişənlər arasında belə bir əlaqə varsa, modelin mükəmməl multikollinearlığa malik olduğunu söyləyirik. Misal. Üç izahedici dəyişəndən ibarət orta test balı olan modeli nəzərdən keçirək: I- valideyn gəliri D- gündə məşqə sərf olunan saatların orta sayı, V- həftədə məşqə sərf olunan saatların orta sayı. Aydındır ki V=7D. Və bu nisbət nümunəmizə düşən hər bir tələbə üçün yerinə yetiriləcəkdir. Tam multikollinearlıq halını izləmək asandır, çünki bu halda ən kiçik kvadratlar metodundan istifadə edərək təxminlər qurmaq mümkün deyil.

2. Qismən multikollinearlıq və ya sadəcə olaraq multikollinearlıq.

Daha çox yayılmış vəziyyət, izahedici dəyişənlər arasında dəqiq xətti əlaqənin olmadığı, lakin onlar arasında sıx korrelyasiyanın olmasıdır - bu hal real və ya qismən multikollinearlıq adlanır (sadəcə multikollinearlıq) - dəyişənlər arasında sıx statistik əlaqənin olması. Demək lazımdır ki, multikollinearlıq məsələsi daha çox fenomenin növündən deyil, təzahür dərəcəsi məsələsidir. Bütün izahedici dəyişənlər tamamilə korrelyasiya edilmədikdə, hər hansı reqressiya təxmini ondan bu və ya digər şəkildə zərər görəcək. Bu problemin nəzərdən keçirilməsi yalnız reqressiya qiymətləndirilməsinin nəticələrinə ciddi təsir göstərməyə başlayanda başlayır (reqressorlar arasında statistik əlaqələrin olması mütləq qeyri-qənaətbəxş qiymətləndirmələr vermir). Beləliklə, reqressorlar arasında güclü korrelyasiya etibarsız reqressiya qiymətləndirmələrinə səbəb olduqda multikollinearlıq problemdir.

Multikollinearlığın nəticələri:

Formal olaraq, o vaxtdan ( X"X) qeyri-degenerativdir, onda biz reqressiya əmsalları üçün OLS təxminlərini qura bilərik. Bununla belə, reqressiya əmsallarının təxminlərinin nəzəri dispersiyalarının necə ifadə edildiyini xatırlayaq: , burada a ii - i-matrisanın diaqonal elementi. Matris (X"X) degenerasiyaya yaxın olduğundan və det( X"X) » 0, sonra

1) tərs matrisin əsas diaqonalında çox var böyük rəqəmlər, çünki tərs matrisin elementləri det( ilə tərs mütənasibdir. X"X). Buna görə də nəzəri variasiya i ci əmsalı kifayət qədər böyükdür və dispersiya təxmini də böyükdür, buna görə də t- statistika kiçikdir, bu da statistik əhəmiyyətsizliyə səbəb ola bilər i-ci əmsal. Yəni dəyişənin izah edilən dəyişənə əhəmiyyətli təsiri var və biz onun əhəmiyyətsiz olduğu qənaətinə gəlirik.

2) Təxminlər və asılı olduğundan ( X"X) -1 , onun elementləri det( ilə tərs mütənasibdir. X"X), onda bir və ya iki müşahidə əlavə etsək və ya çıxarsaq, beləliklə, matrisə bir və ya iki cərgə əlavə etdik və ya sildik. X"X, sonra və qiymətləri işarənin dəyişməsinə qədər əhəmiyyətli dərəcədə dəyişə bilər - qiymətləndirmə nəticələrinin qeyri-sabitliyi.

3) Reqressiya tənliyini şərh etməkdə çətinlik. Tutaq ki, bir tənlikdə bir-biri ilə əlaqəli iki dəyişən var: X 1 və X 2. reqressiya əmsalı at X 1 dəyişiklik ölçüsü kimi şərh olunur Y dəyişdirərək X 1 ceteris paribus, yəni. bütün digər dəyişənlərin dəyərləri eyni qalır. Ancaq dəyişənlərdən bəri X 1 və X 2 əlaqəlidir, sonra dəyişəndəki dəyişikliklər X 1 dəyişəndə ​​proqnozlaşdırıla bilən dəyişikliklərlə nəticələnəcək X 2 və dəyər X 2 eyni qalmayacaq.

Misal: harada X 1 - ümumi sahə, X 2 - yaşayış sahəsi. Deyirik: “Yaşayış sahəsi 1 kv.m artırılsa, başqa şeylər bərabər olduqda, mənzilin qiyməti dollarla qalxar”. Ancaq bu vəziyyətdə yaşayış sahəsi 1 kv. m və qiymət artımı olacaq. Dəyişənlərə təsiri məhdudlaşdırın Y hər bir dəyişən ayrı-ayrılıqda artıq mümkün deyil. Mənzilin qiyməti ilə bağlı bu vəziyyətdə çıxış yolu modelə ümumi sahəni deyil, “əlavə” və ya “əlavə” deyilən ərazini daxil etməkdir.

Multikollinearlığın əlamətləri.

Multikollinearlığın mövcudluğunu (olmamasını) müəyyən etmək üçün dəqiq meyarlar yoxdur. Bununla belə, onun müəyyən edilməsi üçün evristik tövsiyələr var:

1) Reqressorlar arasında qoşalaşmış korrelyasiya əmsallarının matrisini təhlil edin və korrelyasiya əmsalının qiyməti 1-ə yaxındırsa, bu, multikollinearlığın əlaməti hesab olunur.

2) Korrelyasiya matrisinin təhlili multikollinearlığın mövcudluğu (yoxluğu) haqqında yalnız səthi mühakimədir. Bu məsələnin daha diqqətlə öyrənilməsinə qismən korrelyasiya əmsallarının hesablanması və ya reqressiyanın bütün digər izahedici dəyişənləri üçün izahedici dəyişənlərin hər birinin təyini əmsallarının hesablanması ilə nail olunur.

4) (XX) simmetrik müsbət-müəyyən matrisdir; buna görə də onun bütün xüsusi dəyərləri mənfi deyil. Əgər matrisin təyinedicisi ( XX) sıfıra bərabərdir, onda minimum xüsusi dəyər də sıfırdır və davamlılıq qorunur. Buna görə də, manimal öz dəyərinin dəyərinə görə, matrisin determinantının sıfıra yaxınlığını da mühakimə etmək olar ( XX). Bu xassədən əlavə, minimum öz dəyər də vacibdir, çünki əmsalın standart xətası ilə tərs mütənasibdir.

5) Multikollinearlığın olması xarici əlamətlərlə qiymətləndirilə bilər ki, bu da multikollinearlığın nəticəsidir:

a) təxminlərin bəzilərində iqtisadi nəzəriyyə baxımından yanlış işarələr və ya əsassız olaraq böyük dəyərlər var;

b) ilkin iqtisadi məlumatlarda kiçik dəyişiklik modelin əmsallarının təxminlərində əhəmiyyətli dəyişikliyə səbəb olur;

c) çoxluq t-əmsalların statistikası sıfırdan əhəmiyyətli dərəcədə fərqlənmir, eyni zamanda bütövlükdə model əhəmiyyətlidir, bunu yüksək dəyər sübut edir F- statistika.

Multikollinearlıqdan necə qurtulmaq olar, onu necə aradan qaldırmaq olar:

1) İstifadəsi faktor təhlili. Statistik cəhətdən asılı olanların da olduğu ilkin reqressorlar dəstindən yeni reqressorlara keçid Z 1 ,…,Z məsas komponentlər metodundan istifadə etməklə - orijinal dəyişənlərin əvəzinə, orijinal dəyişənlərin əvəzinə onların bəzi xətti kombinasiyalarını nəzərdən keçiririk, onlar arasında korrelyasiya kiçik və ya ümumiyyətlə yoxdur. Burada vəzifə yeni dəyişənlərin mənalı şərhini verməkdir Z. Əgər uğursuz olarsa, istifadə edərək orijinal dəyişənlərə qayıdırıq tərs çevrilmələr. Əldə edilən təxminlər qərəzli olacaq, lakin daha kiçik fərqə malik olacaq.

2) Bütün mövcud dəyişənlər arasında izah edilən dəyişənə daha çox təsir edən amilləri seçin. Seçim prosedurları aşağıda müzakirə olunacaq.

3) Qərəzli qiymətləndirmə üsullarına keçid.

Multikollinearlıq problemi ilə qarşılaşdıqda, təcrübəsiz tədqiqatçı əvvəlcə ona səbəb ola biləcək əlavə reqressorları aradan qaldırmaq istəyir. Bununla belə, bu mənada hansı dəyişənlərin lazımsız olduğu həmişə aydın deyil. Bundan əlavə, aşağıda göstərildiyi kimi, əhəmiyyətli dərəcədə təsir edən dəyişənlərin rədd edilməsi OLS qiymətləndirmələrində qərəzliliyə səbəb olur.

Korrelyasiya əmsalları(yəni izahedici dəyişənlər arasındakı əlaqənin gücü) reqressiya modelindən təkrarlanan amilləri aradan qaldırmağa imkan verir. Korrelyasiya əmsalı > 0,7 olarsa, iki dəyişən bir-biri ilə xətti əlaqədə olduqda aydın şəkildə kollinear olur.

Çoxsaylı reqressiya tənliyini tapmaq üçün şərtlərdən biri amillərin müstəqilliyi olduğundan amillərin kollinearlığı bu şərti pozur. Əgər a model amilləri kollineardır , sonra onlar bir-birini təkrarlayır və onlardan birinin reqressiyadan çıxarılması tövsiyə olunur.

Ekonometrikada nəticə ilə daha güclü əlaqəli olan amilə deyil, nəticə ilə güclü əlaqəsi olan, digər amillərlə ən az yaxın əlaqəyə malik olan amilə üstünlük verilir. Bunlar. amillər arasında korrelyasiya əmsalı 0,3-dən azdır və ya ideal halda sıfıra yaxındır. Bu şərt amillərin bir-birindən müstəqilliyi şəraitində nəticəyə kompleks təsirinin öyrənilməsi metodu kimi çoxsaylı reqressiyanın spesifikliyini ortaya qoyur.

Cütlü korrelyasiya əmsallarının matrisi

Məsələn, y = f(x, z, v) asılılığını öyrənərkən belə olsun. aşağıdakılar olduğu ortaya çıxdı:

x və z faktorları bir-birini təkrarlayır, çünki aralarındakı əlaqə güclüdür (0,7-dən çox). Təhlildə x deyil, z faktoru daxil edilməlidir, çünki z-nin y nəticəsi ilə korrelyasiyası x faktorunun y ilə korrelyasiyasından zəifdir, lakin Rzv-nin faktorlararası əlaqəsi xeyli zəifdir.< Rxv. Поэтому в этой задаче в включаем факторы z, v

Multikollinearlıq amilləri

Cütlük korrelyasiya əmsallarının böyüklüyünə görə, yalnız amillərin aydın kollinearlığı aşkar edilir. Çoxlu reqressiya aparatının istifadəsində ən böyük çətinliklər varlığında yaranır multikollinearlıq amilləri, ikidən çox amil xətti (güclü) asılılıqla bir-birinə bağlandıqda, yəni amillərin bir-birinə inteqral (birgə) təsiri olur.

Multikollinearlıq amillərinin mövcudluğu bəzi amillərin həmişə sinxron hərəkət edəcəyini bildirir. Nəticədə, mənbə məlumatları tamamilə müstəqil olmağı dayandırır və hər bir faktorun təsirini ayrıca qiymətləndirmək mümkün deyil. Faktorların multikollinearlığı nə qədər güclü olarsa, ən kiçik kvadratlar metodundan (LSM) istifadə etməklə, variasiya cəminin ayrı-ayrı amillər üzrə paylanmasının qiymətləndirilməsi bir o qədər az etibarlıdır.

Multikollinear amillərin modelə daxil edilməsi aşağıdakı nəticələrə görə mənfidir:

  • Çoxsaylı reqressiyanın parametrlərinin amillərin təsirinin dəyərləri kimi şərhi mürəkkəbdir, çünki amillər korrelyasiya olunur - reqressiya parametrləri iqtisadi mənasını itirir və ekonometriya üzrə nəzarətin qərarı dayandırılmalı və digər amillər nəzərə alınmalıdır.
  • parametr təxminləri etibarsızdır, böyük standart xətalara malikdir və müşahidələrin həcmi ilə dəyişir, bu da reqressiya modelini proqnozlaşdırmaq üçün yararsız edir.

Multikollinearlıq amillərinin qiymətləndirilməsi

amillərin multikollinearlığını qiymətləndirmək qoşalaşmış korrelyasiya əmsalları matrisinin determinantından istifadə edə bilərsiniz. Əgər amillər bir-biri ilə qətiyyən korrelyasiya olmasaydı, o zaman amillər arasında qoşa korrelyasiya əmsallarının matrisi vahid olardı, çünki diaqonaldan kənarda olan bütün elementlər sıfıra bərabər olardı. Beləliklə, üç faktorlu tənlik üçün

amillər arasındakı matrisin birinə bərabər nəticə olacaq.

Faktorlar arasında mütləq müəyyən olunarsa xətti asılılıq və bütün korrelyasiya əmsalları birinə bərabərdir, onda belə bir matrisin təyinedicisi (determinantı) sıfıra bərabərdir. Faktorlararası korrelyasiya matrisinin determinantı sıfıra nə qədər yaxın olarsa, amillərin multikollinearlığı bir o qədər güclü olar və çoxsaylı reqressiyanın nəticələri bir o qədər etibarsız olar.. İnterfaktorial korrelyasiya matrisinin determinantı (determinantı) birliyə nə qədər yaxındırsa, amillərin multikollinearlığı bir o qədər aşağı olur.

Multikollinearlığın mövcudluğunun xarici əlaməti matris elementlərinin çox böyük dəyərləridir (X T X) ~ 1 . Daha çox matrisin tərifi (X T X) X və onun istifadəsi, bax. 4, bənd 4.2.

Multikollinearlığın əsas əlaməti: korrelyasiya matrisinin təyinedicisi R x x. sıfıra yaxın. Əgər bütün izahedici dəyişənlər əlaqəsizdirsə, onda R XjX.| = 1, əks halda 0 R x . x . |

Multikollinearlığın mövcudluğunu müəyyən etmək üçün bir neçə əlamət var.

  • 1. Determinasiya əmsalı K 2 kifayət qədər yüksək, yüksək f-statistik, lakin çoxsaylı xətti reqressiya tənliyinin əmsallarının bəziləri (bəzən hamısı) statistik cəhətdən əhəmiyyətsizdir (aşağı 7-statistik göstəricilərə malikdir).
  • 2. Yüksək cüt korrelyasiya əmsalları və yüksək qismən korrelyasiya əmsalları.

Tərif 7.1.Qismən korrelyasiya əmsalı digər dəyişənlərin təsirindən “təmizlənmiş” iki izahlı dəyişən arasında korrelyasiya əmsalı adlanır.

Məsələn, üç izahlı dəyişən ilə X 1y X 2, X 3 arasında qismən korrelyasiya əmsalı X ( və X 2-dən "təmizlənmiş" X 3 düsturla hesablanır

Qeyd 7.2. Qismən korrelyasiya əmsalı "adi" (qoşalaşmış) korrelyasiya əmsalından əhəmiyyətli dərəcədə fərqlənə bilər. İzahedici dəyişənlər cütləri arasında korrelyasiya haqqında daha əsaslandırılmış nəticə üçün bütün qismən korrelyasiya əmsallarını hesablamaq lazımdır.

Qismən korrelyasiya əmsalının təyini üçün ümumi ifadə

harada cjj- matrisin elementləri ilə = R~x- matris interfaktorial cüt korrelyasiya matrisinə tərs R VjX. (7.1).

  • 3. İzahedici dəyişənlər arasında güclü reqressiya. İzahedici dəyişənlərdən hər hansı biri digər izahedici dəyişənlərin (xətti və ya xəttinə yaxın) birləşməsidir.
  • 4. Reqressiya əmsallarının əlamətləri iqtisadi fərziyyələrdən gözlənilənlərin əksinədir.
  • 5. Nümunədən müşahidələrin əlavə edilməsi və ya çıxarılması təxminlərin dəyərlərini xeyli dəyişir.

Yuxarıdakıları göstərmək üçün bir neçə nümunəyə baxaq.

Misal 7.4

Məhsulun həcminə görə saat aşağıdakı əsas amillərdən təsirlənir: x x- müəssisədə çalışan işçilərin sayı; x 2- əsas vəsaitlərin dəyəri; x 3- işçilərin orta əmək haqqı. Xətti çoxlu reqressiya tənliyi formaya malikdir y = b 0 + b ( x x + b 2 x 2 + b 3 x 3 .

Verilmiş model üçün cüt korrelyasiya əmsallarının matrisi

Matris təyinedicisi |D | = 0,302. Bu modeldə amillər x 2, eləcə də X (x 3 zəif əlaqəli, əksinə, amillər x 2x 3 güclü əlaqəlidir: r^ z = 0,8. Ola bilsin ki, amillər arasında güclü əlaqə var x 2x l ona görə ki, bahalı avadanlıqlarda yüksək əmək haqqı ilə yüksək ixtisaslı işçilər çalışır.

Yaranan dəyişənin amillərlə qoşa korrelyasiya əmsalları bərabər oldu: t yG| =0,7; g uh.^ =0,8; g uhz=0,75. Cütlü korrelyasiya əmsallarının tam matrisi formaya malikdir

Bütün amillər nəticəyə əhəmiyyətli dərəcədə təsir göstərir. Nəticə ilə sıx əlaqəli və bir-biri ilə zəif əlaqəli olan amillər reqressiya modelinə daxil edilməli olduğundan, bu nümunədə iki reqressiya modeli eyni vaxtda uyğun gəlir: y, = f(x v x 2) və y 2 = f(x v x 3).

Misal 7.5

Cədvəldə verilmiş nümunə verilənlər üçün multikollinearlığın mövcudluğunu öyrənək. 7.2.

Misal 7.2 üçün daxiletmə

Cədvəl 7.2

x,

Qərar.(7.2) düsturu ilə hesablanmış cüt korrelyasiya əmsalları Cədvəldə verilmişdir. 7.3.

Cədvəl 73

Cütlü korrelyasiya əmsalları

Cədvəldə verilən məlumatlardan aydın olur ki, dəyişənlər arasında güclü korrelyasiya var.G[ və x 2. Cüt korrelyasiya əmsalları Analiz Alətlər Paketindən istifadə etməklə də müəyyən edilə bilər Microsoft Excel (korrelyasiya aləti),

İzahlı və izahlı dəyişənlər arasında korrelyasiyanı yoxlayaq, bunun üçün “Korrelyasiya” alətindən istifadə edəcəyik. Microsoft Excel(korrelyasiya əmsallarını hesablaya bilərsiniz g X1/ ,(7.2) düsturundan istifadə etməklə). Nəticələr Şəkildə təqdim olunur. 7.1.


düyü. 7.1.-də izah edilən və izahedici dəyişənlər arasında korrelyasiyanın hesablanmasının nəticələri Microsoft Excel

Biz qismən korrelyasiya əmsallarını (7.4) düsturundan istifadə edərək hesablayırıq, çünki bu nümunədə yalnız üç izahlı dəyişən var (əvvəllər taparaq (7.5) düsturundan istifadə edərək qismən korrelyasiya əmsallarını da tapa bilərsiniz). tərs matris C=R():

Ən böyük dəyişənlər arasında qismən korrelyasiya əmsalı olmuşdur x x bunlardan 2-si var. Qismən korrelyasiya əmsalı g xxx^x2 cüt əmsalının işarəsinin ən kiçik və əksi g x x.

Cavab verin. Modeldəki dəyişənlər arasında güclü korrelyasiya var x xx 2.

Baxış-icmal