prednaska2 em

Views:
 
Category: Entertainment
     
 

Presentation Description

No description available.

Comments

Presentation Transcript

Slide1: 

Odhad klasického lineárneho modelu

Slide2: 

Za predpokladu stochastickej lineárnej závislosti medzi vysvetľovanou Y a k vysvetľujúcimi premennými Kde je náhodná zložka a regresný koeficient či parameter pri premennej j Premennú je možné bližšie špecifikovať ako pomocnú premennú, ktorá vo všetkých pozorovaniach nadobúda hodnoty rovné jednej, takže prvý parameter je tzv. úrovňová konštanta alebo absolútny člen

Slide3: 

Na základe výberu o rozsahu n pozorovaní model odhadneme MNŠ pomocou funkcie kde Sú bodové odhady neznámych parametrov Vyrovnaná, vypočítaná, predikovaná premenná, takže jej vyrovnané hodnoty pre jednotlivé pozorovania je možné zapísať

Slide4: 

Rozdiel medzi skutočnými a predikovanými hodnotami v jednotlivých pozorovaniach označujeme ako rezíduum Je zrejmé že lebo rezíduum je rozdiel skutočných hodnôt a vyrovnaných, náhodná zložka je rozdiel medzi skutočnými hodnotami a očakávanými alebo priemernými hodnotami. Rezíduá sú závislé na vyrovnaných hodnotách a tým aj na použitej výberovej regresnej funkcii, dospejeme pomocou rôznych výberových regresných rovníc k rozdielnym množinám rezíduí.

K zjednodušeniu odvodenia výpočtových postupov v ekonometrii používame lineárnu algebru, tj. zápis modelu v maticovom tvare.: 

K zjednodušeniu odvodenia výpočtových postupov v ekonometrii používame lineárnu algebru, tj. zápis modelu v maticovom tvare. Čo budeme pre zjednodušenie písať Je stĺpcový vektor n pozorovaní hodnôt vysvetľovanej premennej Matica n x k pozorovaní hodnôt vysvetľujúcich premenných Stĺpcový vektor k neznámych parametrov Stĺpcový vektor n hodnôt náhodnej zložky Rozdiel počtu pozorovaní n a počtu odhadovaných parametrov k je počet stupňov voľnosti, pričom musí platiť n andgt; k.

Slide6: 

Pre Klasický lineárny model musia byť splnené tieto základné požiadavky: 1. 2. 3. Je nestochastická matica 4. Má plnú hodnotu k. Prvá požiadavka znamená, že náhodné zložky majú vo všetkých výberoch identické rozdelenie s nulovou strednou hodnotou. Druhá požiadavka je vyjadrením homoskedasticity (konštantnosti rozptylu náhodnej zložky) a sériovej nezávislosti.

Slide7: 

Prvky na diagonále kovariančnej matice predstavujú konečný a konštantný rozptyl náhodnej zložky , nediagonálne prvky sú nulové kovariancie, takže hodnoty náhodnej zložky sú po dvojiciach neskorelované. Tretia požiadavka predpokladá, že pri opakovaných výberoch by pozorovania vysvetľujúcich premenných nadobúdali fixné hodnoty, tj. jediným zdrojom meniacej sa variability y v rôznych výberoch je len premenlivosť vektora náhodných zložiek. Štvrtá požiadavka predpokladá, že matica X neobsahuje žiadne perfektne lineárne závislé stĺpce pozorovaní vysvetľujúcich premenných. Matica je symetrická a regulárna rádu k, tj existuje k nej inverzná matica Splnenie týchto základných požiadaviek, však predpokladá, že model je presne špecifikovaný v súlade s ekonomickou teóriou.

Slide8: 

Metóda najmenších štvorcov Za predpokladu, že sú splnené uvedené základné požiadavky je možné vektor neznámych parametrov odhadnúť metódou najmenších štvorcov (MNŠ). Jej výhodou je, že poskytuje odhady s optimálnymi vlastnosťami i pre malé výbery pozorovaní. Predpokladajme, že lineárny model má tvar Ak určíme extrém tejto funkcie (minimum), čo z matematického hľadiska je prvá parciálna derivácia dostaneme

Slide9: 

Vlastnosti odhadovej funkcie Odhady parametrov sa pre rôzne výbery líšia, tzn. výsledkom je výberové rozdelenie hodnôt odhadu parametrov. K požadovaným vlastnostiam odhadových funkcií, platným i pre malé výbery je nestrannosť, výdatnosť, konzistencia, neskreslenosť a suficiencia. Bodová odhadová funkcia najmenších štvorcov sa nazýva najlepšia lineárna nestranná odhadová funkcia (NLNOF). Z Gaussovej –Markovovej vety nevyplýva žiadna požiadavka ohľadom špecifikácie tvaru rozdelenia náhodných zložiek. Nemusia byť teda normálne rozdelené, ale môžu mať napríklad aj rovnomerné rozdelenie. K výpočtu odhadu variačno kovariačnéj matice V(b)pomocou matice S(b) potrebujeme poznať rozptyl náhodných zložiek . Odhadom je nestranná štatistika kde

Slide10: 

M = Štandardné chyby parametrov potom vypočítame: Kde je j - ty diagonálny prvok momentovej matice M.

Slide11: 

2. Štatistická indukcia v klasickom lineárnom modeli Pri bodovom odhade parametrov modelu pomocou MNŠ, nebolo potrebné predpokladať žiadne konkrétne rozdelenie pravdepodobnosti náhodných zložiek alebo rezíduí. Avšak pre intervalový odhad parametrov, testovanie ich štatistickej významnosti je potrebné doplniť predchádzajúce štyri požiadavky o predpoklad normality. V podstate požadujeme aby vektor náhodných zložiek mal n – rozmerné normále rozdelenie s nulovým vektorom stredných hodnôt a kovariančnou maticou alebo Pri predpoklade normality je odhadová funkcia najmenších štvorcov pre regresné parametre modelu identická s odhadovou funkciou metódy maximálnej vierohodnosti.

Slide12: 

2.1 Testovanie významnosti odhadnutých parametrov K detailnému vyhodnoteniu kvality jednotlivých parametrov regresného modelu sa používajú t testy parametrov. Pri teste formulujeme nulovú hypotézu: H0 : pre j = 1,2, ..., k v ktorej predpokladáme nulové teda nevýznamné pôsobenie či vplyv premennej pri ktorej parameter stojí. Testovacie kritérium je definované vzťahom Vypočítanú hodnotu testovacieho kritéria porovnávame s kvantilom t rozdelenia na hladine významnosti a stupňov voľnosti n – k tj.: ak nulovú hypotézu o nevýznamnosti parametra potvrdzujeme ak zamietame nulovú hypotézu a potvrdzujeme štatistickú významnosť posudzovaného parametra. Pre n – k andgt;30 sa rozdelenie t takmer nelíši od normálneho rozdelenia H0 :

Slide13: 

Okrem bodových odhadov parametrov lineárnej regresnej funkcie sa často prepočítavajú aj intervalové odhady parametrov, ktoré nazývame intervaly spoľahlivosti. 2.2 Intervaly spoľahlivosti pri lineárnej regresii. kde M =

Slide14: 

2.3 Kritéria zhody odhadnutého modelu s dátami Základom pre výpočet takýchto číselných charakteristík je rozklad celkového súčtu štvorcov odchýlok endogénnej premennej Yi od priemeru premennej Y , ktorý je možné označiť (C), na vysvetlený súčet štvorcov odchýlok teoretických hodnôt závisle premennej od priemeru (V) a nevysvetlený súčet štvorcov odchýlok empirických a teoretických hodnôt (N) tzv. reziduálny súčet štvorcov odchýlok. Je zrejmé, že platí vzťah C = V + N kde C = je celkový súčet štvorcov odchýlok V = je vysvetlený súčet štvorcov odchýlok N = je nevysvetlený (reziduálny) súčet štvorcov odchýlok Koeficient viacnásobnej determinácie

Slide15: 

alebo Koeficient determinácie môže nadobúdať hodnoty z intervalu (0,1), čím viac sa hodnota indexu blíži k jednotke, tým väčšia časť celkovej variability je modelom vysvetlená a naopak, ak sa index determinácie blíži k nule, tým menšia časť celkovej variability je modelom vysvetlená.. Index determinácie sa bežne používa ako kritérium pri rozhodovaní o voľbe konkrétneho tvaru regresnej funkcie. Ak však majú regresné funkcie rôzny počet parametrov je potrebné upraviť index determinácie do korigovanej podoby v tvare:

Slide16: 

Odmocnina z koeficienta determinácie je koeficient korelácie, vyjadrujúci mieru tesnosti závislosti vysvetľovanej premennej od vysvetľujúcich premenných. Môže nadobúdať v absolútnom vyjadrení hodnoty od (0, 1), pričom čím viac sa jeho hodnota blíži k jednej tým je závislosť silnejšia a naopak čím viac sa blíži jeho hodnota k nule tým je závislosť medzi premennými slabšia. Štatistickú významnosť modelu ako celku môžeme tiež testovať pomocou F testu Ktorý porovnávame s kritickou hodnotou F ak F považujeme regresný model za nevýznamný, podobne aj koeficient determinácie a koeficient korelácie. Ak F andgt; považujeme regresný model za štatisticky významný, podobne aj koeficient determinácie a koeficient korelácie.

Slide17: 

Testovanie významnosti modelu ako celku meranie variability sumou štvorcov - SS (Sum of Squares) čím sú väčšie odchýlky, tým je väčšia variabilita súčet odchýlok od priemeru sa rovná nule použije druhé mocniny odchýlok od priemerov suma štvorcov modelu – SSM V meria variabilitu modelu akú časť variability závisle premennej možno vysvetliť pôsobením nezávislej premennej suma štvorcov náhodnej chyby – SSE N meria variabilitu náhodných činiteľov, čiže variabilitu nevysvetlenú modelom akú časť variability závisle premennej nemožno vysvetliť pôsobením nezávisle premennej celková suma štvorcov – SST C meria celkovú variabilitu závisle premennej SST=SSM+SSE alebo už známe C=V + N

Slide18: 

SBC štatistika - Schwartz bayesovské kritérium Iné kritériá výberu modelu AIC štatistika - Akaikeho informačné kritérium vhodnejšie sú modely s menšími hodnotami AIC a SBC obidve miery zohľadňujú presnosť modelu aj počet parametrov

Slide19: 

2.5 Beta koeficienty Beta koeficienty vyjadrujú percentuálny podiel vplyvu j – tej vysvetľujúcej premennej na vysvetľovanú endogénnu premennú bj vypočítaný parameter j – tej vysvetľujúcej premennej štandardná odchýlka j - tej vysvetľujúcej premennej štandardná odchýlka vysvetľovanej premennej y Často ich upravujeme na súčet rovný determinácii

Slide20: 

2.6 Prezentácia odhadnutého modelu

Slide21: 

Príklad 6.5 Vedenie podniku, ktorému podlieha 13 výrobných družstiev zaujíma ako závisia výkony od vybavenia družstva strojmi a zariadením a od počtu pracovníkov v dielni. Podkladové údaje sú v tabuľke (6.11). Úlohy: a) kvantifikovať závislosť výkonov od obidvoch ukazovateľov súčasne b) overiť vypovedaciu schopnosť použitého modelu) posúdiť, či oba ukazovatele vplývajú na úroveň výkonov významne, resp. ktorý viac a ktorý menej. Regresný model popisujúci závislosť výkonov (y) od vybavenia (x1) a počtu pracovníkov (x2) popíšeme lineárnou funkciou v tvare

Slide22: 


Slide23: 

Predstavme si, že pre dáta v grafe sme odhadli regresnú priamku, ako je uvedená vedľa grafu. Koeficient determinácie bude 67%. Ak zobrazíme dáta zistíme, že môžeme byť spokojný, pretože závislosť je skutočne lineárna. Nedostatky mier kvality odhadu

Slide24: 

Rovnaký model a koeficient determinácie môže dostať aj pre dáta zobrazené v grafe. V takomto prípade, ale s modelom nemôžeme byť spokojný, pretože závislosť nie je lineárna.

Slide25: 

V hore uvedenom grafe máme ďalší prípad, keď vypočítame rovnakú priamku aj rovnaký koeficient determinácie. Problém je však v tom, že ich odhad je ovplyvnený jednou extrémnou hodnotou , ktorá mení sklon priamky aj hodnotu koeficienta determinácie.

Slide26: 

V poslednom grafe má jedno pozorovanie rozhodujúci vplyv na zistenie významnej lineárnej závislosti. Vedie k dramatickým zmenám v odhade lineárnej regresie, ktorá by bez neho bola nevýznamná.

Slide27: 

Nedostatky mier kvality odhadu Posudzovať kvalitu modelu v oblasti splnenia predpokladov len na základe mier ako je koeficient determinácie a jemu podobným môže byť zavádzajúce. Pre posúdenie splnenia predpokladov je potrebné použiť špeciálne nástroje.

Slide28: 

Diagnostika modelu Proces preskúmavania splnenia predpokladov modelu nazývame diagnostikou modelu. Jej cieľom je pomocou špeciálnych nástrojov overiť, či sú splnené všetky predpoklady regresnej analýzy

Slide29: 

Diagnostické nástroje

Slide30: 

Reziduálne odchýlky

Slide31: 


Slide32: 

Typy reziduálov

Slide33: 

|es| andgt; 3  indikuje extrémne hodnoty Grafická diagnostika modelu

Slide34: 

Pre modely spĺňajúce predpoklady: reziduálne odchýlky sú náhodne rozmiestnené okolo nuly studentizované reziduály sú v rozpätí od -2 do 2

Slide35: 


Slide36: 


Slide37: 


authorStream Live Help