StiuCum - home - informatii financiare, management economic - ghid finanaciar, contabilitatea firmei
Solutii la indemana pentru succesul afacerii tale - Iti merge bine compania?
 
Management strategic - managementul carierei Solutii de marketing Oferte economice, piata economica Piete financiare - teorii financiare Drept si legislatie Contabilitate PFA , de gestiune Glosar de termeni economici, financiari, juridici


Dovedeste-ti eficienta, sau invata de la altii
ECONOMIE

Economia este o stiinta sociala ce studiaza productia si desfacerea, comertul si consumul de bunuri si servicii. Potrivit definitiei date de Lionel Robbins in 1932, economia este stiinta ce studiaza modul alocarii mijloacelor rare in scopuri alternative. Deoarece are ca obiect de studiu activitatea umana, economia este o stiinta sociala.

StiuCum Home » ECONOMIE » statistica
Trimite articolul prin email Studiul statistic al corelatiilor dintre fenomene : Statistica Publica referat pe tweeter Trimite articolul prin facebook

Studiul statistic al corelatiilor dintre fenomene



Studiul statistic al corelatiilor dintre fenomene


Fenomenele si procesele economice se gasesc in relatii de interdependenta, astfel incat unele se comporta ca fenomene cauza, determinante, independente sau factoriale, iar altele sunt fenomene efect, determinate, dependente sau rezultative.

Concluzii utile privind interdependenta dintre indicatorii statistici pot fi formulate numai in conditiile folosirii unui volum suficient de mare de date. Daca se studiaza corelatii intre serii dinamice de indicatori numarul minim de segmente de timp trebuie sa fie de 15, iar in cazul seriilor de indicatori obtinuti in urma unor experimentari, numarul minim de indicatori este apreciat la 40. In unele situatii concrete se remarca faptul ca o semnificatie crescuta a indicatorilor care exprima diverse aspecte ale corelatiilor dintre fenomene este mult imbunatatita atunci cand numarul determinarilor statistice depaseste 100.




Pentru a studia legaturile statistice care se formeaza intre fenomene pot fi utilizate mai multe modalitati de observatie si de calcul, grupate astfel:


- metode simple sau de observatie

- metoda compararii seriilor paralele de date statistice interdependente

- metoda tabelului de corelatie

- metoda grafica

- metode analitice

- metode parametrice (metode statistico-matematice de analiza a corelatiilor)

- metode neparametrice (metode de analiza a corelatiei rangurilor)


Metoda compararii seriilor paralele de date statistice interdependente consta in stabilirea legaturilor de interdependenta dintre fenomenele social-economice prin compararea a doua sau mai multe serii de indicatori.

In cazul seriilor de repartitie indicatorii care se refera la variabila determinanta sau independenta se aseaza in ordine crescatoare sau descrescatoare si in mod paralel se inscriu apoi valorile corespunzatoare variabilei (caracteristicii) dependente. Daca se compara serii cronologice de indicatori acestia se pozitioneaza in mod paralel pe segmente de timp identice. Metoda compararii seriilor paralele de date statistice interdependente se poate utiliza, de asemenea, si atunci cand seriile respective de indicatori sunt inscrise in raport cu o caracteristica de spatiu (teritoriala).

Cu ajutorul acestei metode poate fi identificata, astfel, o anumita corespondenta a modificarilor inregistrate de indicatorii seriilor comparate, directia si intensitatea orientativa a modificarilor.


Metoda tabelului de corelatie. Tabelul de corelatie este un tabel statistic cu dubla intrare si cuprinde doua serii statistice de repartitie, o serie reprezinta seria de variante, sau intervalele de grupare, ale caracteristicii determinante, iar cealalta serie se refera la caracteristica dependenta (determinata). Tabelul de corelatie este o forma de grupare combinata efectuata dupa doua caracteristici considerate in sistem interdependent.

In functie de modul in care se distribuie frecventele aferente celor doua caracteristici se poate contura o apreciere cu privire la existenta sau inexistenta unei legaturi statistice, forma si directia legaturii. Concentrarea frecventelor in jurul uneia dintre diagonalele tabelului indica existenta unei 626f59g anumite legaturi statistice, iar daca se remarca o imprastiere a frecventelor in tot spatiul tabelului se apreciaza ca cele doua caracteristici nu manifesta o stare de interdependenta.

Prin metoda tabelului de corelatie se identifica daca exista o legatura statistica intre fenomenele studiate, in profil static, la un anumit moment la care se refera datele, legatura care poate sa nu se mai manifeste la alte momente de existenta a unitatilor statistice.


Metoda grafica este una din cele mai utilizate metode pentru evidentierea legaturilor care se formeaza intre caracteristicile statistice. Aceasta metoda poate avea atat o utilizare independenta cat si in contextul aplicarii altor metode cu o structura de lucru mai complexa cum ar fi metodele statistico-matematice de analiza a corelatiilor.

Metoda graficului de corelatie (corelograma) consta in analiza unui grafic construit pe baza axelor rectangulare, valorile caracteristicii independente se inscriu pe abscisa, iar cele ale caracteristicii rezultative se inscriu pe axa ordonatelor. Reprezentarea punctelor de intersectie a valorilor celor doua caracteristici (“norul de puncte”) ofera o dispunere care permite, prin observatie, sa se concluzioneze asupra existentei corelatiei, precum si asupra directiei si formei analitice de manifestare a corelatiei.


Metodele statistico-matematice de analiza a corelatiilor dintre fenomene fac parte din categoria metodelor de analiza factoriala, sunt metode cu caracter analitic si permit dimensionarea intensitatii interdependentei dintre doua sau mai multe fenomene, viteza de modificare a fenomenelor efect prin modificarea fenomenelor cauza, precum si forma analitica a relatiei de interdependenta exprimata printr-o ecuatie de regresie. Aceste metode prezinta o larga aplicabilitate practica datorita consistentei informatiilor pe care le ofera.


Corelatiile care se manifesta intre fenomene sunt expresii ale asocierii unor dimensiuni cifrice date de indicatorii statistici cu continut economic sau de alta natura, si pot fi clasificate in functie de urmatoarele criterii:

1) Dupa numarul caracteristicilor care intervin intr-un sistem de interdependenta statistica, se disting:

-corelatii simple, cand sistemul considerat cuprinde o caracteristica (fenomen) cauza si o caracteristica (fenomen) efect;

- corelatii multiple, cand se studiaza un sistem format din doua sau mai multe caracteristici determinante si o caracteristica rezultativa.

2) Dupa sensul sau directia corelatiei, pot exista:

- corelatii directe, cand modificarea intr-un anumit sens a fenomenului cauza determina modificarea in acelasi sens a fenomenului efect;

- corelatii inverse, cand modificarea intr-un anumit sens a fenomenului cauza determina modificarea in sens invers a fenomenului efect.


3) Dupa forma analitica, legaturile de interdependenta pot fi:

- corelatii liniare,

- simple, exprimate cu ajutorul ecuatiei:

- multiple, sintetizate prin ecuatia

, daca variabilele independente (x sunt in numar de trei

- corelatii de tip parabolic,

- simple:

- multiple: , daca variabilele independente (x) sunt in numar de doua

- corelatii de tip hiperbolic,

- simple

- multiple:

- corelatii de tip exponential,

- simple

- multiple:


4) Dupa tipul sincronizarii corelatiei in timp (in cazul corelatiilor dintre indicatori prezentati in serii dinamice):

- corelatii concomitente;

- corelatii cu decalaj.


In cadrul ecuatiilor de regresie fenomenul efect (rezultativ, determinat sau dependent) este notat cu y, fenomenul sau fenomenele cauza (determinante sau independente) cu x, iar parametrii a b c d, asociati fenomenelor determinante sau independente se numesc coeficienti de regresie.


In cazul abordarii unei probleme de analiza a corelatiei dintre fenomene cu ajutorul metodelor statistico-matematice, se are in vedere parcurgerea urmatoarelor etape:


* constituirea sistemului de indicatori statistici sau de masurare propusi a fi studiati in sistem interdependent.

Se mentioneaza ca in aceasta etapa de lucru trebuie sa se tina seama de conditiile restrictive ce privesc volumul datelor. In cazul studierii corelatiei intre indicatori statistici prezentati sub forma seriilor dinamice, numarul minim acceptat este de 15 indicatori, iar in cazul datelor obtinute prin experimentari sau masurari ale unor unitati retinute prin sondaj, numarul minim de indicatori este apreciat la 40;


* analiza sistemului propus prin prisma cunostintelor de economie generala, precum si a experientei practice din domeniul concret al masuratorilor efectuate, in vederea stabilirii caracterului real sau absurd de existenta a interdependentei intre fenomenele sistemului.

Aceasta decizie este necesara deoarece prelucrarea indicatorilor initiali se realizeaza folosind o metodologie matematica care nu poate preciza caracterul real sau absurd al corelatiei.


* se apreciaza, tot pe baza de analiza, care este tipologia fenomenelor constituite in sistem interdependent, respectiv care este fenomenul dependent-efect (y) si care este fenomenul independent-cauza (x);


* se reprezinta grafic sisteme de corelatie constituite dintr-un fenomen efect si unul cauza, folosind axele rectangulare. Pe grafic va rezulta un 'nor de puncte' care va sugera forma ecuatiei de regresie in functie de modul de dispunere a punctelor in plan;


* pe baza reprezentarii grafice, prin apreciere vizuala, se alege forma ecuatiei de regresie, considerata ca sintetizand in mod corespunzator modul de asezare a norului de puncte;


* se estimeaza valorile parametrilor din ecuatia de regresie aleasa, folosind metoda celor mai mici patrate, care consta in minimizarea sumei patratelor abaterilor nivelurilor reale ale fenomenului dependent-efect (y) de la nivelurile calculate pe baza ecuatiei de regresie ale aceluiasi fenomen (yc

Minimum acestei sume se obtine prin egalarea cu zero a derivatelor partiale ale sumei in raport cu parametrii ecuatiei.

In cazul particular al unei ecuatii de regresie de forma: , sistemul de ecuatii obtinut prin metoda celor mai mici patrate care permite estimarea parametrilor ecuatiei de regresie, “a” si “b”, este dedus astfel:

De unde rezulta:

*


Rezolvarea matriciala a sistemului se bazeaza pe relatia:

in care:

A reprezinta matricea sistemului de ecuatii

A-1 este matricea inversa a matricei A

B reprezinta vectorul termenilor liberi

C reprezinta vectorul coeficientilor (parametrilor) ecuatiei de regresie, “a” si “b”.

* se calculeaza estimatia erorii standard pentru fiecare parametru al ecuatiei de regresie si se verifica semnificatia parametrilor cu ajutorul Criteriului 't'.

Confirmarea semnificatiei parametrilor ecuatiei de regresie este atestata cu ajutorul Criteriului 't' care consta in a compara variabila t-statistic cu variabila t-tabelara corespunzatoare unui anumit prag de semnificatie (de obicei se opteaza pentru o probabilitate P = 95%, respectiv un prag de semnificatie q = 5%, q = 1-P ) si f = n - k grade de libertate, distribuita dupa functia de repartitie Student). Se precizeaza ca 'n' reprezinta numarul variantelor, iar 'k' reprezinta numarul parametrilor ecuatiei de regresie.


Variabila t-statistic se obtine raportand estimatia parametrului la estimatia erorii standard asociata fiecaruia dintre parametrii ecuatiei, astfel:

Daca ecuatia de regresie este de forma:

- pentru parametrul a, , in care sa este estimatia erorii standard a parametrului a,

- pentru parametrul b, , in care sb este estimatia erorii standard a parametrului b,

- pentru parametrul c, , in care sc este estimatia erorii standard a parametrului c,

- pentru parametrul d, , in care sd este estimatia erorii standard a parametrului d,


Nota: Estimatiile erorilor standard ale parametrilor ecuatiei de regresie (sa, sb, sc si sd) sunt determinate prin extragerea radacinii patrate din elementele situate pe diagonala principala a matricei rezultate din produsul estimatiei dispersiei erorii standard a ecuatiei de regresie sau patratului erorii standard a ecuatiei de regresie () cu matricea inversa a produsului matricei transpuse a variabilelor independente ( X' ) cu matricea initiala a acestor variabile ( X ) :


in care,


Testarea si interpretarea semnificatiei parametrilor ecuatiei de regresie conduce la urmatoarele concluzii:

-daca marimea cifrica a parametrul 'a' este suficient de mare, se obtine informatia ca sistemul de corelatie studiat este format dintr-un numar redus de variante dar, in anumite conditii date ale analizei abordate aceasta concluzie poate fi ignorata. Importanta acestui parametru pentru analiza economica este relativ redusa iar procedura verificarii semnificatiei statistice a acestuia este aplicata, de regula, in scop demonstrativ.

-testarea semnificatiei parametrului “b”, “c”, si“ d” este efectuata, de asemenea, prin compararea indicatorului t-statistic cu t-tabelar ( q = 0,05; f = n - k). Daca se constata o inegalitate in favoarea marimii tabelare a lui “t” se accepta ipoteza nula si deci putem afirma cu suficienta incredere ca parametrul respectiv are o marime care nu difera semnificativ de zero. In aceste conditii caracteristica asociata acestui coeficient devine neinteresanta in sistemul de corelatie studiat si poate fi eliminata din sistem. In cazul existentei unei inegalitati in favoarea marimii statistice, calculate, se respinge ipoteza nula si prin urmare parametrul respectiv are o marime care difera semnificativ de zero iar variabile independenta asociata este semnificativa in cadrul sistemului interdependent studiat.

Decizia de a elimina o variabila independenta dintr-un sistem interdependent multiplu se poate lua si atunci cand marimea coeficientului de regresie asociat variabilei este foarte mica, situatie in care variabila dependenta este deci influentata intr-o masura considerata nesemnificativa;


* se calculeaza nivelurile estimate (teoretice) ale fenomenului efect prin aplicarea ecuatiei de regresie, urmarindu-se realizarea urmatoarei egalitati:



Prin aceasta egalitate se confirma exactitatea calculelor efectuate pana la aceasta etapa de lucru.


* se procedeaza la testarea ipotezei privind existenta autocorelatiei intre valorile variabilei reziduale cu ajutorul criteriului statistic DURBIN-WATSON care se bazeaza pe calculul si interpretarea urmatorului indicator ( coeficientul de autocorelatie - DW):


;


Criteriului statistic DURBIN-WATSON atesta o buna eficacitate a parametrilor ecuatiei de regresie si respectiv a ecuatiei de regresie de a fi utilizata in calcule care vizeaza extrapolarea corelatiei studiate, daca marimea coeficientul de autocorelatie - DW este cuprinsa in intervalul 1,8 si 2,2.


Se precizeaza ca indicatorul statistic DW poate avea o marime situata in intervalul, 0 si 4:

- daca: 0,0 DW < 1,8, se confirma o corelatie pozitiva intre termenii de eroare sau reziduali (autocorelatie pozitiva);


- daca: 2,2 < DW 4,0, se confirma o corelatie negativa intre termenii de eroare sau reziduali (autocorelatie negativa);




- daca: 1,8 DW 2,2, se infirma existenta autocorelatiei intre termenii reziduali;


- valoarea ideala a indicatorului statistic DW, pentru a constata absenta autocorelatiei intre termenii reziduali, este 2.


In cazul ecuatiilor de regresie care nu au parametrul “a“, testarea existentei autocorelatiei intre variantele variabilei reziduale cu ajutorul indicatorului statistic DW nu este relevanta.


* se calculeaza intensitatea corelatiei, folosind:

a)- Raportul de corelatie este forma generala de calcul a intensitatii corelatiei dar se utilizeaza, in special, in cazul corelatiilor simple neliniare si multiple,


, unde


este valoarea medie a variabilei dependente.

Uneori se practica si un calcul corectat (ajustat) al raportului de corelatie in functie de numarul gradelor de libertate aferente celor doua sume de patrate. Se mentioneaza ca acest calcul este aplicat, de regula, atunci cand baza de date este reprezentata de un esantion si in consecinta raportul de corelatie corectat este masura estimatiei intensitatii corelatiei dintre fenomenele sistemului studiat. Relatia de calcul a raportului de corelatie corectat are urmatoarea forma:




sau,


in care : k = numarul parametrilor din ecuatia de regresie.


Rezultatul raportului de corelatie se considera, practic, ca nu are semn algebric si se incadreaza ca marime in intervalul 0 si 1. Cu cat raportul de corelatie are o valoare mai apropiata de 1, cu atat legatura dintre fenomenele sistemului studiat este mai puternica si, dimpotriva, cu cat valoarea sa se apropie de 0 se apreciaza ca interdependenta este slaba sau inexistenta. Se considera o corelatie foarte puternica atunci cand Ry.x are o valoare cuprinsa intre 0,8 si 1. Daca marimea raportului de corelatie este cuprinsa intre 0,6 si 0,8, se considera existenta unei corelatii suficient de puternica; daca rezultatul se situeaza intre 0,4 si 0,6, corelatia este de intensitate medie; iar daca valoarea sa este mai mica de 0,4, corelatia este slaba sau inexistenta.


b)- Coeficientul simplu de corelatie liniara - ca forma particulara a raportului de corelatie - se aplica numai in cazul corelatiei sintetizata prin ecuatia de regresie, y = a + bx


in care: n = numarul variantelor


Marimea acestui coeficient se poate situa intre -1 si +1, semnul coeficientului aratand sensul legaturii (inversa, cand are semnul minus sau directa cand este pozitiv). Cu cat coeficientul simplu de corelatie are o valoare mai apropiata de +1 sau de -1, cu atat legatura dintre fenomenele sistemului studiat este mai puternica si, dimpotriva, cu cat valoarea sa se apropie de 0 se apreciaza ca interdependenta este mai slaba sau inexistenta. Interpretarea acestui coeficient pe intervale de marimi, indiferent de semnul rezultatului, este similara cu aceea prezentata in cazul raportului de corelatie.


* se verifica semnificatia indicatorului care exprima intensitatea corelatiei cu ajutorul Criteriului 'F' .

Criteriul 'F' folosit pentru verificarea semnificatiei raportului de corelatie se aplica prin compararea variabilei F-statistic cu variabila F-tabelar care corespunde probabilitatii P = 0,95 si numarului gradelor de libertate, f1 = k - 1 si f2 = n - k ,


Daca F-statistic > F-tabelar ipoteza nula este respinsa si deci, raportul de corelatie este semnificativ diferit de zero.

In acelasi timp, raportul de corelatie si expresia relativa a estimatiei erorii standard a ecuatiei de regresie () confirma prin marimea lor ca, ecuatia de regresie formalizeaza corect, din punct de vedere analitic, legitatea statistica a corelatiei dintre variabilele sistemului considerat si poate fi utilizata cu suficienta incredere pentru a estima niveluri viitoare ale variabilei dependente in conditiile adoptarii unor variante posibile ale marimii variabilelor independente.


* se calculeaza coeficientul de determinare in forma procentuala, astfel:

In cazul corelatiilor simple se calculeaza coeficientul simplu de determinare, pe baza relatiei:

sau, ;

iar in cazul corelatiilor multiple, se calculeaza coeficientul multiplu de determinare:

Coeficientul de determinare exprima cat la suta din modificarea (variatia) indicatorului rezultativ (y) este determinata de modificarea (variatia) indicatorului (indicatorilor) factorial sau independent din sistemul interdependent considerat. Diferenta pana la 100% este reprezentata de influenta altor factori care nu au fost cooptati in sistemul studiat.

* se calculeaza estimatia erorii medii a ecuatiei de regresie (estimatia erorii standard a regresiei) in expresie absoluta:


,


si in expresie relativa:



Acest indicator exprima 'puterea' ecuatiei de regresie, atunci cand este folosita in calcule de extrapolare sau de prognoza. Se considera o eroare medie relativa de o marime foarte buna, cand aceasta se situeaza sub 5% si de o marime buna, cand are o valoare cuprinsa intre 5% si 10% . Interpretarea acestui indicator de eroare este complementara concluziei oferita de criteriul statistic DURBIN-WATSON


O semnificatie statistica similara aceleia pe care o ofera eroarea medie relativa a ecuatiei de regresie este obtinuta prin calculul si interpretarea “Coeficientului de neregularitate al lui Theil” care se determina astfel:



Coeficientul de neregularitate al lui Theil poate lua o valoare cuprinsa intre zero si unu. Daca, , valorile estimate ale variabilei dependente () exprima perfect prognoza fenomenului. Se considera ca fiind o marime foarte buna a coeficientului de neregularitate al lui Theil atunci cand nu depaseste limita de 5%.



Exemplul 4

Exemplificarea metodologiei statistice pentru analiza corelatiei dintre fenomene (metode statistico-matematice sau parametrice de analiza a corelatiei) va fi efectuata pe baza seriilor dinamice a doi indicatori statistici, prezentati intr-o forma conventionala, “dinamica cheltuielilor pentru servicii” (SERIA 01) - variabila dependenta (y) si “dinamica veniturilor” (SERIA 02) - variabila independenta (x).


Tabelul 3

Anul

Dinamica cheltuielilor pentru servicii

SERIA 01 (y)

Dinamica veniturilor


SERIA 02 (x)


1,00

2,00


2,00

4,00


4,00

6,00


5,00

8,00


8,00

10,00

Total




Reprezentarea grafica a corelatiei dintre seria 01 si seria 02 este expusa in figura 1.

Fig. 1


Pe baza reprezentarii grafice din figura 1 se conchide ca ecuatia de regresie, y = a + bx, sintetizeaza in mod corespunzator interdependenta dintre cele doua variabile deoarece distributia norului de puncte se grupeaza in jurul unei linii drepte.

Calculul valorilor estimate ale parametrilor ecuatiei de regresie se realizeaza cu ajutorul metodei celor mai mici patrate.

Sistemul de ecuatii obtinut prin metoda celor mai mici patrate care permite estimarea parametrilor ecuatiei de regresie este:


*


Rezolvarea matriciala a sistemului:


in care:

A reprezinta matricea sistemului de ecuatii

A-1 este matricea inversa a matricei A

B reprezinta vectorul termenilor liberi

C reprezinta vectorul coeficientilor ecuatiei de regresie

(a = -1,10, b = 0,85).


Vectorul B poate fi obtinut astfel:




Calculul termenilor care formeaza vectorul coeficientilor ecuatiei de regresie, prin inmultirea matricei () cu vectorul (B), se realizeaza astfel:


transpusa asociata matricea

matricei A = transpusei inversa = A-1

matricei A


Valoarea determinantului asociat matricei sistemului de ecuatii:


Rezulta ca ecuatia de regresie are urmatoarea forma:


y = -1,10 + 0,85x

Parametrul, b = 0,85, este denumit coeficient de regresie sau propensiunea marginala deoarece cuantifica modificarea fenomenului dependent atunci cand variabila independenta se modifica cu o unitate.

Calculul valorii estimate a erorii standard pentru fiecare parametru al ecuatiei de regresie are la baza urmatoarea metodologie:

- se calculeaza produsul estimatiei patratului erorii standard a ecuatiei de regresie cu matricea inversa a matricei sistemului de ecuatii,

Acelasi rezultat se obtine daca se opteaza pentru urmatoarea varianta de lucru:



- se calculeaza estimatia erorii standard a parametrului a,


- se calculeaza estimatia erorii standard a parametrului b,



Nota Estimatia erorii standard a parametrilor ecuatiei de regresie este reprezentata prin radacina patrata a elementelor situate pe diagonala principala a matricei ().



Verificarea semnificatiei parametrilor ecuatiei de regresie este realizata prin compararea variabilei t-statistic cu t-tabelar.

Daca, t-statistic > t-tabelar , se respinge ipoteza nula si in aceste conditii parametrii ecuatiei de regresie sunt semnificativ diferiti de zero.


Variabila t-statistic se obtine raportand estimatia parametrului la estimatia erorii standard asociata fiecaruia dintre parametrii ecuatiei, astfel:

- pentru parametrul a,


- pentru parametrul b,


In cazul studiului corelatiei dintre dinamica cheltuielilor pentru servicii - variabila dependenta (y) si dinamica veniturilor - variabila independenta (x) se confirma statatistic ca parametrul ”b” are o marime semnificativa in timp ce parametrul ”a” nu este atestat statistic cu o marime semnificativ diferit de zero. In principiu, aceasta concluzie nu afecteaza, insa, utilitatea ecuatiei de regresie deoarece infirmarea semnificatiei parametrului ”a” (ordonata la origine) este o consecinta a numarului redus de valori luate in calcul (n = 5).

* Analiza sistemului interdependent de indicatori statistici prezentati sub forma celor doua serii dinamice se bazeaza pe interpretarea indicatorilor derivati prezentati in tabelul 4.

Tabelul 4

Sistemul indicatorilor analitici care privesc corelatia dintre SERIA 01 si SERIA 02

Variabila dependenta - dinamica cheltuielilor pentru servicii: SERIA 01



Metoda celor mai mici patrate

Numarul observatiilor: 5

Variabila

Coeficientul

Eroarea standard

t-Statistic





a




- coeficientul de determinare

R – raportul de corelatie





Media variabilei dependente




Estimatia abaterii standard a variabilei dependente


Eroarea standard a ecuatiei de regresie


F-statistic


Suma patratului reziduurilor:


Prob. (F-statistic)


Coeficientul Durbin-Watson




Metodologia de calcul a indicatorilor din tabelul 4 este urmatoarea:


- Coeficientul de determinare ()



Intervalul de localizare a coeficientului de determinare si respectiv a raportului de corelatie este:


- Raportul de corelatie (R) se obtine prin extragerea radacinii patrate din coeficientul de determinare, , si indica, pentru corelatia studiata, o intensitate foarte puternica.


- Coeficientul de determinare corectat in functie de numarul gradelor de libertate aferente celor doua sume de patrate,


in care:

k – numarul parametrilor din ecuatia de regresie

n – numarul observatiilor


- Estimatia erorii standard a ecuatiei de regresie,



- Suma patratelor reziduurilor sau erorilor,



- Se testeaza ipoteza privind existenta autocorelatiei intre valorile variabilei reziduale cu ajutorul criteriului statistic DURBIN-WATSON,


;


In acest caz indicatorul statistic DW are o marime care depaseste limita de 2,2 si obtinem astfel informatia ca la nivelul valorilor reziduale se inregistreaza o usoara autocorelatie, fapt ce poate afecta eficacitatea ecuatiei de regresie daca aceasta va fi folosita pentru extrapolarea dinamicii studiate. O explicatie a acestei concluzii poate fi argumentata prin faptul ca studiul corelatiei este realizat, pe sema unui volum prea mic de date.




- Valoarea medie a variabilei dependente,



- Estimatia abaterii standard a variabilei dependente,




- Verificarea semnificatiei raportului de corelatie cu ajutorul “Criteriului F”,



- estimatia dispersiei dintre sisteme

- estimatia dispersiei dintre interiorul sistemelor

- estimatia dispersiei totale




F statistic = 78,81818 > F tabelar = 10,1

F tabelar =


Deoarece, F statistic > F tabelar se respinge ipoteza nula si in consecinta Raportul de corelatie (R) difera in mod semnificativ de zero, iar corelatia studiata este reala.

Nota:

Se mentioneaza ca, F statistic este un criteriu cu ajutorul caruia se testeaza veridicitatea modelului (ecuatiei de regresie) in ansamblul sau. Prin aceasta testare se verifica, de asemenea, ipoteza de valoare “zero” a tuturor coeficientilor de regresie, respectiv a coeficientilor variabilelor independente, cu exceptia coeficientului care dimensioneaza ordonata la origine. Valoarea critica a acestui indicator, (F statistic), este 2,7 ce corespunde unei probabilitati de 95% si care atesta ca cel putin un coeficient de regresie este in mod semnificativ diferit de zero.

In cazul exemplului considerat de noi, probabilitatea de a accepta ipoteza nula este foarte mica: 0,003013 sau 0,30%. Riscul de a formula o concluzie gresita este, in aceasta situatie, practic inexistent.

- Regula de adunare a dispersiilor se verifica numai atunci cand nu se tine seama de numarul gradelor de libertate aferente fiecarei sume de abateri ridicate la patrat si deci fiecare din cele trei sume de abateri ridicate la patrat se raporteaza la numarul observatiilor (n


Tabel pentru efectuarea calculelor intermediare

Anul

y

= -1,10 + 0,85x





















Total


20,0






Anul


t = 2,…,n

y2

xy









































Total









Nivelurile calculate ale variabilei dependente , determinate pe baza ecuatiei de regresie, pot fi obtinute si in varianta de calcul matricial, astfel:



In tabelul 5 se prezinta, in mod comparativ, seria reala a variabilei dependente sau rezultative (y) cu nivelurile, aceleiasi variabile, estimate pe baza ecuatiei de regresie (), precum si distributia erorilor (reziduurilor).

Tabelul 5

Situatia reziduurilor: marimile absolute si dispunerea grafica

Anul

Nivelurile reale

(y)

SER01

Nivelurile calculate sau estimate*) ()

SER01F

Reziduuri

(Termenul de eroare)

u = y-


Plaja reziduurilor

1,00000

0,60000

0,40000

| * |


2,00000

2,30000


* | |


4,00000

4,00000

0,00000

* |


5,00000

5,70000


| |


8,00000

7,40000

0,60000

| * |

+ 0,60553 = +

- 0,60553 = -

*) Nivelurile calculate sau estimate ale variabilei dependente sunt determinate pe baza ecuatiei de regresie: y = a + bx

Nota Este foarte bine atunci cand dimensiunea reziduurilor nu depaseste plaja delimitata de o estimatie a erorii standard a ecuatiei de regresie,().

- Conditia de normalitate a distributiei seriei erorilor (reziduurilor) este indeplinita implicit daca n > 40, atunci cand sunt date de natura experimentala sau, n > 15 in cazul seriilor dinamice.


Metode de analiza a corelatiei rangurilor


In cazul considerarii unui sistem interdependent de variabile pentru care se infirma ipoteza corespondentei cu legea de repartitie normala, calculul intensitatii corelatiei se realizeaza prin aplicarea unor metode neparametrice.

Prezumtia parametrica a corelatiei este eliminata prin ordonarea, in mod crescator sau descrescator, a valorilor variabilei independente (X), urmand sa se opereze cu marimi echivalente, denumite ranguri.

Metodele neparametrice permit masurarea intensitatii corelatiei atat pentru variabile cantitative cat si pentru variabile calitative.

Optiunea pentru aplicarea acestor metode este, de obicei, adoptata atunci cand se studiaza corelatii intre variabile economice cu variabile proprii unor domenii neeconomice (demografice, psihologice, medicale, sportive etc. ).







Politica de confidentialitate



Copyright © 2010- 2021 : Stiucum - Toate Drepturile rezervate.
Reproducerea partiala sau integrala a materialelor de pe acest site este interzisa.

Termeni si conditii - Confidentialitatea datelor - Contact