StiuCum - home - informatii financiare, management economic - ghid finanaciar, contabilitatea firmei
Solutii la indemana pentru succesul afacerii tale - Iti merge bine compania?
 
Management strategic - managementul carierei Solutii de marketing Oferte economice, piata economica Piete financiare - teorii financiare Drept si legislatie Contabilitate PFA , de gestiune Glosar de termeni economici, financiari, juridici


Dovedeste-ti eficienta, sau invata de la altii
ECONOMIE

Economia este o stiinta sociala ce studiaza productia si desfacerea, comertul si consumul de bunuri si servicii. Potrivit definitiei date de Lionel Robbins in 1932, economia este stiinta ce studiaza modul alocarii mijloacelor rare in scopuri alternative. Deoarece are ca obiect de studiu activitatea umana, economia este o stiinta sociala.

StiuCum Home » ECONOMIE » statistica
Trimite articolul prin email Analiza seriilor interdependente : Statistica Publica referat pe tweeter Trimite articolul prin facebook

Analiza seriilor interdependente



ANALIZA SERIILOR INTERDEPENDENTE



Introducere


In etapa observarii se inregistreaza date pentru mai multe variabile. Datele aferente unei variabile pot fi prelucrate si analizate independent de cele ce descriu celelalte variabile. De cele mai multe ori, insa, se ridica intrebari ca: intre aceste variabile exista vre-o legatura? cat de puternica este legatura? cum se comporta o variabila daca alta sau altele se modifica? etc. Raspunsuri la intrebari de acest gen pot fi formulate prin analiza seriilor interdependente.




In acest capitol se trateaza conceptele, tehnicile si metodele utilizate cel mai frecvent in analiza legaturii intre variabile statistice: metode simple de caracterizare a legaturii dintre doua variabile; regresia liniara simpla si multipla; regresia neliniara; indicatorii prin care se masoara intensitatea legaturilor statistice; corelatia neparametrica.

Cunoasterea acestor tehnici si metode este utila in practica economica pentru explicarea evolutiei in trecut dar si fundamentarea evolutiei viitoare a diferitelor variabile.



Tipuri de legaturi


Prima problema care trebuie solutionata in analiza legaturii intre o variabila dependenta (rezultativa, efect, explicata, notata cu Y) si una sau mai multe variabile independente (factoriale, cauzale, explicative, notate cu Xi) se refera la intrebarea: exista o legatura intre variabile, sau modificarea variabilei efect este influentata de modificarea variabilei (variabilelor) cauza? A raspunde la o astfel de intrebare presupune sa se porneasca de la teorie, r 939f58j espectiv de la stiinta de specialitate care studiaza fenomenele respective si de la datele empirice inregistrate pentru variabilele presupuse a fi corelate.

Pornind de la datele empirice, se pot intalni in practica urmatoarele situatii:

a) variabila independenta X determina modificarea variabilei dependente Y, caz in care intre cele doua variabile exista o legatura univoca;

b) intre cele doua variabile exista o legatura reciproca;

c) variabilele au o evolutie similara, determinata nu de dependenta dintre ele ci de o alta variabila care influenteaza simultan modificarea celor doua variabile;

d) cele doua variabile au intamplator o evolutie similara, fara sa existe vre-o legatura intre ele.

In cele ce urmeaza se trateaza numai primele doua tipuri de relatii dintre variabile.

Legaturile dintre variabilele independente se clasifica dupa mai multe criterii.

Ø     Dupa natura relatiei de interdependenta se disting legaturi functionale (deterministe) si legaturi stohastice (statistice).

In cazul legaturilor functionale variabila X determina in mod univoc variabila Y, ceea ce inseamna ca unei valori a variabilei cauza ii corespunde o valoare unica a variabilei efect. Legaturile functionale sunt de forma: . Acest tip de legatura se intalneste rar in realitatea economico-sociala, deoarece variatia unei variabile efect (Y) este rezultatul influentei simultane a mai multor variabile cauza (Xi).

Legaturile stohastice se intalnesc cel mai frecvent in realitatea economico-sociala. In acest caz variabila rezultativa (Y) este influentata de una sau mai multe variabile cauza (Xi), dar pe langa aceste cauze considerate esentiale exista si alte variabile neinregistrate (nespecificate) care actioneaza asupra variabilei Y. Caracteristic pentru legaturile stohastice este faptul ca in variatia variabilei Y ramane intotdeauna o parte neexplicata, determinata de influenta factorilor neinregistrati.

Inflenta variabilelor nespecificate este luata in calcul in modelul stohastic sub forma variatiei reziduale (e), denumita si eroare aleatoare:


(6.1)





Legatura statistica nu poate fi identificata la nivelul fiecarei unitati, ci numai la nivelul ansamblului unitatilor. Tendinta de corelare se manifesta numai in cazul unui numar suficient de mare de inregistrari.

Ø     Dupa numarul variabilelor factoriale luate in considerare se deosebesc legaturi simple sau legaturi multiple.

In cazul legaturilor simple, se analizeaza dependenta variabilei efect (Y) in functie de o singura variabila cauza (X), toate celelalte variabile cu o influenta semnificativa sau nu (esentiale sau intamplatoare) sunt considerate cu o actiune constanta. De exemplu, dependenta profitului de cifra de afaceri:

In cazul legaturilor multiple, variatia variabilei Y se analizeaza in functie de mai multe variabile cauza (X1, X2, ).

De exemplu, analiza variatiei salariului intr-o colectivitate (Y) in functie de numarul orelor lucrate (X1), de vechime (X2), de nivelul calificarii (X3).

Ø     Dupa natura caracteristicilor se disting legaturi de asociere sau legaturi de corelatie.

In cazul analizei legaturii dintre doua variabile corelative sau una cantitativa si alta calitativa este vorba de o asociere statistica. De exemplu, analiza legaturii intre ramura de activitate si castigul salarial.

Corelatia statistica intervine in cazul legaturilor de cauzabilitate dintre doua sau mai multe variabile cantitative.

Ø     Dupa directia legaturii exista legaturi directe si legaturi inverse.

Daca modificarea variabilei cauza este insotita de modificari in acelasi sens de variabila efect, exista o legatura directa. In cazul in care variabilele corelate tind sa se modifice in sens opus, este cazul unei legaturi inverse.

Ø     Dupa forma functiei (expresia analitica a legaturii) acestea pot fi liniare sau neliniare.

Daca reprezentarea grafica a datelor empirice corespunzatoare celor doua variabile sugereaza o dreapta, legatura este liniara. In cazul legaturilor neliniare, dependenta dintre variabile se exprima grafic printr-o curba (hiperbola, parabola etc).

Ø     dupa timpul realizarii legaturii se deosebesc legaturi sincrone (concomitente) si asincrone (cu decalaj).

In primul caz, modificarea variabilelor se produce in acelasi timp, concomitent, iar in cel de-al doilea caz variatia variabilei cauza (X) este urmata dupa un anumit timp de variatia variabilei efect (Y). De exemplu, legatura dintre modificarea preturilor de consum si modificarea cheltuielilor populatiei pentru consum este una sincrona, iar legatura dintre investitiile realizate in economie si modificarea produsului intern brut este una asincrona.

Analiza corelatiilor presupune parcurgerea urmatoarelor etape:

identificarea variabilelor cauza si ierarhizarea acestora;

culegerea datelor pentru variabile presupuse a fi corelate;

verificarea existentei si a formei legaturii prin metode simple;

calculul indicatorilor de corelatie;

testarea semnificatiei indicatorilor de corelatie.



Metode simple de analiza a legaturii dintre variabile


Dupa culegerea datelor pentru variabilele implicate in analiza legaturii, trebuie verificat daca intre variabile exista o corelatie, care este forma analitica a acesteia. Metodele care raspund acestor probleme de cunoastere sunt, de fapt, procedee de sistematizare a datelor empirice inregistrate, si anume:

metoda seriilor paralele interdependente;

metoda gruparilor;

metoda tabelului de corelatie;

metoda grafica.

Metoda seriilor paralele interdependente se recomanda a fi aplicata in cazul unui numar redus de valori inregistrate pentru variabile X si Y.

Se procedeaza astfel: se ordoneaza crescator datele variabilei independente (X) si se ataseaza valorile corespunzatoare variabilei dependente (Y) si se concluzioneaza referitor la forma si directia legaturii in functie de reactia variabilei Y la modificarile intervenite in variabila X. Daca datele tind sa se modifice in acelasi sens, exista o corelatie directa, respectiv inversa, daca tind sa se modifice in sens opus. Marimea cu care se modifica Y la modificarile lui X permite aprecierea intensitatii legaturii.

Metoda gruparilor se aplica cand numarul mare de unitati pentru care s-au inregistrat valori empirice. Se grupeaza unitatile dupa variabila factoriala si pentru fiecare grupa astfel construita se calculeaza media variabilei dependente . Intre cele doua variabile exista o corelatie daca mediile de grupa (conditionate ) reactioneaza la modificarile intervenite in variabila independenta.

Aplicarea acestei metode este influentata de modul cum s-a facut gruparea. Se recomanda, in acest caz, ca intervalele de grupare sa fie egale, numarul grupelor construite sa fie suficient de mare pentru evitarea pierderilor de infomatii, numarul unitatilor din fiecare grupa sa fie semnificativ s.a.

In tabelul nr. 6.1 se prezinta un exemplu de aplicare a metodei gruparii.

Gruparea agentilor economici dupa numarul salariatilor si dupa cifra de afaceri.


Tabelul nr. 6.1

Agenti economici dupa nr. de salariati (persoane)

Agenti economici afaceri

dupa cifra de

(miliarde lei)

Total





12 14


1 9




























40 si peste







Total








Cifra de afaceri (Y) a fost influentata de numarul de salariati (X)? Pentru fiecare grupa construita dupa numarul de salariati se calculeaza cifra de afaceri realizata in medie de fiecare agent economic din grupa respectiva.

miliarde lei

miliarde lei



miliarde lei

Se remarca: media cifrei de afaceri pe agent economic creste o data cu cresterea numarului de salariati, deci exista o corelatie directa.

Cu cat mediile de grupa difera mai mult intre ele cu atat influenta variabilei independente este mai puternica.

Metoda tabelului de corelatie presupune gruparea unitatilor colectivitatii dupa variatia celor doua variabile si interpretarea tendintei de ordonare a frecventelor. Grupele construite dupa variabila independenta apar, de regula, in capetele coloanelor iar cele aferente variabilei dependente apar in capetele randurilor. La intersectia dintre randul 'i' si coloana 'j' apare numarul unitatilor (nij) corespunzator perechii de valori xj, yi. Tabelul care rezulta este unul cu dubla intrare (vezi tabelul nr. 6.2).

Daca valorile care definesc intervalele de grupare dupa X si Y au fost ordonate crescator, iar frecventele tind sa se ordoneze dupa diagonala principala, atunci exista o corelatie directa.

Daca frecventele se concentreaza in jurul diagonalei secundare, atunci exista o corelatie inversa. Cu cat concentrarea frecventelor in jurul unei diagonale este mai puternica, cu atat legatura dintre cele doua variabile este mai intensa.

Dispersia frecventelor fara nici o regularitate sugereaza ca cele doua variabile sunt independente sau necorelate.

La folosirea tabelului de corelatie se recomanda sa se respecte regulile mentionate la metoda gruparii.

Metoda grafica este un procedeu simplu si sugestiv de vizualizare a interdependentei dintre doua variabile.

Aceasta metoda presupune reprezentarea grafica, in sistemul de axe rectangulare a perechilor de valori empirice (xi, yi). Pe alescisa se inscriu valorile caracteristicii independente iar pe ordonata cele ale caracteristicii dependente. Fiecare pereche de valori empirice se reprezinta in cadranul I printr-un punct. Procedand astfel se obtine o diagrama de corelatie sau o covelograma. Daca numarul punctelor marcate este foarte mare, graficul mai este denumit si graficul norului de puncte.

Pe baza graficului se concluzioneaza privitor la existenta corelatiei si la forma si directia acesteia in functie de tendinta de ordonare a punctelor. Daca punctele tind sa se ordoneze in jurul unei linii drepte (fig. 6.1) sau a unei curbe (fig. 6.2), intre cele doua variabile exista o corelatie.

















Fig. 6.1 Legatura liniara directa



















Fig. 6.2 Legatura neliniara


Cu cat tendinta de ordonare a punctelor este mai pronuntata cu atat corelatia intre cele doua variabile este mai intensa.

Daca punctele se imprastie fara nici o regularitate, variabilele trebuie considerate independente.

Metode parametrice de analiza a legaturilor


Metodele elementare prezentate ofera informatii utile in studiul interdependentelor. Acestea nu sunt insa in masura sa descrie analitic dependenta si sa masoare numeric intensitatea acesteia. Metodele care permit acest lucru sunt metoda regresiei si metoda corelatiei.


Metoda regresiei


Prin intermediul metodei regresiei se analizeaza prin intermediul unei expresii analitice denumite functii de regresie, modul in care variabila dependenta Y se comporta in raport cu modificarea uneia sau a mai multor variabile independente (Xi).

Functia de regresie exprima cum se comporta in medie variabila efect sub actiunea influentei uneia sau a mai multor variabile efect in conditiile in care toate celelalte variabile cauza, esentiale sau intamplatoare, ar exercita o actiune constanta, sau ar exercita o influenta neesentiala.

Functia de regresie este o functie matematica care exprima legatura dintre variabile si are forma generala :


(6.2)


unde 'e' este variabila aleatoare perturbatoare sau eroare, care sintetizeaza influenta tuturor factorilor neluati in calcul, nespecificati.

Daca in analiza regresiei se implica o singura variabila independenta se recurge la regresia unifactoriala liniara sau neliniara, iar daca dependenta variabilei Y se aciclizeaza in functie de cel putin doua variabile factoriale se recurge la regresia multifactoriala.

Alegerea functiei de regresie se realizeaza cel mai simplu, pe (baza) reprezentarii grafice a perechilor de valori xiyi.

Regresia unifactoriala liniara

Acest model de regresie se aplica cand valorile variabilei cauza (X) si cele ale variabilei efect (Y) tind sa formeze o progresie aritmetica, deci cand variabila dependenta tinde sa se modifice liniar sub influenta unei singure variabile independente.

Tendinta valorilor de a forma o progresie aritmetica se cunoaste usor prin doua metode simple:

se ordoneaza valorile variabilei X si se ataseaza valorile corespunzatoare variabilei Y. Se determina modificarea absoluta a fiecarui termen fata de cel precedent si . Daca aceaste modificari sunt aproximativ egale in cazul variabilei X, respectiv in cazul variabilei Y, cele doua serii de date formeaza cate o progresie aritmetica;

se reprezinta grafic perechile de valori iar daca corelograma sugereaza tendinta de ordonare a punctelor in jurul unei drepte se opteaza pentru regresia liniara.

Ecuatia functiei liniare de regresie este:


(6.3)


in care:

Yxi valorile calculate sau teoretice ale variabilei Y in functie de X;

xi valorile empirice ale variabilei factoriale;

a si b parametrii necunoscuti ai functiei de regresie care trebuie estimati.

Parametrul a, nu are o semnificatie economica. Geometric reprezinta ordonata la origine, respectiv valoarea lui y cand x = 0. Daca a = 0, variabila Y depinde exclusiv de variabila X, deci legatura este functionala.

Parametrul b, denumit coeficient de regresie, exprima economic cu cat se modifica in medie variabila dependenta daca variabila independenta se modifica cu o unitate.

Geometric, parametrul b semnifica panta dreptei de regresie. Semnul parametrului b ofera urmatoarele informatii:

b > 0, legatura este directa;

b < 0, legatura este inversa;

b = 0, variabilele sunt independente sau necorelate.

Dupa alegerea functiei de regresie trebuie sa se estimeze parametrii a si b ai ecuatiei liniare si sa se calculeze valorile functiei de regresie.

Estimarea parametrilor a si b se realizeaza, cel mai adesea,

prin metoda celor mai mici patrate, ceea ce inseamna minimizarea sumei patratelor erorilor []. Dar eroarea reprezinta diferenta dintre valoarea empirica (yi) si valoarea teoretica, calculata pe baza modelului liniar (Yxi). Deci, suma patratelor abaterilor valorilor empirice de la cele teoretice trebuie sa fie minima.

min (6.4)


In cazul modelului unifactorial liniar expresia (6.4) devine:


min (6.5)




Aceasta expresie este minima in punctele de anulare a derivatelor partiale calculate in functie de parametrul a si b.



Punand conditia ca aceste derivate sa fie egale cu 0, simplificand cu 2 si tinand seama de faptul ca a si b sunt constante, sistemul de mai sus devine:



unde - si reprezinta valorile empirice inregistrate pentru cele doua variabile, iar semnifica numarul unitatilor.

De unde, prin rezolvarea sistemului de ecuatii se obtine:


(6.6)


Dupa ce s-au calculat parametrii a si b se pot determina valorile teoretice ale functiei de regresie , prin inlocuirea succeciva in ecuatia de regresie, cu valorile ale caracteristicii factoriale.



Exemplu: Pentru a ilustra valentele analitice ale unei functii liniare de regresie simpla, se porneste de la datele privind vechimea in munca si castigul salarial net realizat de 8 muncitori in luna mai 2003 (vezi tabelul nr. 6.2, col. 1 si 2). Intre cele doua variabile exista normal o legatura directa, salariul net fiind influentat pe langa alti factori si de vechimea in munca.


Tabelul nr. 6.2

Col. numerelor

Vechime in munca

(ani)

Castigul salarial net

(mil. lei)























































Total







Cele doua serii de date confirma existenta unei corelatii directe. Pentru alegerea formei legturii se construieste cronograma.















Fig. 6.3 Graficul de corelatie


Reprezentarea grafica sugereaza faptul ca punctele tind sa se ordoneze in jurul unei drepte. Deci, functia de regresie este de forma: .

Pentru aflarea parametrilor a si b se porneste de la sistemul de ecuatii mentionat, rezolvarea caruia presupune calcularea expresiilor: ; ; si .

Sistemul de ecuatii normale este:



Din rezolvarea sistemului prin metoda determinantilor se obtine:


a = 2,6033 semnifica faptul ca dreapta intersecteaza ordonata in punctul 2,6, iar b = 0,097 inseamna ca salariul mediu net sporeste in medie cu 97 mii lei daca vechimea creste cu un an.

Functia de regresie care descrie legatura dintre cele doua variabile este: .

Valorile teoretice privind castigul salarial net se obtin in urma inlocuirii in aceasta functie lui xi cu valorile corespunzatoare (vezi tabelul nr. 6.2, col. 5).



Corectitudinea estimarii parametrilor a si b presupune ca suma valorilor empirice ale variabilei dependente sa fie egala cu suma valorilor teoretice .

In cazul exemplului prezentat in tabelul nr. 6.2, datele s-au prezentat sub forma a doua serii simple, deci negrupate.

Daca numarul unitatilor pentru care s-au inregistrat datele pentru xi si yi este mare, deci in cazuri cand volumul colectivitatii este mare, se recomanda sistematizarea datelor corespunzatoare celor doua variabile pe intervale egale, ceea ce inseamna prezentarea acestora intr-un tabel cu dubla intrare (de corelatie). In asemenea situatie, algoritmul de calcul al parametrilor a si b prin metoda celor mai mici patrate se aplica ca in cazul mentionat, cu deosebirea ca fiecarei valori corespunzatoare lui xi si yi se ataseaza frecventa de aparitie.

Sistemul de ecuatie devine:


(6.7)


in care si sunt frecventele corespunzatoare intervalelor construite dupa X, respectiv Y, iar nxy reprezinta frecventele perechilor de valori xiyi.

La rezolvarea sistemului, la determinarea parametrilor a si b si la calcularea valorilor functiei de regresie, se procedeaza ca si in cazul datelor negrupate.

Regresia unifactoriala neliniara

In realitate apar frecvent situatii ca modelul liniar unifactorial sa nu corespunda tipului de dependenta dintre cele doua variabile. Printre cele mai utilizate functii neliniare mentionam: functia polinomiala de gradul 2; exponentiala; hiperbolica.

Functia se alege cel mai simplu pe baza reprezentarii grafice. Ca si in cazul regresiei liniare unifactoriale, parametrii functiei se estimeaza pornind de la metoda celor mai mici patrate, care presupune minimizarea erorilor .

In cazul polinomului de gradul 2, ecuatia de regresie este:


(6.8)

Aplicand metoda celor mai mici patrate si dupa anularea derivatelor partiale calculate in functie de a, b si c se obtine sistemul de ecuatii:


(6.9)

















Fig. 6.3 Tipuri de parabole de gradul 2


Prin rezolvarea sistemului de ecuatii liniare (6.9) si prin inlocuirea succesiva a lui xi cu valorile empirice in functia de regresie, se obtin valorile teoretice pentru variabila rezultativa (Yxi).

Daca legatura dintre cele doua variabile are forma unei functii exponentiale, ecuatia de regresie este:


(6.10)


Aplicarea metodei celor mai mici patrate presupune in acest caz liniarizarea, prin logaritmare: .

In continuare se procedeaza ca la regresia liniara pentru a determina parametrii a si b si pentru calculul valorilor functiei de regresie. Prin aplicarea metodei celor mai mici patrate se obtine:


(6.11)


Regresia multifactoriala

Modelele unifactoriale de regresie au avantajul usurintei aplicarii. In realitate insa, se intalnesc foarte rar situatii cand efectul este rezultatul influentei unei singure cauze. De cele mai multe ori, variabila dependenta este influentata concomitent de mai multi factori, ceea ce inseamna ca in analiza legaturilor trebuie luati in calcul cel putin factorii care exercita o influenta semnificativa. Forma generala a modelului regresiei multifactoriale este:


(6.12)


Modelul multifactorial cel mai accesibil este cel liniar.


(6.13)


in care:

a0 sintetizeaza influenta tuturor factorilor neluati in calcul

a1 ak reprezinta coeficientii partiali de regresie si exprima cu cate unitati se modifica variabila rezultativa daca variabila factoriala respectiva se modifica cu o unitate iar toate celelalte variabile raman constante.

Prin aplicarea metodei celor mai mici patrate se obtine sistemul de ecuatii (6.14) prin rezolvarea caruia se determina parametrii functiei de regresie.


(6.14)


La interpretarea rezultatelor privind parametrii functiei de regresie multifactoriala trebuie avut in vedere faptul ca intre variabilele factoriale luate in calcul poate exista o dependenta reciproca, denumita multicoliniaritate.

Alegerea functiei de regresie pe baza graficului de corelatie poate crea problema daca multimea punctelor corespunzatoare valorilor empirice (xi, yi) sugereaza mai multe functii posibile. In asemenea situatie, se recomanda sa se calculeze valorile dupa toate functiile sugerate de grafic si sa se opteze, in final, pentru acea functie care satisface conditia de minim min, deci care minimalizeaza eroarea cu care se estimeaza valorile empirice (yi).

Indicatorul prin care se masoara aceasta eroare este eroarea standard () :


(6.15)


In cazul exemplului din tabelul 6.2 eroarea cu care s-au estimat castigurile salariale nete in functie de vechimea in munca a fost de 64,8 mii lei. (vezi tabelul nr. 6.3)


Tabelul nr. 6.3

Cod muncitor




0,01












0,02





0,13















0,06







Total

31,5

31,51

0



milioane lei

Aceasta inseamna ca intre castigul salarial net realizat efectiv (yi) si cel estimat pe baza functiei lunare exista, in cazul fiecarui muncitor, o diferenta medie de 64,8 mii lei, diferenta care se explica prin influenta altor factori asupra castigului salarial net.

Daca eroarea standard () se imparte la media valorilor empirice se obtine eroarea exprimata procentual :

milioane lei

Deci coeficientul de eroare este: .


Metoda corelatiei


Functia de regresie descrie dependenta variabilei rezultative de variabila sau variabilele cauza atrase in analiza legaturii.

In studiul legaturilor dintre variabile este frecvent necesar sa se masoare sintetic intensitatea corelatiei dintre variabile, caz in care se aplica metoda corelatiei.

Indicatorii prin care se masoara intensitatea legaturilor sunt: covarianta [cov(X,Y)]; coeficientul de corelatie (r); raportul de corelatie (R).

Covarianta dintre doua variabile este o medie aritmetica simpla a produselor perechilor abaterilor valorilor empirice (xi si yi) de la mediile lor aritmetice ( si ).


(6.16)


Daca corelatia este directa atunci cov(X,Y)>0, respectiv valori negative, in cazul corelatiilor inverse.

Acest se aplica mai rar in analiza corelatiilor, datorita urmatoarelor cauze:

nu are un interval fix de variatie; cu cat corelatia este mai intensa cu atat covarianta, in valoare absoluta, este mai mare;

se exprima in unitatile de masura a caracteristicelor implicate in analiza, fapt ce genereaza dificultati in cazul comparatiilor.

Coeficientul de corelatie liniara (r) este un indicator sintetic care masoara intensitatea legaturilor liniare simple. Se calculeaza ca un raport intre covarianta si produsul abaterilor medii patratice ale variabilelor implicate in analiza corelatiei ( si ) sau ca o medie aritmetica a produselor abaterilor normale normate: si .

(6.17)


Inlocuind in aceasta expresie si cu relatiile de calcul pe baza carora se determina [si ] se ajunge la o relatie relativ simpla de aplicat:


(6.18)


Coeficientul de corelatie poate lua valori cuprinse intre -1 si +1. Semnul coeficientului de corelatie coincide cu cel al coeficientului de regresie b. Daca r > 0 exista o corelatie directa, iar daca r < 0 intre cele doua variabile este o corelatie inversa.

Cu cat r se apropie mai mult de 1 cu atat legatura dintre variabile este mai puternica.

Daca r = 1, atunci exista o corelatie directa functionala, iar daca r = -1, intre variabile este o corelatie inversa functionala.

O valoare egala cu 0 indica lipsa legaturii dintre variabile.

In exemplul prezentat privind legatura dintre vechimea in munca si castigul salarial net (vezi tabelul nr. 6.1), coeficientul de corelatie este:

Relatiile (6.17) si (6.18) se aplica in cazul in care datele inregistrate pentru cele doua variabile se prezinta sub forma a doua serii simple. Daca numarul perechilor de valori inregistrate este mare, acestea se sistematizeaza prin gruparea lor pe intervale egale si se prezinta intr-un tabel cu dubla intrare. Intr-o asemenea situatie, fiecarei valori xi si yi i se ataseaza frecventa corespunzatoare de aparitie.




Relatia (6.18) devine:


(6.19)


Pentru a verifica daca coeficientul de corelatie liniara este semnificativ se utilizeaza testul 't'.


(6.20)


in care:

r coeficientul de corelatie liniara simpla;

n numarul observatiilor;

n 2 numarul gradelor de libertate.

Valoarea calculata pe baza relatiei (6.20) se compara cu valoarea teoretica din tabelul Student, pentru un prag de semnificatie (de regula ) si n 2 grade de libertate (dreapta are doi parametrii).

Se considera ca r este statistic semnificativ daca t calculat > tteoretic.

In cazul exemplului din tabelul 6.2 coeficientul de corelatie liniara simpla este semnificativ 19,2 > 2,447.

Raportul de corelatie (R) este un indicator sintetic care masoara intensitatea legaturilor liniare si neliniare.

Calculul raportului de corelatie se bazeaza pe faptul ca variatia totala a variabilei Y este compusa din doua parti: una care se explica prin influenta caracteristicii considerata factor esential (X) si alta care se datoreaza actiunii tuturor factorilor neinregistrativi, reziduali.

Dispunand de valorile empirice inregistrate, de valorile teoretice calculate pe baza functiei de regresie si de media valorilor empirice se pot stabili trei tipuri de abateri:

abaterea valorilor empirice de la media lor . Media presupune toti factorii de influenta constanti, iar valorile empirice sunt rezultatul actiunii tuturor factorilor. Dispersia calculata pe baza acestor abateri este dispersia totala a variabilei dependente . Prin aceasta se masoara variatia sub influenta tuturor factorilor X si ceilalti factori neinregistrati;

abaterea valorilor empirice de la valorile teoretice . Valorile teoretice sunt expresia factorului implicat in analiza legaturii, deci considerat esential. Abaterea mentionata este provocata de influenta factorilor neinregistrati, aleatori. Dispersia care masoara variatia variabilei Y numai sub actiunea acestor factori este dispersia reziduala () ;

abaterea valorilor teoretice de la media valorilor empirice , exprima influenta factorului X. Pe baza acestor abateri se determina dispersia explicata sau dispersia sistematica ().

Pornind de la cele trei abateri mentionate, la nivelul fiecarei unitati, se poate scrie relatia:


(6.25)


Pe baza acestei egalitati se pot calcula cele trei dispersii mentionate mai sus, si anume:

dispersia totala a variabilei dependente:


(6.26)


dispesia reziduala:


(6.27)


dispersia explicata prin influenta variabilei X:


(6.28)





Pornind de la natura factorilor de influenta asupra variatiei variabilei rezultative, intre cele trei dispersii mentionate exista relatia:


(6.29)


Pe baza acestei relatii se pot detrmina doi indicatori:

Ø     coeficientul de determinatie exprima ce cota parte din variatia lui Y se datoreaza influentei factorului X, considerat esential:


(6.30)


Ø     coeficientul de nedeterminatie msoara cota parte din variatia lui Y pe seama actiunii tuturor factorilor neluati in considerare, reziduali:


(6.31)


Raportul de corelatie se calculeaza extragand radacina patrata din coeficientul de determinatie:


(6.32)


Tinand seama de relatiile prin care se determina dispersiile care apar in formula raportului de corelatie se obtine:


(6.33)


Raportul de corelatie poate lua valori cuprinse intre 0 si 1. Cu cat valoarea lui R se apropie mai mult de 1 cu atat legatura dintre variabile este mai puternica, respectiv mai putin intensa cu cat se apropie mai mult de 0.

Pentru exemplificarea calculului raportului de corelatie se porneste de la datele tabelului nr. 6.3. Calculele necesare sunt prezentate in tabelul nr. 6.4:


Tabelul nr. 6.4

Cod muncitor









































Total








milioane lei

La calcularea valorilor teoretice (valorile functiei de regresie, YXi) s-a pornit de la o ipoteza ca legatura dintre cele doua variabile este liniara. De la ipoteza s-a pornit si la determinarea raportului de corelatie. Daca legatura dintre cele doua variabile este intr-adevar liniara atunci se verifica egalitatea: . Daca raportul de corelatie difera de , atunci legatura este neliniara. In acest caz trebuie identificata ecuatia functiei neliniare, calculate valorile teoretice pe baza acestei functii si detrminata intensitatea corelatiei prin R.

Relatia (6.33) se poate aplica in situatia in care numarul perechilor de valori empirice nu este mare, si cand aceste date apar sub forma a doua serii simple.

Daca datele au fost sistematizate sub forma unei distributii bidimensionale (vezi tabelul de corelatie) este necesar sa se tina seama de frecventa de aparitie. Relatia de calcul in acest caz este:


(6.34)

Metode neparametrice


Metodele de corelatie prezentate fac parte din grupa metodelor parametrice de masurare a intensitatii legaturilor dintre variabile. Acestea pot fi aplicate daca variabilele indeplinesc doua conditii:

a) sunt de natura cantitativa, numerica;

b) repartitiile variabilelor tind spre distributia normala.

Daca nu sunt indeplinite aceste conditii se recoomanda aplicarea metodelor neparametrice. Cei mai utilizati indicatori din acesta grupa sunt: coeficientul de asociere Yule; coeficientul de corelatie a rangurilor Spearman; coeficientul de corelatie a rangurilor Kendall.

Coeficientul de asociere Yule (Q) se aplica in cazul analizei corelatiei dintre doua variabile alternative. Astfel de caracteristici admit numai doua forme de manifestare: DA si NU.

Repartitia celor doua variabile alternative se prezinta intr-un tabel de asociere care este o varianta simplificata a tabelului cu dubla intrare. In acest tabel valorile variabilei X apar in capetele randurilor iar cele ale variabilei Y apar in capetele coloanelor.


Tabelul de asociere

Tabelul nr. 6.5

Y

X

Total

a

b

a + b

c

d

c + d

Total

a + c

b + d

a + b + c + d


Coeficientul de asociere Yule se calculeaza pe baza relatiei:


(6.35)


Acest indicator poate lua valori cuprinse intre -1 si +1. Valori negative ale lui Q indica o asociere inversa, respectiv directa, daca acest indicator este pozitiv.

Cu cat Q tinde mai mult spre 1 cu atat asocierea este mai puternica. Daca coeficientul de asociere este egal cu 0, intre cele doua variabile nu exista o legatura de asociere.

Coeficientii de corelatie a rangurilor se aplica in cazul in care valorile sau formele de manifestare a celor doua variabile pot fi ierarhizate. Acesti indicatori se recomanda in situatiile in care cel putin una din variabile este nenumerica (calitativa sau exprimata prin cuvinte) sau cand distributia nu este cunoscuta.

Caracteristic pentru acesti coeficienti este faptul ca la determinarea lor nu se porneste de la valorile empirice corespunzatoare celor doua variabile ci de la numere care indica locul fiecarei valori / forme de manifestare in serie, denumite ranguri . Deci, valorile empirice / formele de manifestare se inlocuiesc cu ranguri.

Se ordoneaza crescator rangurile dupa caracteristica X (cel mai mic nivel are rangul 1) si se ataseza rangurile corespunzatoare caracteristicii Y.

Coeficientul de corelatie a rangurilor Spearman se determina pe baza rangurilor celor doua varabile ( si ), ordonate asa cum s-a mentionat mai sus.


(6.37)


in care:

numarul de unitati observate

Acest coeficient poate lua valori cuprinse intre -1 si +1 si se interpreteaza ca coeficientul de corelatie liniara (r).

Coeficientul de corelatie a rangurilor Kendall se calculeaza numai pe baza rangurilor variabilei Y, prin formula:


(6.36)


unde

scorul calculat:

suma rangurilor superioare care urmeaza in continuare dupa rangul i analizat;

suma rangurilor inferioare care urmeaza in continuare supa rangul analizat.

Coeficientul Kendall ia deasemenea valori cuprinse intre -1 si +1. Semnul coeficientului indica directia legaturii (+, corelatie directa si -, corelatie inversa), cu cat tinde mai mult spre 1, cu atat corelatia este mai puternica;

Calculul coeficientilor de corelatie a rangurilor se exemplifica in continuare pe baza datelor privind cifra de afaceri (X) si profitul (Y) realizate de catre opt agenti economici (tabelul nr. 6.5).


Tabelul nr. 6.5

Nr. crt

Cifra de afaceri

(mld lei)

Profitul (milioane lei)

































































Total









Coeficientul de corelatie Spearman:

Coeficientul de corelatie Kendall:

Corelatia dintre cele doua variabile este una directa, moderata ca intensitate.










Cuvinte - cheie


* Variabila dependenta, rezultativa, efect, explicata.

* Variabila independenta, factoriala, cauzala, explicativa.

* Legatura functionala.

* Legatura statistica.

* Legatura simpla.

* Legatura multipla.

* Legatura directa.

* Legatura inversa.

* Metoda seriilor paralele interdependente.

* Metoda gruparii.

* Metoda tabelului de corelatie.

* Metoda grafica.

* Regresie.

* Metoda celor mai mici patrate.

* Coeficient de regresie.

* Eroarea standard.

* Covarinta.

* Coeficient de corelatie liniara.

* Raport de corelatie.

* Dispersie reziduala.

* Dispersie explicata, sistematica.

* Coeficient de determinatie.

* Coeficient de asociere Yule.

* Coeficient de corelatie a rangurilor Spearman.

* Coeficient de corelatie a rangurilor Kendall.

Intrebari de control


1. Prin ce se deosebeste o legatura stohastica de una functionala (determinista)?

2. Ce informatii ofera metodele simple de analiza a legaturilor dintre variabile?

3. Ce exprima functia de regresie?

4. Care este semnificatia geometrica si economica a coeficientului de regresie liniara?

5. De ce se abat valorile empirice de la valorile functiei de regresie?

6. Cand se aplica si cum se interpreteaza coeficientul de corelatie simpla?

7. Cand reprezentarea grafica admite mai multe functii care ar putea descrie legatura dintre doua variabile, care este criteriul in functie de care se opteaza pentru una din aceste functii?

8. Cand se utilizeaza si cum se interpreteaza raportul de corelatie?

9. Cand se verifica egalitatea: r = R?

10. Cand se recomanda corelatia rangurilor pentru masurarea intensitatii legaturilor dintre variabile?

11. Cand se recomanda utilizarea coeficientului de asociere Yule?



Bibliografie


1. Beji E., Lelea E., Wagner P., Statistica, Editura didactica si pedagogica, Bucuresti, 1999 p

2. Koska M., Begu L., Tusa E., Bazele Statisticii pentru Economisti, Editura Tribuna economica, Bucuresti, 2002 p. 118-138.

3. Voineagu V., Lilea E., Goschin Z., Vatui M., Bolaleanu D., Statistica economica. Teorie si aplicatii, Editura Tribuna economica, Bucuresti, 2002, p. 223-257.







Politica de confidentialitate



Copyright © 2010- 2021 : Stiucum - Toate Drepturile rezervate.
Reproducerea partiala sau integrala a materialelor de pe acest site este interzisa.

Termeni si conditii - Confidentialitatea datelor - Contact