StiuCum - home - informatii financiare, management economic - ghid finanaciar, contabilitatea firmei
Solutii la indemana pentru succesul afacerii tale - Iti merge bine compania?
 
Management strategic - managementul carierei Solutii de marketing Oferte economice, piata economica Piete financiare - teorii financiare Drept si legislatie Contabilitate PFA , de gestiune Glosar de termeni economici, financiari, juridici


Noi putem sa te ducem spre NIVELUL URMATOR
ECONOMIE

Economia este o stiinta sociala ce studiaza productia si desfacerea, comertul si consumul de bunuri si servicii. Potrivit definitiei date de Lionel Robbins in 1932, economia este stiinta ce studiaza modul alocarii mijloacelor rare in scopuri alternative. Deoarece are ca obiect de studiu activitatea umana, economia este o stiinta sociala.

StiuCum Home » ECONOMIE » statistica
Trimite articolul prin email Serii de repartitie : Statistica Publica referat pe tweeter Trimite articolul prin facebook

Serii de repartitie



SERII DE REPARTITIE


Introducere


Cunoasterea statistica a trasaturilor cantitative si calitative a fenomenelor si proceselor presupune inregistrarea la nivelul fiecarui element al colectivitatii cercetate a valorilor concrete (formelor de manifestare) corespunzatoare caracteristicilor cuprinse in programul observarii. In urma inregistrarii (observarii) se obtine o masa de date primare care nu permite sesizarea aspectelor esentiale, relevante pentru intreaga masa. Puterea de informare creste daca aceste date se sistematizeaza in functie de una sau mai multe variabile atributive, proces care conduce la obtinerea unei/unor serii de repartitie de frecvente. Aceste serii ofera informatii privind clasele/grupele care domina in serie, forma de repartitie a frecventelor s.a. Astfel de serii sunt de exemplu: repartitia agentilor economici pe clase de marime dupa numarul salariatilor, repartitia populatiei pe grupe de varsta, repartitia salariatilor dupa marimea salariului brut/net etc.




In acest capitol se abordeaza aspecte metodologice privind valorile tipice, respectiv valorile care sunt in masura sa evidentieze ceea ce este esential si comun intr-o serie de repartitie, intensitatea variatiei valorilor individuale in jurul unei valori tipice, descompunerea variatiei pe grupe de factori care au generat imprastierea valorilor empirice. In cazul fiecarui indicator se insista asupra cazurilor de utilizare si asupra limitelor indicatorului respectiv.



Definire, trasaturi, reprezentare grafica


Seria de repartitie sau seria de distributie este rezultatul gruparii colectivitatii in functie de variantele sau intervalele de variatie ale unei caracteristici atributive cantitative sau calitative.

Seriile de repartitie se diferentiaza intre ele dupa numarul caracteristicilor de grupare si dupa natura acestora.

Daca se foloseste o singura caracteristica de grupare , seria se numeste unidimensionala sau unicriteriala, iar daca gruparea se face in functie de doua sau mai multe caracteristici rezulta serii bi si multidimensionale.

Daca caracteristica de grupare este una cantitativa (numerica), seria de repartitie se numeste serie de variatie.

Gruparea elementelor colectivitatii in functie de o caracteristica calitativa (nenumerica) se concretizeaza intr-o serie de atribute sau serie nominativa.

Prelucrarea si analiza informatiilor cuprinse intr-o serie de repartitie empirica trebuie sa tina seama de trasaturile unei astfel de serii. Principalele trasaturi ale unei serii de repartitie sunt:

omogenitatea termenilor unei serii de repartitie se explica prin faptul ca toate valorile au acelasi continut si sunt cauzate de factori esentiali. Omogenitatea valorilor ce compun o serie de repartitie presupune o variatie cat mai mica intre aceste valori. Daca termenii prezinta o variatie pronuntata se desprinde concluzia ca in colectivitatea studiata sunt prezente mai multe tipuri calitative, ceea ce inseamna ca seria respectiva trebuie separata in doua sau mai multe serii separate;

independenta termenilor este urmarea faptului ca fiecar 535i83f e valoare individuala este specifica pentru o anumita unitate a colectivitatii si nu depinde de valoarea inregistrata la celelalte unitati. Desigur, aceasta independenta este relativa deoarece unitatile care fac parte din aceeasi colectivitate se supun acelorasi legi care se manifesta sub forma de tendinta;

variabilitatea termenilor seriei este determinata de faptul ca fenomenele de masa nu sunt fenomene univoc determinate, ci se produc sub actiunea mai multor cauze, unele esentiale iar altele intamplatoare, care fac ca manifestarea individuala sa fie diversa, distincta de alte manifestari. Cu cat influenta cauzelor aleatoare este mai pronuntata, cu atat variabilitatea termenilor este mai mare iar gradul de omogenitate a valorilor inregistrate este mai mic;

concentrarea sau dispersarea termenilor seriei este expresia intensitatii influentei cauzelor esentiale si neesentiale. Daca raportul de forte dintre cele doua grupe de cauze tinde spre un echilibru relativ, frecventele de aparitie corespunzatoare fiecarei unitati sunt apropiate. Reprezentarea grafica seamana in acest caz cu o repartitie uniforma sau rectangulara.

Daca intensitatea factorilor de influenta este diferita atunci frecventele de aparitie corespunzatoare valorilor ce formeaza seria de repartitie se pot concentra astfel:

catre valorile care se afla in mijlocul seriei, caz in care graficul repartitiei tinde sa semene cu un clopot Gauss-Laplas (normala).

catre cele doua extremitati ale repartitiei, caz in care reprezentarea grafica sugereaza o curba in forma de  U .

catre una din valorile extreme ale seriei, atunci graficul seamana cu un  J .

Diversitatea situatiilor care pot fi intalnite in practica impune ca economistul sa aiba in vedere, la alegerea metodelor statistice folosite in analiza seriilor de repartitie, natura distributiei empirice.

O prima imagine asupra formei repartitiei se obtine prin intermediul reprezentarii grafice. Repartitiile de frecvente unidimensionale se vizualizeaza prin urmatoarele tipuri de grafice:

histograma, poligonul frecventelor si poligonul frecventelor cumulate, daca variabila prezinta o variatie continua (vezi tab. nr 4.1 si fig. nr 4.1, 4.2 si 4.3);

diagrama prin coloane, daca repartitia s-a construit pentru o variabila cu o variatie discreta.

Exemplul 4.1 : Gruparea agentilor economici dintr-o ramura dupa cifra de afaceri (miliarde lei) :


Tabelul nr 4.1

Cifra de afaceri

Numar agenti economici

A


Pana la 20












Peste 40


Total



Nota: Limita superioara este cuprinsa in intervalele

Construirea histogramei, al poligonului frecventelor si al poligonului frecventelor cumulate presupune inchiderea intervalelor marginale deschise. Se poate proceda astfel:

limita superioara al primului interval, respectiv limita superioara al ultimului interval este valoarea empirica cea mai mica (xmin) respectiv cea mai mare (xmax) inregistrata ;

daca nu se cunosc aceste valori extreme, inchiderea intervalelor deschise se face cu marimea intervalelor invecinate. Deci x1,inf = 20-4=16 iar x7,sup = 40+4=44.



Fig. nr 4.1 Repartitia agentilor economici dupa cifra de afaceri


Construirea poligonului frecventelor presupune marcarea, in cadranul I al sistemului de coordonate rectangulare, al punctelor cu coordonatele xi (mijlocul intervalului) si ni (frecventele de aparitie) si unirea punctelor succesive prin segmente de dreapta. Suma ariilor dreptunghiurilor care definesc histograma trebuie sa fie egala cu aria delimitata de poligonul frecventelor si axa OX.











Fig. nr 4.2 Indicatorii frecventelor



Indicatorii frecventelor


Analiza unei repartitii unidimensionala constituita in functie de o variabila numerica se bazeaza pe un sistem de indicatori format din:

indicatori ce caracterizeaza frecventele de aparitie ale unitatilor colectivitatii;

indicatori ce caracterizeaza valorile caracteristicii cercetate.

Calculul acestor indicatori si valoarea lor cognitiva vor fi ilustrate si analizate pe baza repartitiei din tabelul nr. 4.1

In grupa indicatorilor de frecventa se cuprind: frecvente absolute, frecvente relative, frecvente cumulate.

Frecventele absolute (ni) exprima numarul unitatilor elementelor cuprinse intr-o grupa, definita de o varianta sau un interval de variatie. Frecventele absolute se exprima in unitati concrete de masura (numar de agenti economici, numar de salariati, numar de clienti etc). In tabelul nr. 4.1 frecventele absolute apar in coloana 1 si indica cati agenti economici se incadreaza in fiecare interval.

Compararea frecventelor absolute a doua repartitii alcatuite pentru aceiasi caracteristica dar cu numar diferit de unitati componente nu poate fi realizata pe baza frecventelor absolute. Compararea presupune, in acest caz folosirea frecventelor relative.

Frecventele relative (ni*) exprima ponderi, greutati specifice, cate parti ale unitatilor corespunzatoare unei variante sau grup de variante, in totalul colectivitatii. Deci, frecventele relative sunt marimi relative de structura :


ni =


unde : i = grupe

In cazul repartitiei din tabelul nr. 4.1, frecventele relative sunt prezentate in tabelul nr. 4.2 col 3 si 4 :



Tabelul nr. 4.2

Cifra de afaceri (xi)

Frecventa absoluta (ni)

Frecventa relativa (ni*)

Densitatea de frecventa



Coeficient

Procente

Absoluta

Relativa

A






Pana la 20




































Peste 40






Total


(Σ ni)






Nota : Limita superioara este inclusa in interval


Repartitia agentilor economici dupa cifra de afaceri tinde catre repartitia normala, concluzie care rezulta din figura nr. 4.2 si din faptul ca frecventele relative descresc catre capetele seriei.


Daca o repartitie este alcatuita pe intervale neegale de grupare, frecventele relative nu sunt in masura sa sugereze forma repartitiei deoarece nu sunt direct comparabile. In asemenea situatie trebuie sa se recurga la densitatile de frecvente.

Densitatea de frecventa este raportul dintre frecventa absoluta (ni) sau relativa (ni*) si marimea intervalelor de grupare (hi). Daca densitatile de frecvente descresc spre cele doua capete ale seriei, repartitia empirica tinde spre o repartitie normala (vezi tabelul nr. 4.2 col 4 si 5).

In analiza repartitiilor empirice este uneori necesar sa se cunoasca frecventa absoluta sau relativa la care s-a inregistrat cel mult o valoare xi respectiv cel putin o anumita valoare xi. Indicatorul frecventelor la care se recurge in acest caz este frecventa cumulata. Care este numarul gospodariilor populatiei la care venitul mediu lunar pe 1 persoana este cel putin de 3 milioane lei? Cat la suta din agentii economici au cel mult 20 de angajati?

Frecventele cumulate corespunzatoare unei valori empirice a caracteristicii xi se calculeaza insumand frecventele absolute sau relative incepand cu cele corespunzatoare valorilor mai mici sau incepand cu cele aferente valorilor mai mari ale caracteristicii pana la xi inclusiv. In primul caz rezulta frecvente cumulate crescator respectiv frecvente cumulate descrescator, in cel de-al doilea caz.

Frecventele cumulate servesc si la exprimarea nivelului de concentrare intr-o colectivitate si la determinarea unori indicatori ai tendintei centrale (mediu de pozitie).

Daca, de exemplu, intereseaza cati din totalul agentilor economici au avut o cifra de afaceri de cel mult 32 miliarde lei (vezi tabelul nr. 4.2) se cumuleaza frecventele absolute corespunzatoare primelor patru intervale, deci 136, respectiv 68% din totalul agentilor .

In tabelul nr. 4.3 sunt prezentate frecventele absolute si frecventele relative cumulate crescator si descrescator :









Tabelul nr. 4.3

Cifra de afaceri (xi)

Frecventa absoluta (ni)

Frecventa cumulata

absoluta

Frecventa cumulata

relativa (%)



Crescator

Descrescator

Crescator

Descrescator

Pana la 20




































Peste 40






Total







O repartitie construita pe baza frecventelor cumulate se reprezinta grafic prin poligonul frecventelor cumulate, numit si ogiva (vezi fig. 4.2)



Fig. 4.2 Frecventa cumulata privind repartitia agentilor economici dupa cifra de afaceri


Frecventele cumulate sunt comparabile intre ele indiferent de marimea intervalelor de grupare.


Indicatorii tendintei centrale


Repartitiile si prezentarea lor sub forma de tabele si grafice ofera o imagine asupra colectivitatii statistice care trebuie analizata. Caracterizarea mai concisa presupune folosirea unor valori tipice cu o mare putere de sinteza si de informare, care pot fi utilizati la compararea mai multor repartitii empirice. Prin aceste valori tipice se caracterizeaza masa valorilor empirice printr-o singura expresie numerica. Aceste valori tipice au menirea de a exprima ceea ce este comun, tipic, esential pentru elementele colectivitatii cercetate si sunt denumite indicatori ai tendintei centrale.

Complexitatea realitatii impune, in functie de variabilitatea valorilor individuale, de tipul de scala de masurare, de natura datelor disponibile etc, folosirea mai multor indicatori ai tendintei centrale. In practica statistica se utilizeaza ca principali indicatori ai tendintei centrale marimile medii.

In functie de natura datelor disponibile si de necesitatile de analiza poate fi folosita una din urmatoarele doua grupe de marimi medii: medii calculate si medii pozitionale (de pozitie).

Caracterizarea tendintei centrale in cazul unei repartitii unidimensionale se poate realiza prin media aritmetica, prin mediana (valoarea centrala) si prin modul (valoarea dominanta).

Media reprezinta in statistica principalul indicator prin care se caracterizeaza sintetic un numar mare de valori individuale. Media este rezultatul sintetizarii intr-un singur numar, nivel reprezentativ a tot ceea ce este esential si tipic in masa valorilor individuale. Fiind o marime rezultata dintr-un calcul, media nu coincide de cele mai multe ori cu nici una din valorile empirice. Se exprima in unitati concrete de masura si anume in aceleasi unitati de masura ca si valorile concrete din care se calculeaza.

Media poate descrie ceea ce este esential, comun, obiectiv intr-o masa de manifestari individuale, daca sunt indeplinite urmatoarele cerinte fundamentale:

numarul valorilor individuale din care se calculeaza sa fie suficient de mare;

valorile individuale din care se calculeaza o medie sa fie cat mai apropiate ca marime, ceea ce inseamna sa formeze un ansamblu omogen. Daca colectivitatea este eterogena se recomanda impartirea acesteia pe grupe si calcularea de medii de grupa / conditionale ;

alegerea tipului de medie trebuie sa porneasca de la natura variatiei fenomenului analizat.


Media aritmetica


Media aritmetica () este cea mai cunoscuta si cea mai utilizata medie. Este rezultatul raportului dintre suma valorilor individuale observate si numarul total al unitatilor. In sens statistic, media aritmetica este valoarea care s-ar fi inregistrat in toate cazurile individuale daca toti factorii de influenta ar fi fost constanti. In aceste conditii, abaterea valorilor individuale de la media lor se datoreaza actiunii factorilor intamplatori, neesentiali.

Media aritmetica este acea valoare care inlocuind toate valorile individuale (xi), nu modifica suma acestora (Σ xi).

Media aritmetica poate fi calculata ca o medie simpla si ca o medie ponderata.

Ø     Pentru o serie simpla, suma valorilor individuale este:


(4.1)


si inlocuind fiecare termen cu media


(4.2)


se obtine relatia mediei aritmetice simple:


(4.3)


Relatia [4.3] se aplica daca fiecare valoare empirica a fost observata o singura data sau de acelasi numar de ori, deci cand frecventele de aparitie sunt egale.

Ø     In cazul unei serii de frecvente valorile individuale apar de un numar diferit de ori (ni). Pentru a obtine, in acest caz, nivelul totalizator al valorilor individuale se tine seama de frecventa absoluta inregistrata in cazul fiecarei valori distincte (xi ni). Media aritmetica se calculeaza sub forma mediei aritmetice ponderate, dupa formula :


(4.4)


unde: grupe

In relatia (4.4) expresia   reprezinta frecventa relativa ni*, care exprima ponderea cu care intra in calculul mediei fiecare valoare distincta inregistrata. Deci, daca se dispune de o repartitie de frecvente relative media aritmetica se calculeaza dupa relatia:


(4.5)


cand frecventele relative se exprima sub forma de coeficienti si


(4.6)


cand frecventele relative sunt exprimate procentual.

Exemplul 4.2 : Media aritmetica poate fi aplicata in cazul unei variabile masurate printr-o scala metrica, iar datele din care se calculeaza sunt valori primare, direct masurabile. Teoretic ar trebui ca valorile empirice observate sa tinda sa formeze o progresie aritmetica.

Media aritmetica are avantajul ca este usor de aplicat si este usor de inteles. Media aritmetica are marele dezavantaj ca este sensibila la valorile extreme.











Repartitia agentilor economici dupa numarul de salariati


Tabelul 4.4

Numarul salariatilor (xi)

Numarul agentilor (ni)

xi ni

ni* (%)

xi ni*

A





































Total






Numarul mediu de salariati pe un agent economic se determina aplicand media aritmetica ponderata :

salariati

sau

salariati

Daca repartitia de frecvente a fost construita pe intervale de grupare egale sau neegale, media aritmetica se estimeaza aplicand una din relatiile 4.4 - 4.6. Fiecare interval de grupare se ia in calculul mediei cu centrul (mijlocul) intervalului (xi). Centrul fiecarui interval se determina ca o medie aritmetica simpla ale limitelor fiecarui interval.

Se procedeaza astfel pornind de la ipoteza ca frecventele se distribuie uniform pe intervalul de grupare. Aceasta ipoteza nu se verifica intotdeauna, motiv pentru care nivelul totalizator calculat (Σ xi ni) nu este egal cu suma valorilor empirice (Σ xi).

Media calculata pentru o repartitie de frecvente contruita pe intervale de grupare este numai o estimare a mediei calculata pe baza datelor negrupate. Estimarea este cu atat mai grosiera cu cat intervalele de grupare sunt mai mari.

Calculul mediei aritmetice se exemplifica pe baza repartitiei prezentata in tabelul nr. 4.1


Distributia agentilor economici dupa cifra de afaceri (miliarde lei)


Tabelul nr. 4.5

Cifra de afaceri

Numar agenti economici (ni)

Centre de interval

(xi)

xi ni

Pana la 20
























40 si peste




Total


(Σ ni)



(Σ xi ni)


Intervalele marginale fiind deschise se inchid conventional, pornind de la marimea intervalelor alaturate: x1inf = x1sup 4 = 16 si x7sup = x7inf + 4 = 44 :

miliarde lei.

Media aritmetica are cateva proprietati matematice, care sunt de mare importanta pentru aplicarea ei in statistica.

media aritmetica este cuprinsa in intervalul de variatie al variabilei:


(4.7)


suma abaterilor valorilor individuale de la media lor este egala cu zero:

pentru o serie simpla,


(4.8)


pentru o serie de frecvente,


(4.9)

daca toate valorile individuale se maresc sau se micsoreaza cu o constanta a, media noii serii se modifica in acelasi sens si cu aceiasi constanta a :


(4.10)


respectiv,


(4.11)


daca toate valorile individuale se modifica prin impartirea / inmultirea cu o constanta h, media noii serii va fi de h ori mai mica / mai mare decat media seriei initiale.

Pentru o serie simpla:


(4.12)


Pentru o serie de frecvente:


(4.13)


Tinand seama de ultimele doua proprietati mentionate se obtine relatia de calcul simplificat al mediei aritmetice:

Pentru o serie simpla :


(4.14)



Pentru o serie de frecvente:


(4.15)


Cele doua constante semnifica:

h este marimea intervalului de grupare

a poate fi centrul oricarui interval de grupare

- daca se micsoreaza toate frecventele prin impartirea la o constanta c, media seriei nu se modifica.


(4.16)


Constanta c reprezinta, de regula, totalul frecventelor absolute (Σ ni).

- intr-o colectivitate impartita pe subcolectivitati, media pe total se poate calcula si ca o medie aritmetica a mediilor subcolectivitatilor .

* Subcolectivitatile sunt de aceleasi valori :


(4.17)


* Subcolectivitatile au un numar diferit de unitati :


(4.18)


Aplicarea relatiei de calcul simplificat al mediei se exemplifica pe baza repartitiei prezentata in tabelul nr. 4.1


Tabelul nr. 4.6

Cifra de afaceri (miliarde lei)

Numar agenti economici (ni)

Centrul intervalului (xi)

Pana la 20






























40 si peste





Total


(Σ ni)





Pentru a = 26 si h = 4, rezulta :

miliarde lei

Se observa faptul ca media determinata pe baza relatiei de calcul simplificat este egala cu cea obtinuta prin aplicarea relatiei de baza (4.4).


Mediana (valoarea centrala)


Mediana (Me) unei serii este acea valoare care imparte sirul valorilor ordonate crescator in doua parti egale.





Mediana presupune ca formele de manifestare ale caracteristicilor pot fi masurate printr-o scala ordinala.

Indiferent de tipul seriei (simpla sau de frecvente), determinarea medianei presupune:

stabilirea locului medianei;

calcularea valorii mediane



Locul medianei se afla prin relatia:

In cazul unei serii simple formata dintr-un numar impar de termeni, mediana este tocmai valoarea centrala, din mijloc.

Daca, de exemplu, dispunem de sirul ordonat de valori: 2, 4, 4, 6, 7, 9, 10, atunci mediana ocupa pozitia a 4-a in serie.

Daca seria este formata dintr-un numar par de termeni, atunci mediana se localizeaza intre cei doi termeni central. Valoarea medianei se determina, in acest caz, ca o medie aritmetica simpla a celor doi termeni din mijlocul seriei.

De exemplu, daca seria este formata din valorile: 2, 4, 4, 6, 7, 9, 10, 15, mediana se situeaza intre termenii care ocupa pozitia patru si cinci in serie si este egala cu media aritmetica a celor doi termeni, adica:

Intr-o serie construita pe intervale de grupare, locul medianei indica intervalul in care se situeaza. La calcularea valorii medianei se porneste, ca si in cazul mediei, de la ipoteza ca valorile se distribuie uniform pe intregul interval de grupare. Valoarea medianei se estimeaza pe baza relatiei :


(4.19)


unde

xo limita superioara a intervalului unde se afla mediana ;

h marimea intervalului median ;

locul medianei;

suma frecventelor pana la intervalul median sau frecventa cumulata crescator corespunzatoare intervalului care precede intervalul median ;

nMe frecventa intervalului median.

Se remarca faptul ca toate elementele din relatia 4.19 sunt legate de locul medianei in serie.

Locul medianei in serie se stabileste astfel:

- se determina frecventele cumulate crescator;

- se identifica prima frecventa cumulata crescator care este mai mare sau cel putin egala cu expresia: , respectiv rezultatul calculului care indica locul medianei ;

- intervalul de grupare care corespunde cerintei de mai sus este intervalul median.

Exemplificam calculul medianei pe baza repartitiei din tabelul nr. 4.1 :


Tabelul nr. 4.7

Cifra de afaceri (xi)

Numar de agenti economici (ni)

Frecventa

cumulata



Crescator

Descrescator

Pana la 20
























40 si peste




Total

200 (n=Σni)




Prima frecventa cumulata crescator > 100,5 este 136. Deci,

26 < Me < 32 :

miliarde lei

Mediana poate fi calculata si grafic pe baza poligonului frecventelor cumulate.

- Se construieste poligonul frecventelor cumulate crescator si descrescator.


Proiectia punctului de intersectie a celor doua curbe pe axa OX

indica mediana (vezi fig. nr. 4.2)




FFnbdn

FFig. 4.3 Calculul grafic al medianei






Me

 









Fig. 4.3 Calculul grafic al medianei


- Se construieste poligonul frecventelor cumulate crescator. D care indica locul medianei , respectiv 100,5 in cazul de pe coordonata se traseaza o paralela la axa OX. Proiectia punctului de intersectie dintre aceasta paralela si curba frecventelor pe axa OX indica valoarea medianei.

Me

 


Fig. nr. 4.4 Calculul grafic al medianei


Mediana are o serie de proprietati, din cadrul carora mentionam:

- calculul medianei este foarte simplu;

- corespunde mai bine decat media aritmetica de mijloc, de centru;

- nu este influentata de valorile extreme (aberante) si nici de faptul ca intervalele marginale pot fi deschise. Aceasta deoarece valoarea ei depinde de pozitia pe care o ocupa o anumita varianta in seria de distributie. Pornind de la aceasta proprietate, mediana poate inlocui media aritmetica daca seria prezinta intervale deschise si/sau daca distributia se abate pronuntat de la repartitia normala ;

- suma abaterilor absolute a valorilor observate de la mediana este minima :
,
pentru o serie simpla;

si

, pentru o serie de frecvente.








Modul (valoarea dominanta)


Modul (Mo) unei distributii statistice este aceea valoare a variabilei care are frecventa cea mai mare de aparitie. Modul este singurul indicator ai tendintei centrale care are sens in cazul unei repartitii dupa o variabila nominala, ale carei variante au fost masurate printr-o scala nominala.

Intr-o serie de frecvente alcatuita pe valori, modul este valoarea cu frecventa cea mai mare. Astfel, in seria din tabelul nr. 4.4, modul este egal cu 15.

Intr-o repartitie de frecvente alcatuita pe intervale egale de grupare, frecventa cea mai mare indica intervalul in care se afla modul. Valoarea acestuia se estimeaza prin interpolare, pe baza relatiei:


(4.20)


unde

xo limita inferioara a intervalului modal ;

h marimea intervalului modal ;

Δ1 diferenta dintre frecventa intervalului modal si frecventa

intervalului precedent ;

Δ1 diferenta dintre frecventa intervalului modal si a celui

urmator

In cazul distributiei din tabelul nr. 4.7 modulul este:

miliarde lei

Ca si mediana, modul poate fi calculat grafic pornind de la histograma. Se procedeaza astfel :

- cu dreptunghiul cu inaltimea cea mai mare se traseaza doua segmente de dreapta (vezi fig. 4.4) ;

- se traseaza o perpendiculara din intersectia celor doua segmente de dreapta pe abscisa. Intersectia acestei perpendiculare cu axa OX indica valoarea modului : (Mo = 27,45) ;

Mo

 


Modul are urmatoarele proprietati principale :

calculul este foarte simplu;

valoarea modului nu depinde de toti termenii seriei;

Se recomanda sa se foloseasca modul cand intereseaza valoarea tipica. Poate fi folosit independent dar si ca un indicator care completeaza informatiile furnizate de alte medii.



modul ofera relativ putine informatii. Ele arata numai daca o valoare modala apare mai frecvent decat celelalte valori. Daca celelalte valori apar aproape tot asa de frecvent ca valoarea modala, s-ar putea ca o valoare sa devina modala din intamplare. Deci, poate se recomanda pentru a caracteriza ce este tipic intr-o distributie numai daca o valoare domina clar in serie ;

daca celelalte valori se indeparteaza foarte mult de valoarea modala, acesta nu poate oferi informatii relevante pentru caracterizarea seriei.

In cazul distributiei agentilor economici dupa cifra de afaceri, cei trei indicatori ai tendintei centrale au urmatoarele valori :



deci, , ceea ce inseamna ca distributia prezinta o asimetrie de stanga.

Daca ordinea celor trei indicatori este , atunci seria este asimetrica de dreapta,

Cei trei indicatori sunt egali in cazul unei serii perfect simetrice.

In concluzie, media aritmetica descrie corect ceea ce este esential intr-o serie de distributie, daca aceasta este formata din valori omogene si tinde spre o repartitie normala. In acest caz, mediana si modul pot completa media.

Daca seria nu este omogena sau daca repartitia este pronuntat asimetrica, sau daca clasele marginale sunt deschise, se recomanda folosirea modului a a medianei.


Alte tipuri de medii


In practica statistica se utilizeaza mai multe tipuri de medii. Alegerea tipului mediei trebuie sa porneasca de la natura datelor din care se calculeaza o medie.

Media aritmetica se aplica daca are sens sa se insumeze valorile individuale, deci sa se calculeze nivelul totalizator (Σxi). Frecvent insa este necesar sa se calculeze media din datele care sunt marimi relative de intensitate (salarii medii, rate medii de rentabilitate) sau marimi relative de structura (rate ale somajului pe judete) sau modificari relative (ritmuri de crestere) etc. In asemenea situatii, insumarea directa a valorilor din care se calculeaza media nu are sens.

In grupa 'alte tipuri de medii' se cuprind: media armonica , media geometrica , media patratica , media cronologica .

Media armonica se calculeaza din valorile inverse ale termenilor seriei si este acea valoare care nu modifica suma inverselor termenilor.


(4.21)


deci

(4.22)


de unde rezulta:

(4.23)


Relatia 4.23 se aplica in cazul unei serii simple.

Pentru o serie de frecvente se foloseste media armonica ponderata :


(4.24)


Ca regula, media armonica trebuie folosita cand datele din care se calculeaza media nu sunt date primare ci sunt date derivate, rezultate din calcule, respectiv sunt marimi relative de structura sau marimi relative de intensitate. Aceste marimi relative pot fi interpretate drept medii partiale, din care trebuie calculata o medie totala / generala.

La calcularea unei medii din medii partiale, poate fi utilizata media aritmetica sau media armonica in functie de datele disponibile, si anume:

Daca pe langa mediile partiale se cunosc numitorii rapoartelor din care rezulta aceste medii partiale se explica media aritmetica;

Daca pe langa mediile partiale se cunosc numitorii din care rezulta aceste medii partiale, se aplica media armonica.


Exemplul 4.3 : Pentru trei judete se cunoaste rata somajului pentru luna X si numarul populatiei active la 1 ianuarie a.c.


Tabelul nr. 4.8

Judetul

Rata somajului


Numarul persoanelor

(mii persoane)

A



B



C



Total




Care este rata medie a somajului?

Rata somajului la nivelul fiecarui judet (RSi) este o pondere care arata cat la 100 reprezinta numarul somerilor (NSi) in populatia activa (PAi), deci .

Rata medie este un raport dintre numarul somerilor din cele trei judete si populatia activa din cele trei judete (Σ PAi), deci :

.

Nu se cunoaste populatia activa. Aceasta rezulta din expresia: sau .

Deci, , ceea ce inseamna ca se aplica media armonica :


Daca pe langa rata somajului s-ar fi cunoscut populatia activa, rata medie a somajului s-ar fi calculat pe baza mediei aritmetice ponderate.

In practica statistica si in analiza activitatii economice, media armonica se foloseste cel mai frecvent la calculul indicelui preturilor de tip Paasche (vezi capitolul 9: Indici statistici).


Media patratica


Media patratica este definita drept acea valoare care inlocuind termenii seriei ridicati la patrat, din care se calculeaza, nu modifica suma patratelor acestora:


(4.25)


deci

(4.26)


Media patratica se recomanda a fi folosita cand intr-o serie predomina valorile absolute sau atunci cand seria este formata atat din valori pozitive cat si negative.

Relatia 4.26 se aplica la calculul mediei patratice in cazul unei serii simple. In cazul unei serii de frecvente se aplica media patratica ponderata :

Media patratica este intotdeauna mai mare decat media aritmetica . Aceasta deoarece prin ridicare la patrat creste importanta valorilor mari.

Media patratica se aplica cel mai frecvent la calculul abaterii medii patratice, care este unul din cei mai utilizati indicatori sintetici de variatie.


Media geometrica


Media geometrica se bazeaza pe relatia de produs a termenilor seriei, fata de relatia de insumare aplicata in cazul mediilor prezentate anterior.

Media geometrica este acea valoare care, inlocuind termenii seriei, nu modifica produsul acestora:


(4.27)


sau


(4.28)


de unde:


- media geometrica simpla:


(4.29)


- media geometrica ponderata:


(4.30)


Folosirea mediei geometrice presupune ca intre termenii seriei sa existe o relatie de produs. De cele mai multe ori, media geometrica se aplica cand seria este formata din termeni care reprezinta marimi relative de dinamica.

Din modificari relative exprimate sub forma de coeficienti (rate de crestere) nu se calculeaza direct media geometrica. Aceste date se transforma mai intai in indici, adaugand 1, urmand ca din datele obtinute sa se calculeze media geometrica. Cresterea medie se obtine daca din rezultatul mediei geometrice se scade 1.

Aplicarea mediei presupune ca toti termenii seriei sa fie pozitivi. Media geometrica acorda o importanta mai mare valorilor mai mici. Calculata pe baza acelorasi date, media geometrica este mai mica decat media aritmetica.

Text Box: Existenta mai multor tipuri de medii ridica intrebarea: cand se aplica una sau alta din mediile prezentate anterior?
 Modul este, in cazul variabilelor masurate pentru o scala nominala, singurul indicator ai tendintei centrale care are sens.
 Mediana este principalul indicator ai tendintei centrale in cazul variabilelor masurate pe baza unei scale ordinale. In cazul variabilelor cantitative, masurate printr-o scala metrica, mediana completeaza media aritmetica sau poate inlocui aceasta medie daca repartitia este pronuntat asimetrica sau cuprinde valori care se abat semnificativ de masa valorilor.
 Media aritmetica este cea mai importanta medie in cazul seriilor alcatuite pentru o variabila masurata pe baza unei scale metrice. Se poate aplica intotdeauna, cand are sens sa se insumeze termenii seriei.
 Media geometrica se aplica tot in cazul variabilelor scalate metric si cand intre date exista o relatie de produs, respectiv exprima evolutia in timp.
 Media armonica presupune ca masurarea sa se bazeze pe o scala metrica, iar datele din care se calculeaza sa fie marimi relative de structura sau de intensitate.
 Media patratica se aplica in cazul seriilor de date scalate metric, cand termenii pot fi atat valori pozitive cat si negative.


Indicatorii variatiei


Caracterizarea unei repartitii prin intermediul mediilor ridica, in mod normal, intrebarea daca valorile empirice se situeaza aproape de media lor sau prezinta o imprastiere pronuntata.

Aceasta deoarece media are menirea de a caracteriza tendinta centrala. Cu cat imprastierea / variatia valorilor individuale este mai mare, cu atat mai putin este media in masura sa sintetizeze ceea ce este tipic, esential si comun in masa de date empirice. Deci, reprezentativitatea mediei scade odata cu cresterea variatiei valorilor individuale, respectiv cu cat valorile individuale sunt mai apropiate intre ele cu atat colectivitatea este mai omogena si media mai reprezentativa.

In general, indicatorii variatiei servesc descrierii mai complete a unei repartitii comparativ cu cea realizata numai prin intermediul mediei. Un indicator de variatie completeaza informatiile furnizate de o medie. Indicatorii variatiei ofera informatii privind calitatea mediei unei repartitii ca reprezentativa sau nereprezentativa.

Indicatorii variatiei servesc la:

- verificarea reprezentativitatii mediei ca valoare tipica a unei serii de date empirice;

- verificarea gradului de omogenitate a seriei;

- caracterizarea statistica a formei si gradului de variatie;

- cunoasterea gradului de influenta a factorilor.

Indicatorii variatiei se diferentiaza in functie de numarul variantelor / valorilor luate in calcul si dupa rolul indeplinit in analiza variatiei, in doua grupe :

Indicatori simpli ai variatiei;

Indicatori sintetici ai variatiei.


Indicatorii simpli ai variatiei


Indicatorii simpli ai variatiei se determina ca diferenta dintre doua valori si ca un raport procentual dintre diferenta a doua valori si media valorilor empirice. Din aceasta grupa fac parte amplitudinea variatiei (absoluta si relativa) si abaterile individuale (absolute si relative).

Amplitudinea absoluta (A) este indicatorul de variatie cel mai simplu. Se determina ca diferenta dintre valorile extreme ale caracteristicii si exprima marimea campului de imprastiere.


A = xmax xmin


In cazul unei repartitii construita pe intervale de grupare, amplitudinea variatiei se determina ca diferenta dintre limita superioara a ultimului interval si limita inferioara a primului interval. Daca primul si ultimul interval sunt deschise, amplitudinea variatiei se estimeaza pe baza diferentei dintre centrele intervalelor extreme.

Amplitudinea relativa (A%) este un raport procentual dintre amplitudinea absoluta si media seriei:


(4.32)


Amplitudinea variatiei (absoluta si relativa) poate dezinforma atunci cand valorile extreme se situeaza la distanta mare de masa valorilor empirice. Din acest motiv acest indicator nu ofera informatii concludente privitor la gradul de variatie a doua repartitii.

Amplitudinea variatiei se aplica:

- in toate cazurile cand intereseaza tocmai valorile extreme;

- controlul calitatii proceselor de productie.

O alternativa la amplitudinea variatiei, in scopul caracterizarii imprastierii unei repartitii o constituie cuantilele, respectiv indicatorii care impart seria valorilor ordonate intr-un anumit numar de parti egale: cuartilele; quintilele; decilele; centilele; percentilele etc.

Cuartilele (Q) sunt acele valori ale caracteristicii care impart seria valorilor ordonate in patru parti egale:

- Cuartila inferioara (Q1) este acea valoare care separa 25 % din valorile mici de restul de 75 % din valori;

- Cuartila a doua (Q2) imparte seria in doua parti egale, deci coincide cu mediana (Q2 = Me);

- Cuartila a treia (Q3) separa primii 75 % din valori de restul de 25 % din valorile mai mari.






Cuantilele se calculeaza dupa metodologia mentionata la mediana.

Locul cuartelelor:

Se cumuleaza crescator frecventele. Q1 este valoarea corespunzatoare frecventei cumulate care este mai mare sau cel putin egala cu , respectiv in cazul Q3.




Valoarea Q1 se calculeaza dupa relatia:


(4.33)


respectiv, Q3:


(4.34)


In cazul repartitiei agentilor economici dupa cifra de afaceri (tabelul nr. 4.9) Q1 si Q3 se determina:


Tabelul nr. 4.9

Cifra de afaceri

Numar de agenti economici

Frecvente cumulate

Pana la 20


















40 si peste



Total




miliarde lei;

50,5 < 90 → 20 <Q1 < 28 ;

miliarde lei;

miliarde lei;

Decilele (D) separa sirul valorilor ordonate in 10 parti egale.

Prima decila (D1) separa 10 % din valorile mai mici de restul de 90 % din valori.

.

.

.

.

Valorea D1, D2 si D9 se determina astfel:

miliarde lei

miliarde lei

miliarde lei

Cuantilele se pot calcula si grafic. Se porneste de la poligonul frecventelor cumulate si de pe ordonata corespunzator valorii care indica locul cuantilei respective se traseaza o paralela la abcisa.

Din punctul de intersectie cu opoligonul frecventelor cumulate se traseaza o paralela la axa OX.

Abaterile individuale absolute (di) reprezinta diferenta intre fiecare valoare empirica si media aritmetica a termenilor:


(4.35)


Abaterile relative (di%) se calculeaza ca un raport procentual dintre abaterea absoluta si media caracteristicii:

(4.36)


In analiza variatiei se calculeaza, de regula numai abaterile maxime, respectiv pozitiva si negativa. Daca aceste abateri, luate in valoare absoluta, difera seminificativ, trebuie trasa concluzia ca repatitia este pronuntat asimetrica, situatie care impune calcularea si a indicatorilor care masoara gradul de asimetrie.


Indicatorii sintetici ai variatiei


Amplitudinea variatiei si abaterile individuale ofera o imagine globala asupra variatiei, dar nu sunt in situatia sa ofere o masura care sa caracterizeze sintetic gradul de variatie. O astfel de masura se obtine daca se porneste de la principiul aplicat in cazul mediilor si anume: suma abaterilor ponderate cu frecventele de aparitie. Aceasta inseamna sa se sintetizeze toate abaterile individuale intr-o singura expresie, calculand media lor: . Dar suma abaterilor valorilor individuale de la media lor este intotdeauna egala cu 0. pentru a evita compensarea abaterilor pozitive si negative exista doua posibilitati:

a) fiecare abatere individuala sa se ia in calcul cu valoarea absoluta, ;

b) fiecare abatere individuala sa se ia in calcul cu patratul lor, .

In primul caz se calculeaza o medie aritmetica a valorilor absolute ale abaterilor individuale , respectiv o medie aritmetica a patratelor abaterilor individuale .

Indicatorii sintetici ai variatiei sunt: abaterea medie liniara ; dispersia , abaterea medie patratica ; coeficientul de variatie (V).

Abaterea medie liniara se calculeaza ca o medie aritmetica simpla sau ponderata a abaterilor individuale, luate cu valoarea absoluta:




* pentru o serie simpla:


(4.37)


* pentru o serie de frecvente:


(4.40)


In cazul unei serii de frecvente relative exprimate procentual, se calculeaza:


(4.41)


Abaterea medie liniara evidentiaza cu cat se abate in medie fiecare termen de la media termenilor. Calculul abaterii medii liniare se exemplifica pe baza seriei de repartitie prezentata in tabelul nr. 4.10.


Tabelul nr. 4.10

Cifra de afaceri (miliarde lei)

Numar agenti economici

A





Pana la 20






























40 si peste





Total






Nota : Media aritmetica este egala cu 29,06 miliarde lei


miliarde lei


Semnificatie: Cifra de afaceri al oricarui agent economic se abate in medie de la 29,06 miliarde lei cu 4,954 miliarde lei.

Dispersia se calculeaza ca o medie aritmetica simpla sau ponderata a patratelor abaterilor termenilor seriei de media lor:

- pentru o serie simpla:


(4.42)


- pentru o serie de frecvente:


(4.43)


- pentru o serie de frecvente relative exprimate procentual:


(4.44)


dispersia este o marime abstracta, care nu serveste nemijlocit analiza variatiei. Pe baza ei se calculeaza abaterea medie patratica.

In cazul repartitiei din tabelul nr. 4.10, dispersia se calculeaza pe baza relatiei 4.43.

In vederea determinarii dispersiei pot fi aplicate formule alternative care rezulta din dezvoltarea expresiei din numaratorul relatiei de baza (formula 4.43) si din unele proprietati ale dispersiei.

Daca se dezvolta binomul rezulta:

sau (4.45)


Proprietatile dispersiei pe care se bazeaza o alta formula alternativa sunt:

- dispersia calculata pe baza valorilor empirice micsorate in prealabil prin scaderea unei constante a , este mai mare decat dispersia valorilor initiale cu , deci:

.

- dispersia calculata pe baza valorilor seriei micsorate in prealabil prin impartirea la o constanta h, este de h2 ori mai mica decat dispersia valorilor initiale.

Combinand aceste proprietati rezulta :


(4.46)


unde a si h au semnificatiile ca la calculul mediei aritmetice.

Relatia 4.46 simplifica calculul dispersiei daca seria de repartitie a fost construita pe intervale de grupare egale.

Abaterea medie patratica sau abaterea standard este o medie patratica a abaterilor individuale:


, pentru o serie simpla (4.47)


respectiv,


, pentru o serie de frecvente (4.48)


Deci,



In exemplul din tabelul nr. 4.10:

miliarde lei

, deoarece o medie patratica este mai mare decat o medie aritmetica.

Semnificatie: Cifrele de afaceri se abat in medie de la 29,06 miliarde lei cu 6,0 miliarde lei. O abatere medie de 6,0 miliarde reprezinta mult sau putin? Poate reprezenta mult sau putin in raport cu o valoare tipica, deci cu media seriei.

Coeficientul de variatie (V)

Abaterea medie patratica, ca si abaterea medie liniar sunt masuri absolute ale variatiei si, ca urmare, valoarea lor depinde de marimea valorilor caracteristicii. Comparatii privind gradul de variatie si omogenitatea intre doua sau mai multe repartitii nu pot fi efectuate pe baza acestor indicatori. Pentru cunoasterea acestor aspecte se foloseste coeficientul de variatie, care este un raport procentual dintre abaterea medie patratica si media seriei.


(4.49)


Interpretare: cu cat coeficientul de variatie se apropie mai mult de zero, cu atat variatia este mai redusa, colectivitatea este mai omogena iar media este mai reprezentativa.

Se apreciaza ca daca coeficientul de variatie care nu depaseste pragul de 35% intensitatea variatiei este redusa iar media este reprezentativa pentru valorile individuale din care s-a calculat. Cu cat se depaseste pragul de 35% cu atat intensitatea variatiei creste, iar media devine mai nereprezentativa. Aceasta inseamna ca variatia nu mai poate fi pusa pe seama intamplarii, deci cel putin un factor considerat intamplator are o influenta semnificativa. In cazul repartitiei prezentata in tabelul nr. 4.10, coeficientul de variatie este egal cu 20,6% ceea ce indica faptul ca media este reprezentativa.


Descompunerea dispersiei intr-o colectivitate impartita pe grupe (Regula de adunare a dispersiilor).


Dispersia este un indicator pe baza caruia se calculeaza abaterea medie patratica. De asemenea, se foloseste la analiza interdependentelor, in sensul ca nu de putine ori este necesar sa se cunatifice cat din variatia valorilor unei variabile efect (rezultat) se poate explica pe seama altei / (altor) variabile considerata cauza. De exemplu, cat la suta din variatia cifrei de afaceri celor 200 de agenti economici (miliarde lei) se poate explica prin variatia numarului de angajati?

Pentru a raspunde unei astfel de cerinte de cunoastere se recurge la o grupare a datelor dupa caracteristica considerata cauza (X) urmand ca fiecare grupa obtinuta sa fie impartita dupa caracteristica efect (Y). Procedand astfel rezulta o repartitie bidimensionala, respectiv o repartitie multidimensionala de frecvente daca in analiza se introduc mai multe variabile factoriale.



In tabelul nr. 4.11 se prezinta macheta unei repartitii bidimensionale, in care valorile au fost impartite in r grupe dupa caracteristica X si in m grupe dupa caracteristica Y.


Tabelul nr. 4.11

Valorile caracteristicii X (xi)

Valorile

caracteristicii Y(yi)

Totalul frecventelor asociate variabilei X


y1

y2


yj


ym

(ni)

x1

n11

n12


n1j


n1m

n1

x2

n21

n22


n2j


n2m

n2









xi

ni1

ni2


nij


nim

ni









xr

nr1

nr2


nrj


nrm

nr

Totalul frecventelor asociate variabilei

Y (nj)

n1

n2


nj


nm

Σ n1=Σ nj


In tabelul nr. 4.11 apar pentru variabila efect (Y) doua tipuri de repartitii:

a) o repartitie pe total (yj, nj), care nu tine seama de grupele construite dupa caracteristica considerata cauza;

b) r repartitii conditionate de grupele construite dupa caracteristica de grupare.


Corespunzator celor doua tipuri de repartitii se pot calcula pentru variabila Y urmatoarele medii:

- o media generala respectiv pentru repartitia pe total  :


(4.50)


- medii de grupa sau medii conditionate de factorul de grupare , pentru repartitiile conditionate :


(4.51)


Numarul mediilor de grupa este egal cu numarul grupelor construite dupa caracteristica factoriala. Media mediilor de grupa este egala cu media generala.

Pornind de la valorile individuale si de la mediile conditionate si de la media generala se pot determina urmatoarele abateri:

- variatia valorilor individuale in jurul mediei generale,  ;

- variatia valorilor individuale in jurul mediilor de grupa (conditionate), ;

- abaterea mediilor conditionate de la media generala, .

Corespunzator celor trei tipuri de abateri la nivelul fiecarei unitati observate se poate scrie:

,

Ceea ce inseamna ca abaterea totala este egala cu suma dintre abaterea fata de media grupei de la media generala.

Ce semnificatie au aceste abateri?

, masoara variatia valorilor individuale in jurul mediei generale. Daca valorile empirice inregistrate (yj) sunt rezultatul inflentei tuturor factorilor (esential si neesential) iar media presupune ca toti factorii sunt constanti, inseamna ca aceasta diferenta exprima variatia valorilor individuale in jurul mediei sub actiunea tuturor factorilor: factorul X considerat esential si toti ceilalti factori, considerati neesentiali.

, masoara variatia valorilor individuale de la media de grupa, deci exprima variatia in interiorul fiecarei grupe contruite dupa factorul X. cum factorul X are aceiasi valoare in cazul tuturor unitatilor din aceiasi grupa, inseamna ca aceasta diferenta se datoreaza actiunii cauzelor din interiorul grupei, deci factorilor neesentiali.

, evidentiaza influenta factorului esential, de grupare (X) asupra variatiei valorilor in jurul mediei generale.

Pe baza acestor abateri se pot calcula urmatoarele dispersii:

Dispersia generala (sau ) se determina pentru repartitia marginala construita pentru Y, si ca urmare, nu tine seama de grupele construite dupa factorul X.


(4.52)


Prin se masoara variatia variabilei dependente, efect sub influenta tuturor factorilor.

Dispersia de grupa sau dispersia conditionata masoara variatia la nivelul fiecarei grupe construite dupa factorul X. Numarul dispersiilor de grupa este egal cu numarul grupelor stabilite dupa caracteristica considerata cauza (i = 1, 2 r).


(4.53)


Fiecare disperie de grupa masoara variatia valorilor variabilei dependente sub influenta factorilor din interiorul grupei respective, care sunt priviti ca factori neesentiali in raport cu factorul X.

Pentru a masura actiunea tuturor factorilor neesentiali din toate grupele se calculeaza media dispersiilor de grupa.

Media dispersiilor de grupa este o medie aritmetica a dispersiilor de grupa:


(4.54)


Daca toate grupele sunt de acelasi volum (n1 = n2 = ni = ), atunci toate dispersiile de grupa intra in calculul mediei cu aceiasi importanta , atunci se aplica media aritmetica simpla:


(4.55)


Dispersia dintre grupe sau dispersia explicata masoara variatia mediilor de grupa de la media generala si exprima variatia datorata actiunii factorilor de grupare, deci X.


(4.56)


Pornind de la factorii de influenta care determina variatia valorilor variabilei Y, intre dispersiile mentionate exista relatia:


(4.57)


denumita regula de adunare a dispersiilor.

Pe baza acestei relatii se calculeaza doi indicatori derivati (marimi relative de structura) care exprima ponderea variatiei actiunii fiecarui grup de factori (esentiali si neesentiali) in variatia totala si anume:

Coeficientul de determinatie (R2y/x) exprima ce cota parte din variatia totala se datoreaza actiunii factorului considerat esential.


sau (4.58)


Coeficientul de nedeterminatie (K2y/x) masoara cat la suta din variatia totala se datoreaza influentei factorilor neinregistrati, considerati neesentiali sau reziduali.

Exemplu

Variatia cifrei de afaceri prezentata in tabelul nr. 4.9 se datoreaza actiunii unui mare numar de factori: numarul salariatilor; domeniul de activitate; preturile practicate; calitatea produselor etc.

Presupunem ca un factor esential de influenta este numarul de salariati (X). In acest caz se grupeaza mai intai agentii economici dupa acest factor iar grupele obtinute se defalca dupa cifra de afaceri (Y). Procedand astfel se obtine o repartitie bidimensionala (vezi tabelul nr. 4.12)

Gruparea agentilor economici dupa numarul de salariati si dupa cifra de afaceri.


Tabelul nr. 4.12

Grupe dupa

numarul de

salariati (pers.)

Grupe dupa cifra de afaceri (mld. lei)


Total

Sub












40 si

peste




















Total










Calculul mediilor pentru variabila  cifra de afaceri .

- media generala () :

miliarde lei


- mediile de grupa : ()

respectiv si

miliarde lei

miliarde lei

Media generala () poate fi calculata pe baza mediilor partiale () astfel:

miliarde lei

Calculul dispersiilor pentru variabila Y:

- dispersia generala :


- dispersiile de grupa :

- media dispersiilor de grupa ():


- dispersia dintre grupe sau dispersia explicata

Regula de adunare a dispersiilor:

Coeficientul de determinatie (R2y/x) este:

, ceea ce inseamna ca 39% din variatia cifrei de afaceri a celor 800 de agenti economici se datoreaza deosebirilor privind numarul de salariati. Cota parte de 60,99% din variatia cifrei de afaceri se poate explica prin actiunea tuturor celorlalti factori considerati neesentiali, reziduali.


Media si dispersia unei variabile alternative


Variabilele statistice se defalca dupa numarul variantelor / valorilor pe care le pot lua in variabile nealternative si variabile alternative. Variabila alternativa, cazul particular al unei caracteristici nominative sau atributive, la care se inregistreaza numai doua stari, care se exclud reciproc. De exemplu, un student poate fi dupa sustinerea unui examen in situatia de promovat sau nepromovat; o piesa poate corespunde standardului de calitate sau nu; sexul; mediul etc.

Cele doua variante care se inregistreaza in cazul unei variabile alternative sunt: DA si NU. Exprimarea cantitativa a celor doua variante presupune inlocuirea variantei DA cu 1 si a variantei NU cu 0.

Notatiile uzuale folosite in cazul calcului mediei si a dispersiei sunt prezentate in tabelul nr. 4.13.



Tabelul 4.13

Variantele

caracteristicii

Valoarea

atribuita

Frecventa

absoluta

relativa

x1 (DA)


M

x2 (NU)


N M

Total


N

p + q =1


Media variabilei alternative:


(4.59)


Deci, media unei caracteristici alternative este ponderea unitatilor care poseda varianta care intereseaza (D) in totalul unitatilor, deci este o frecventa relativa.

Dispersia unei astfel de variabile se deduce din relatia de baza de calcul a dispersiei:


(4.60)


Prin urmare, dispersia caracteristicii alternative este produsul dintre ponderea celor doua variante in colectivitatea studiata.



Asimetria


Descrierea unei repartitii statistice unidimensionale se realizeaza, de regula, prin intermediul mediei si al dispersiei. Sunt insa situatii cand unii utilizatori reclama informatii privind forma repartitiei, ceea ce inseamna un indicator prin care se caracterizeaza forma variatiei valorilor in jurul mediei. Seriile de distributie pot fi simetrice si asimetrice sau oblice. Se spune ca o distributie este simetrica daca frecventele de aparitie (absolute sau relative) scad proportional si simetric in raport cu frecventa cea mai mare, care corespunde valorii centrale. Intr-o distributie simetrica, cei trei indicatori ai tendintei centrale sunt egali (fig. nr. 4.5).


















O distributie nonsimetrica poate fi asimetrica de stanga (fig. nr. 4.6) sau de dreapta (fig. nr. 4.7).

Asimetria de stanga (pozitiva) sau de dreapta (negativ) se judeca in functie de pozitia modului (Mo) fata de medie pe axa absciselor.

Fig. 4.5 4.7 ofera o imagine vizuala privind forma repartitiei, dar nu ofera o masura privind amploarea abaterii de la simetrie.

O modalitate simpla de descriere / masurare a formei variatiei consta in calcularea diferentei intre medie si mod.


(4.61)


Daca: serie simetrica ;

asimetrie de stanga (pozitiva) ;

asimetrie de dreapta (negativa).

Rezultatul aplicarii relatiei [4.61] se exprima in unitatile de masura ale variabilei (mil. lei; Kg etc) si ca atare aceasta relatie nu poate fi folosita pentru comparatii intre serii construite pentru variabile diferite.



Pentru masurarea aimetriei se foloseste frecvent coeficientul de asimetrie propus de Karl Pearson:


(4.62)


Acest coeficient poate lua valori cuprinse intre 1 si + 1. Cu cat Cas este mai mic cu atat distributia tinde mai mult spre una simetrica ;

Se considera ca o distributie este moderat asimetrica, daca . Distributia agentilor economici dupa cifra de afaceri (vezi tabelul nr. 4.6) este moderat asimetrica.

Daca seria de repartitie este bi sau multimodala (frecventa cea mai mare apare de doua sau de mai multe ori) care tinde spre normalitate, se recomanda calcularea coeficientului de asimetrie (C`as).


(4.63)


Coeficientul de asimetrie (C`as) ia valori cuprinse intre ( 3; 3). Un coeficient de asimetrie situat intre 0,3 si + 0,3 indica o distributie moderat asimetrica. Daca C`as depaseste 0,3, asimetria este puternica, ceea ce sugereaza ca indicatorii tendintei centrale tind sa fie nereprezentativi.



Cuvinte cheie


* Serie unidimensionala / multidimensionala.

* Serie de repartitie = serie de distributie = serie de frecvente.

* Serie de atribute = serie nominativa.

* Omogenitatea termenilor.

* Variabilitatea termenilor.

* Independenta termenilor.

* Concentrarea sau dispersarea termenilor.

* Frecvente absolute, relative, cumulate.

* Densitatea de frecventa.

* Indicatorii tendintei centrale: medie, mediana, mod.

* Indicatorii variatiei.

* Amplitudinea variatiei.


* Cuartele.

* Abaterea medie liniara.

* Dispersia.

* Abatere medie patratica = abaterea standard.

* Coeficient de variatie.

* Regula de adunare a dispersiilor.

* Medie conditionata = medie de grupa.

* Dispersie conditionata = dispersie de grupa.

* Dispersie dintre grupe = dispersie explicata.

* Media dispersiilor de grupa = dispersia reziduala.

* Coeficient de determinatie.

* Media variabilei alternative.

* Dispersia variabilei alternative.

* Asimetrie de stanga / dreapta; pozitiva / negativa.

* Coeficient de asimetrie.



Intrebari de control


1. Care este deosebirea dintre o serie de variatie si o serie de atribute?

2. Ce reprezinta densitatile de frecvente?

3. Ce exprima media aritmetica?

4. Cand media unei serii este reprezentativa?

5. Cand se verifica egalitatea: ?

6. Cand se aplica media geometrica?

7. De ce este necesar sa se studieze variatia valorilor in jurul mediei?

8. Care este semnificatia coeficientului de variatie?

9. In ce consta regula de adunare a dispersiilor?

10. Care este semnificatia dispersiei dintre grupe?

11. Ce masoara media dispersiilor de grupa?

12. Cand se aplica si cum se calculeaza media si dispersia unei variabile alternative?

13. Prin ce se caracterizeaza o distributie simetrica?

14. Cum se interpreteaza coeficientul de asimetrie?



Bibliografie


1. Bij E., Lilea E., Wagner P., Petcu N., Vatui M., Statistica, Editura Didactica si Pedagogica, Bucuresti, 1999, p. 159203.

2. JabaE., Statistica, Editura Economica, Bucuresti, 1998, p. 103176.

3. Karka M., Begu St., Tusa E., Bazele statisticii pentru economisti, Editura Tribuna Economica, 2002, p. 70102.

4. Schwarze J., Grundlagen der Statistik I, Verlag Neue Wirtschafts Briefe, GmbH, Berlin, 1994, p.58106.

5. Voineagu V., Lelea E., Gaschin Z., Vatui M., Boldeanu D., Statistica economica. Teorie si aplicatii, Editura Tribuna Economica, Bucuresti, 2002, p. 84150.








Politica de confidentialitate



Copyright © 2010- 2021 : Stiucum - Toate Drepturile rezervate.
Reproducerea partiala sau integrala a materialelor de pe acest site este interzisa.

Termeni si conditii - Confidentialitatea datelor - Contact