StiuCum - home - informatii financiare, management economic - ghid finanaciar, contabilitatea firmei
Solutii la indemana pentru succesul afacerii tale - Iti merge bine compania?
 
Management strategic - managementul carierei Solutii de marketing Oferte economice, piata economica Piete financiare - teorii financiare Drept si legislatie Contabilitate PFA , de gestiune Glosar de termeni economici, financiari, juridici


Castiga timp, fa bani - si creste spre succes
marketing MARKETING

Marketingul reprezinta "stiinta si arta de a convinge clientii sa cumpere" Philip Kotler definea marketingul ca "un proces social si managerial prin care indivizi sau grupuri de indivizi obtin ceea ce le este necesar si doresc prin crearea, oferirea si schimbul de produse si servicii avand o anumita valoare". Simplist, marketingul reprezinta "arta si stiinta de a vinde".

StiuCum Home » MARKETING » cercetarea de marketing

Analiza datelor in cercetarile de marketing

Analiza datelor in cercetarile de marketing




Activitati preliminare in analiza datelor


Dupa culegerea datelor prin intermediul chestionarelor si sistematizarea acestora, inainte ca acestea sa intre in procesul de prelucrare si analiza propriu-zisa au loc urmatoarele activitati:

a)determinarea bazei de calcul procentual



b)calculul erorilor

c)testarea semnificatiei procentajelor


a)determinarea bazei de calcul procentual

Este importanta pentru prelucrarile ulterioare ale datelor colectate cu ajutorul chestionarelor. Presupunem ca unui esantion de 500 de subiecti li s-a aplicat un chestionar cu patru intrebari inchise.


1.Inchiriati casete video? a)Da b)Nu (Daca nu, interviul nu mai are loc)

2.Vi se par tarifele de inchiriere ridicate a)Da b) Nu

3.Ce fel de inregistrari video inchiriati: a) filme, b)desene animate, c)spectacole, d) documentare, e)videoclipuri, f) competitii sportive, g) altele

4.Ce tipuri de filme inchiriati? a) de actiune, b)comedii, c)muzicale, d)SF, e) altele


Informatiile colectate din chestionare au fost sistematizate tabelar, astfel:

Intrebarea

Raspunsuri

Numar total

raspunsuri

respondenti


a)300, b)200




a)150, b)100




a)165,b)57,c)62,d)48,

e)120,f)35,g)23




a)124,b)75,c)38,d)150

e)62




Sa se stabileasca baza de calcul procentual care trebuie sa fie considerata pentru prelucrarea datelor cu ajutorul chestionarului.

Ca baza de calcul procentual se poate utiliza:

-numarul total de subiecti pe esantion

-numarul total de respondenti

Diferenta dintre cele doua o reprezinta:

- nonraspunsurile -apar in cazul persoanelor din esantion care nu au dorit sau nu au stiut sa raspunda la o anumita intrebare

-persoanele neimplicate -subiecti care fac parte din esantion dar care nu sunt vizati de o anumita intrebare, respectiv care au fost separati de restul esantionului printr-o intrebare filtru.


La intrebarea 2, marimea esantionului nu este relevanta, deoarece aceasta intrebare ii priveste doar pe cei care inchiriaza casete video (300 de persoane), numarul persoanelor neimplicate fiind de 200.

Da                     150 50 %

Nu                     100 33,33 %

Non raspunsuri   50 16,7%

Subpopulatia 300 100 %

In acest caz, baza de calcul este numarul subiectilor care inchiriaza casete video.

Se poate lua ca baza de calcul si numarul respondentilor, 250.

Da                   150 60%

Nu                   100 40 %

Respondenti     250 100 %


La intrebarea 3, baza de calcul ar putea fi stabilita astfel:

Numarul raspunsurilor este mai mare decat al subiectilor din esantion.Se pot utiliza ambii indicatori, dar semnificatia rezultatelor este diferita.

Inregistrari video

Numar de raspunsuri

Ponderea in numarul total

de raspunsuri


de respondenti(%)

a.filme artistice




b. desene animate




c.spectacole




d.documentare




e.clipuri




f.competitii sportive




g.altele




Total

raspunsuri

respondenti












b)calculul erorilor

Eroarea datorata nonraspunsurilor se poate calcula in mai multe moduri.

EXEMPLU

Intr-un chestionar referitor la intentiile de efectuare a unei vacante in strainatate s-a pus intrebarea Intentionati sa efectuati o vacanta in strainatate in urmatoarele 6 luni ?

Da

Nu

Nu stiu

Raspunsurile pe un esantion de 1200 sunt:

Variante de raspuns

a

b

c

Numar de raspunsuri





Aparitia nonraspunsurilor poate fi determinata de urmatoarele cauze:

1.imposibilitatea intervievarii subiectilor inclusi pe lista de sondaj-nu au putut fi contactati, si-au schimbat domiciliul, se afla vacanta, sunt bolnavi etc

2.refuzul de a raspunde

3.abandon pe parcursul completarii chestionarului

4.imposibilitatea de a raspunde-intrebari neclare, subiect necunoscut, nefamiliar, nu-si amintesc un aspect solicitat etc.



Se calculeaza ponderile nonraspunsurilor:


ponderea celor care nu vor efectua o vacanta in strainatate


ponderea celor care s-ar putea sa plece intr-o vacanta in strainatate(cei care nu au raspuns s-ar putea sa plece totusi in strainatate)



ponderea celor care vor calatori probabil in strainatate

(indecisii-300, se impart in mod egal intre cele doua alternative de raspuns)



ponderea celor care s-ar putea sa efectueze 636g67g o calatorie in strainatate in urmatoarele 6 luni, in ipoteza ca persoanele indecise au aceeasi atitudine ca si respondentii.



Eroarea totala este produsul dintre eroarea de esantionare, eroarea datorata nonraspunsurilor si eroarea de masurare.

Eroarea totala se calculeaza cu metoda ERA(Error Ratio Analysis) a lui Brown:

unde:

este eroarea totala

este eroarea de esantionare

este eroarea datorata nonraspunsurilor

este eroarea de masurare


EXEMPLU

Se considera un sondaj in care au fost determinati indicatorii:

-proportia reala a componentelor populatiei statistice care au o anumita caracteristica, t=0,7

-proportia observata, r=0,8

-proportia reala in esantionul prevazut p=0,6

-proportia reala in esantionul intevievat a=0,9


Sa se calculeze eroarea totala, eroarea datorata nonraspunsurilor, eroarea de esantionare, eroarea de masurare.


Eroarea totala:

Eroarea de esantionare:  

Eroarea datorata nonraspunsurilor:

Eroarea de masurare:


c)testarea semnificatiei procentajelor

In cazul unei esantionari probabilistice simple si a unei intrebari cu raspuns unic, testarea semnificatiei diferentei dintre doua procentaje si se realizeaza cu formula:

unde n este marimea esantionului si n> 30.

Regula de decizie este urmatoarea:

daca > 1,96 diferenta este semnificativa pentru pragul de probabilitate de 95%

daca <1,96, diferenta nu este semnificativa la pragul de probabilitate de 95%


In cazul unei esantionari probabiliste simple si al unei intrebari cu raspunsuri multiple, testarea semnificatiei diferentei dintre doua procentaje si se realizeaza cu formula:

n este marimea esantionului, iar este ponderea subiectilor care au mentionat simultan doua criterii.



Analiza univariata a datelor


Analiza datelor reprezinta procesul de aplicare a tehnicilor statistico-matematice, in scopul extragerii din baza de date a informatiilor necesare procesului decizional de marketing.

Metodele de analiza se pot grupa dupa mai multe criterii si anume:

   tipul de scala utilizat(nominala, ordinala, interval sau proportionala)

   numarul esantioanelor cercetare(unul, doua sau mai multe)

   natura relatiei dintre esantioane(independente sau dependente)

   numarul variabilelor considerate

Obiectivele urmarite in analiza datelor sunt de obicei:

   determinarea tendintei centrale a variabilelor

   caracterizarea variatiei si repartitiei acestora

   masurarea gradului de asociere dintre ele

   realizarea unor estimari si previziuni

   evaluarea diferentelor dintre variabile sau grupuri de variabile

   evidentierea legaturilor cauzale dintre ele


Determinarea tendintei centrale

Tendinta centrala se caracterizeaza diferit in functie de nivelul la care s-a realizat masurarea.

Tabel 4.1

Tipuri de scale

Indicatori ai tendintei centrale

Grupul modal(valoarea modala)

Mediana

Media aritmetica

Media geometrica

Nominala

x




Ordinala

x

x



Interval

x

x

x


Proportionala

x

x

x

x


Indicatorii tendintei centrale sunt:

          valoarea modala

          grupul modal

          mediana

          media aritmetica

          media geometrica


Daca datele sunt negrupate, valoarea modala este cea care prezinta cea mai mare frecventa de aparitie.

Exemplu:

Intr-o cercetare directa a preferintelor populatiei unui oras pentru turismul de weekend, esantionul este alcatuit din 350 de persoane, care practica aceasta forma de turism, distribuite dupa statutul socio -profesional, dupa cum urmeaza:




Tabel 4.2

Categoria socio-profesionala

Numar persoane

Muncitori


Maistri-tehnicieni


Liber intreprinzatori


Functionari


Persoane cu studii superioare


Elevi-studenti


Casnice


Pensionari


Altii



Valoarea modala este 110.

In cazul distributiei de frecvente specifice datelor grupate, grupul modal este constituit din grupul care cuprinde cele mai multe componente comparativ cu celelalte grupuri.


Presupunem ca acelasi esantion se distribuie pe grupe de varsta:

Tabel 4.3.

Grupa de varsta(ani)

Numar de persoane

sub 14 ani














61 si peste



Grupul modal este reprezentat de grupul 19-24 de ani.


Mediana-reprezinta valoarea deasupra si dedesubtul careia se afla cate o jumatate din observatii.


Daca datele sunt negrupate si daca numarul observatiilor este fara sot, mediana este la mijloc.


EXEMPLU:

Numarul de portii dintr-un preparat culinar vandute in cinci restaurante

Tabel 4.4

Restaurantul

Numarul de portii

R1


R2


R3

110 mediana

R4


R5



Daca numarul observatii este cu sot, mediana se considera a fi la jumatate, intre cele doua valori centrale.

Exemplu:



Tabel 4.5


Restaurantul

Numarul de portii

R1


R2


R3


R4



Mediana este 90.

In cazul datelor grupate, mediana se calculeaza astfel:numarul total de observatii(frecvente) se

imparte la doi si astfel rezulta cate observatii trebuie sa fie deasupra si cate dedesubtul medianei; dupa aceasta se determina frecventele cumulate pentru a stabili in care grupa se situeaza mediana; in final se calculeaza valoarea medianei.

In cazul datelor din Tabelul 4.3., totalul frecventelor este 350, rezulta ca 175 de observatii trebuie sa se afle deasupra medianei si 175 dedesubtul ei.Observam ca grupei 19-24 ani frecventele cumulate care ii corespund sunt 220-valoarea care este cea mai apropriata de 175, decat ar fi frecventele cumulate corespunzatoare grupei 14-18 ani.Deci valoarea medianei se situeaza undeva in cadrul grupei de de varsta 19-24 ani.Marimea intervalului 19-24 ani este de 5, aceasta se pondereaza cu numarul de observatii aditionale necesare(120/126), iar valoarea se adauga la 19.Rezulta ca mediana este situata la categoria de varsta de 23,75 ani, deci aproape 24 de ani.


Media aritmetica este un indicator al tendintei centrale in cazul scalelor interval si proportionale(vezi Tabel 4.1).

Media aritmetica, a unei variabile x despre care se cunosc n observatii intr-un esantion investigat, se calculeaza dupa formula:



Daca vanzarile unui supermarket au fost pe parcursul unei saptamani de: 300 u.m. (luni), 530 u.m.(marti), 340 u.m.(miercuri), 320 u.m.(joi), 510 (u.m.)vineri, 710 u.m.(sambata), media vanzarilor zilnice, pe saptamana in cauza este:


u.m.


Media aritmetica ponderata se calculeaza cu formula:


unde reprezinta valoarea variabilei x corespunzatoare frecventei .




EXEMPLU.

In cazul unei cercetari a imaginii unui hotel de catre un grup de turist, amplasamentul a fost apreciat de catre membrii esantionuluii pe o diferentiala semantica cu 5 trepte astfel:


f.favorabil 70 45 35 30 20 f.nefavorabil

Pentru evaluarea sintetica a opiniei turistilor, se atribuie fiecarei trepte o nota(care reflecta aprecierea lor): 5=f.favorabil, 1=f.nefavorabil.

Aprecierea medie:


Daca datele sunt grupate, pentru calcul mediei aritmetice se foloseste formula:

unde este frecventa grupului i

este punctul de mijloc al intervalului unui grup

n este numarul de observatii cuprinse in esantion


EXEMPLU

Calculul mediei vanzarilor in cazul unui numar de 50 de magazine, grupate dupa vanzarile realizate.

Tabel 4.6

Vanzari

(u.m.)

Numar de unitati

()

Mijlocul intervalului ()





















TOTAL







Media geometrica este un indicator al tendintei centrale in cazul scalelor proportionale(vezi Tabel 4.1.)

Formule de calcul:




Modalitati de caracterizare a variatiei si repartitia variabilelor


Caraterizarea variatiei se face diferentiat in functie de nivelul de masurare realizat printr-un tip de scala sau altul


Indicatori ai variatiei

Tipuri de scale

Nominale

Ordinale

Interval

Proportionale

Distributia de frecvente

x

x

x

x

Procente

x

x

x

x

Decile


x

x

x

Centile


x

x

x

Cuartile


x

x

x

Amplitudinea variatiei



x

x

Abaterea medie



x

x

Varianta



x

x

Abaterea standard



x

x


Cuartilele -reprezinta doua valori stabilite ca o patrime din observatii sa se afle sub prima cuartila(numita cuartila inferioara) si o patrime din observatii se afle deasupra celei de-a doua cuartile(cuartila superioara).Celelalte doua patrimi din observatii se afla intre valorile celor doua cuartile si mediana.

Decilele -reprezinta impartirea numarului observatiilor la 10.

Centilele-reprezinta impartirea numarului observatiilor la 100.

Amplitudinea absoluta a variatiei-este diferenta dintre observatia cu valoarea cea mai mare si cea cu valoarea cea mai mica.

Amplitudinea relativa a variatiei este raportul dintre amplitudinea absoluta si medie.

Abaterea medie-este media aritmetia a valorilor absolute ale abaterilor termenilor esantionului de la media lor.

Varianta-este media aritmetica a patratelor abaterilor individuale ale termenilor esantionului de la medie.

Abaterea standard este radical cu semnul plus din varianta.


Analiza bivariata ( analiza gradului de asociere a doua variabile)


Presupune masurarea gradului de asociere a doua variabile, sub aspectul:

- directiei(naturii),

- intensitatii;

- semnificatiei statistice.


Masurarea asocierii dintre variabile nominale


Se poate realiza cu ajutorul:

-coeficientului de corelatie phi

-coeficientul de contigenta


Procesul de masurare a gradului de asociere in cazul acestor variabile incepe prin construirea de tabele de contigenta.

Un asemenea tabel contine distributia de frecvente, considerata simultan pentru doua sau mai multe variabile caracteristice.


EXEMPLU

Dorim sa aflam daca preferintele barbatilor pentru un anumit tip de fastfood, in care fumatul este interzis, difera semnificativ de preferintele femeilor.

Cu datele culese de la un esantion de 500 de persoane, din care 300 barbati si 200 femei, se poate alcatui tabelul de contingenta:


Tabel 4.8

Sexul

Prefera unitatea

Nu prefera unitatea

Total

Barbati




Femei




TOTAL





Calculam procentual preferintele membrilor esantionului.


Tabel 4.9.

Sexul

Prefera unitatea(%)

Nu prefera unitatea


Total


Barbati




Femei





Probabilitatea ca un barbat sa prefere fastfoodul este de 65,33%, iar ca o femeie sa-l prefere este de 71 %.

Gradul de asociere dintre cele doua variabile: sex si preferinta(variabile dihotomice) se poate determina cu ajutorul coeficientului de corelatie phi. El se calculeaza cu formula:



unde a,b,c,d, reprezinta frecventele tabelului de contigenta de tipul 2 x 2, dupa cum urmeaza:


a

b

c

d

In cazul nostru:


a=196

b=104

c=58

d=142


deci


Coeficientul de corelatie poate lua valori intre -1,0 si +1,0.Cele doua extreme indica o asociere perfecta intre variabile, iar valoarea zero indica lipsa corelatiei.

Pentru a determina in ce proportie preferintele pentru fastfoodul investigat sunt explicate de variabila sex coeficientul se ridica la patrat, pentru a obtine coeficientul de determinare, care indica proportia variatiei explicate a unei din variabile de catre cealalta variabila.

Aceasta inseamna ca 12,67 % din variatia preferintelor este explicata de variabila sex.

Concluzia este ca intensitatea asocierii intre cele doua variabile este foarte slaba.

Semnul coeficientului de corelatie caracterizeaza directia asocierii.Semnul + indica o corelatie pozitiva, in sensul ca exista o asociere intre sexul masculin si preferinta pentru fastfoodul luat in discutie.


Pentru testarea gradului de semnificatie a asocierii dintre opiniile subiectilor din cele doua esantioane independente(barbati si femei) si preferinta pentru fastfood, se utilizeaza testul neparametric .Prin acest test se urmareste sa se stabileasca daca preferintele barbatilor difera semnificativ fata de ale femeilor.

Realizarea testului are ca punct de plecare ipoteza nula -faptul ca valoarea coeficientului de corelatie nu difera semnificativ fata de zero, adica preferintele barbatilor nu difera semnificativ de ale femeilor.


ipoteza nula H 0:

ipoteza alternativa H1:

Se determina cu formula:


unde:

r si k reprezinta numarul de randuri si respectiv de coloane ale tabelului de contigenta


frecventele randului i si ale coloanei j care rezulta din observare

frecventele randului i si ale coloanei j care se asteapta sa rezulte conform ipotezei nule; ele se obtin prin inmultirea frecventei marginale a randului i cu cea a coloanei j si impartirea produsului la numarul total al cazurilor(marimea esantionului)


Valorile rezultate prin utilizarea formule de mai sus au o repartitie de esantionare care poate fi aproximata de o repartitie cu (r-1)(k-1) grade de libertate.Daca valoarea calculata a lui este egala sau mai mica decat valoarea teoretica corespunzatoare unui numar de grade de libertate si unui anumit grad de semnificatie, atunci ipoteza nula se accepta.


In exemplul nostru:

Valoarea teoretica pentru (2-1)(2-1)=1 grad de libertate este de .Deoarece se poate afirma ca la un nivel de semnificatie de 0,05 ipoteza nula nu se accepta(se accepta ipoteza H1) adica difera semnificativ de zero, deci preferintele barbatilor difera semnificativ de cele ale femeilor.

Ori de cate ori tabelul de contingenta este de tipul 2 x 2, pentru determinarea valorii lui se poate utiliza si urmatoarea formula :



unde a, b, c, d au aceeasi semnificatie, iar N=a+b+c+d.

Deoarece, asa cum este cazul si in acest exemplu, testul care este conceput pentru repartitii continue se aplica unor date in forma discreta, pentru o mai mare exactitate, apare necesitatea unei corectii pentru continuitate, cunoscuta sub denumirea de corectia lui Yates.

In aceste conditii, valoarea calculata a lui se face cu formula:


In cazul nostru:



Intrucat concluziile raman aceleasi cu cele stabilite pentru aplicarea primei formule.




Pentru masurarea gradului de asociere intre variabilele unui tabel de contigenta cu orice numar de randuri sau coloane se utilizeaza coeficientul de contingenta C, care se calculeaza dupa formula:

unde: este valoarea calculata a lui

N-este numarul subiectilor din esantion

Daca numarul de coloane ale tabelului de contigenta este egal cu numarul de linii, atunci valoarea coeficientului C este pozitiva si variaza intre zero si , unde c este numarul de coloane ale tabelului de contingenta.


In cazul cercetarilor de marketing se uilizeaza scheme de proiectare de tip "inainte-dupa", in care subiectii din esantion sunt supusi la doua masurari-.inainte si dupa aplicarea factorului experimental.

De exemplu, daca factorul experimental este o actiune promotionala, este mare probabilitatea de a se modifica opinia subiectilor, masurata dupa aplicarea acestuia.

In aceste situatii, pentru testarea semnificatiei schimbarilor de opinie de la o masurare la alta, se foloseste testul McNemar.



Tabelul de contigenta in acest caz este:

Masurare "dupa"

Imagine nefavorabila

Imagine favorabila

Imagine favorabila

a

b

Imagine nefavorabila

c

d


unde a, b, c,d reprezinta frecventele de aparitie a celor patru cazuri posibile in urma aplicarii factorului experimental.

Ceea ce intereseaza in acest exemplu sunt doar frecventele inregistrate in celulele a si d, suma lor reprezentand totalul persoanelor care si-au modificat imaginea intre prima si a doua masurare.

Conform ipotezei nule se asteapta ca jumatate din modificari si anume sa fie intr-o directie (ele vor aparea in celula a) si jumatate sa fie in cealalta directie(ele vor apare in celula d).


Testul McNemar este o adaptare a testului la specificul unui tabel de contigenta in care sunt considerate doar frecventele inregistrate in cele doua celule.

se determina cu formula:


unde frecventele care rezulta din observare

frecventele care se asteapta sa rezulte conform ipotezei nule, respectiv

Dupa realizarea gruparii si simplificari, se ajunge la forma finala :



Daca aplicam corectia lui Yates, atunci:


Daca valoarea lui este egala sau mai mare decat valoarea teoretica, corespunzatoare unui grad de libertate si a unui anumit grad de semnificatie, ipoteza nula nu se accepta, deci factorul experimental a avut o influenta semnificativa asupra imaginii subiectilor care compun esantionul.

Presupunem ca avem urmatorul tabel de contigenta, in cazul unui esantion de 250 de persoane.


Masurare "dupa"

Imagine nefavorabila

Imagine favorabila

Imagine favorabila



Imagine nefavorabila





Rezulta ca :


Valoarea teoretica pentru un grad de libertate este de Deoarece calculat are valoare mai mare decat teoretic, la un grad de semnificatie de 0,025, ipoteza nula nu se accepta, adica actiunea promotionala a determinat schimbari semnificative ale produsului in randul turistilor.



Masurarea asocierii variabilelor ordinale


Masurarea gradului de asociere intre variabile masurate cu ajutorul scalelor ordinale este mai plina de semnificatii, deoarece, inafara relatiei de echivalenta presupusa de o scala nominala, tipul de scala ordinala permite si ordonarea alternativelor cercetate pentru fiecare variabila cercetata.

Variabilele ordinale pot varia concomitent intr-o anumita directie, care poate fi pozitiva(variatia se realizeaza in acelasi sens) sau negativa(variatia se realizeaza in sensuri contrare).


Exista doua modalitati de cercetare a relatiilor de asociere:

a)relatiile dintre rangurile alternativelor considerate pentru cele doua variabile

b)relatiile dintre variabilele de tip ordinal


a) relatiile dintre rangurile alternativelor variabilelor

Se utilizeaza coeficientul Spearman de corelatie a rangurilor, , care are formula de calcul:


diferenta intre cele doua ranguri, detinute de variabila i

n-marimea esantionului


EXEMPLU

Consideram 10 firme de turism, A,B,C,D,E,F,G,H,I,J, care ocupa locurile 1,2,3,4,5,6,7,8,9,10 in ceea ce priveste profitabilitatea la sfarsitul anului si locurile 2,4,1,5,3,7,6,9,8,10 in ceea ce priveste gradul de ocupare.

Pentru masurarea gradului de asociere dintre rangurile detinute de cele 10 firme in privinta profitabilitatii, pe de o parte, si gradului de ocupare, pe de alta, se va folosi coeficientul de corelatie a rangurilor Spearman .






Tabelul de date:

Firma

Rangul detinut in ceea ce priveste

Profitabilitatea

Gradul de ocupare

A





B





C





D





E





F





G





H





I





L





TOTAL






Rezulta ca :



Stiind ca poate lua valori intre -1(pentru o corelatie inversa perfecta) si +1 ( pentru o corelatie directa perfecta, iar zero pentru lipsa totala de asociere, in cazul considerat intre profitabilitate si gradul de ocupare exista o corelatie directa si foarte intensa.


Pentru a testa gradul de semnificatie statistica a coeficientului de corelatie se formuleaza ipoteza nula si ipoteza alternativa:


ipoteza nula: H0

ipoteza alternativa H1:


Pentru un nivel de incredere de 0,99 valoarea coeficientului Z este 2,58.

Pentru determinarea valorii calculate a lui Z se foloseste formula:


Stiind ca daca se accepta ipoteza nula, iar in caz contrar se accepta ipoteza alternativa, concluzia este ca se accepta H1, adica valoarea coeficientului de corelatie a rangurilor in populatia cercetata difera in mod semnificativ de zero.


b)relatiile dintre variabilele ordinale

Atunci cand se cerceteaza relatiile dintre variabilele ordinale si cand mai multe alternative sunt la egalitate, gradul de asociere se masoara prin coeficientul lui Goodman si a lui Kruskal, .

Acesta se calculeaza cu formula:

unde P si Q sunt valori calculate, ca in exemplul de mai jos.



EXEMPLU

Se organizeaza degustarea unui preparat culinar dietetic intr-un esantion de 301 de persoane, culegandu-se informatii cu privire la intentia de a le cumpara in viitor.Intentiile sunt prezentate pe cinci niveluri, de la categoria 1- sigur va cumpara, la categoria 5 -sigur nu va cumpara.

Prezentarea datelor culese:

Categorii de varsta

Intentii de cumparare






sub 20 de ani

20-40 de ani

40-50 de ani

peste 50 de ani
























Se doreste a se afla gradul de asociere dintre variabilele "intentii de cumparare" si "varsta".


Pentru calculul lui P se procedeaza in felul urmator: se porneste prin a inmulti frecventa din partea stanga sus cu suma frecventelor aflate mai jos cu un rind si la dreapta, astfel:


Apoi pe coloana a doua, a treia si a patra.




Mai departe se considera frecventele situate pe randurile doi si trei:

+15+10+5+25+20+20+1)=960

10(15+10+5+20+5+1 560

15(10+5+5+1 315

20(5+1 120


20(25+20+5+1 1020

15(20+5+1 390

15(5+1 90

10(1 10


Insumand toate produsele obtinute se obtine P=6815


Pentru calcularea lui Q se porneste din stanga sus si se procedeaza similar.

linia 1

+10+15+20+20+15+15+10+35+25+20+5)=5000

20(10+10+15+20+15+15+35+25+20 3300

15(10+10+20+15+35+25 1725

10(10+20+35 650

linia 2

20(10+15+15+20+35+25+20+5 2900

20(15+15+20+35+25+20 2600

15(20+15+35+25 1425

10(20+35 550

linia 3

5(5+20+25+35 425

10(20+25+35 800

15(25+35 900

15(35 525

Q=20800




Cunoscand ca poate lua valori in intervalul -1 si +1, in acest caz, intentiile de cumparare ale produsului culinar testat si varsta exista o corelatie inversa destul de intensa.


OBSERVATIE

Avand determinate sumele P si Q, se poate calcula si coeficientul de corelatie a rangurilor a lui Kendall, cu formula:

in care S=P+Q, iar n este marimea esantionului.



Corelatia dintre variabilele metrice


In cazul scalelor metrice(de tip interval sau proprotionale) este posibila masurarea distantelor dintre alternative.Astfel, pentru masurarea gradului de asociere a variabilelor masurate pe scale metrice se utilizeaza coeficientul de corelatie a lui Pearson, r.



unde X si Y sunt variabilele masurate cu ajutorul scalelor metrice.

EXEMPLU.

Se doreste stabilirea corelatie care exista intre modificarea venitului national in ultimii 6 ani intr-o tara oarecare si circulatia turistica interna din tara respectiva-exprimata prin cheltuielile pentru turism ale populatiei.

In tabel sunt prezentati indicii cu baza fixa ai celor doua variabile considerate in cei 6 ani si calculele necesare pentru determinarea lui r.




Anul

Venitul national X

Cheltuieli pentru turism Y

XY








































deci valoarea lui r este :


Ridicam la patrat: si obtinem coeficientul de determinare, care indica proportia variatia explicate a uneia din variabile(97%) de catre cealalta variabila.

Coeficientul r poate lua valori intre -1 si

In cazul considerat, cele doua variabile sunt strans corelate.

Pentru a testa gradul de semnificatie, se formuleaza:

ipoteza nula H0: r

ipoteza alternativa H1:

Din tabele, pentru un nivel de incredere de 0,99, valoarea coeficientului Z este de 2,58.


Se calculeaza .



Intrucat nu se accepta ipoteza nula, adica valoarea coeficientului de corelatie difera in mod semnificativ de zero.









Politica de confidentialitate



Copyright © 2010- 2024 : Stiucum - Toate Drepturile rezervate.
Reproducerea partiala sau integrala a materialelor de pe acest site este interzisa.

Termeni si conditii - Confidentialitatea datelor - Contact