StiuCum - home - informatii financiare, management economic - ghid finanaciar, contabilitatea firmei
Solutii la indemana pentru succesul afacerii tale - Iti merge bine compania?
 
Management strategic - managementul carierei Solutii de marketing Oferte economice, piata economica Piete financiare - teorii financiare Drept si legislatie Contabilitate PFA , de gestiune Glosar de termeni economici, financiari, juridici


Solutii reale pentru planuri de succes
MARKETING

Marketingul reprezinta "stiinta si arta de a convinge clientii sa cumpere" Philip Kotler definea marketingul ca "un proces social si managerial prin care indivizi sau grupuri de indivizi obtin ceea ce le este necesar si doresc prin crearea, oferirea si schimbul de produse si servicii avand o anumita valoare". Simplist, marketingul reprezinta "arta si stiinta de a vinde".

StiuCum Home » MARKETING » cercetarea de marketing
Trimite articolul prin email Trimite articolul la prietenii tai din lista ta de yahoo messenger Publica referat pe tweeter Trimite articolul prin facebook

Analiza datelor de marketing



ANALIZA DATELOR DE MARKETING


Criteriile alegerii metodelor de analiza a datelor de marketing


Dupa obtinerea si pregatirea datelor primare urmeaza procesul de analiza a acestora.

Analiza datelor de marketing este un proces complex ce presupune parcurgerea unor etape succesive de aprofundare a cercetarii, care necesita utilizarea unui instrumentar stiintific adecvat.




Alegerea corecta a metodelor de analiza a datelor impune luarea in considerare, simultan, a trei aspecte, si anume:

a.      a numarului de variabile care trebuie analizate simultan: atunci cand se are in vedere o singura variabila vor fi utilizate metode specifice analizei univariate, cand sunt doua variabile se va face apel la metodele analizei bivariate, iar atunci cand sunt mai multe variabile vor fi utilizate metodele analizei multivariate;

b.     a ceea ce se doreste ca tip de analiza, adica fie o analiza la nivelul esantionului avut in vedere, fie o caracterizare a populatiei care a facut obiectul cercetarii. In prima situatie se va realiza o descriere a esantionului prin intermediul statisticii descriptive, iar in a doua situatie se vor utiliza metodele statisticii inferentiale;

c.     a tipurilor de scale utilizate in masurarea variabilelor cercetarii. Variabilele calitative, si, respectiv, variabilele metrice, impun , fiecare in parte, anumite metode statistice de prelucrare a datelor primare.




Analiza preliminara a datelor de marketing


Cea mai simpla procedura de analiza este aceea cand se are in vedere statistica descriptiva in cazul unei singure variabile si a unui singur esantion. [17, 107-119] Aceasta inseamna o prelucrare a datelor obtinute din raspunsurile date la fiecare din intrebarile esantionului. In functie de scala folosita in masurarea datelor, vor fi utilizate, ca un prim nivel de aprofundare a investigatiei, urmatoarele metode de analiza univariata:


o       daca variabila a fost masurata cu scala nominala, descrierea acesteia se va realiza calculand frecventele absolute si relative (inclusiv procentele) pe categorii, incluse intr-un tabel, si stabilind apoi modulul;

o       daca variabila a fost masurata cu scala ordinala, analiza acesteia va consta in realizarea unei ordonari pe baza scorurilor medii, si apoi stabilirea medianei sau a intervalului median;

o       daca variabila a fost masurata cu scala interval, se va determina media aritmetica, dispersia varianta si abaterea standard; pot fi utilizate si metodele anterioare specifice variabilelor calitative;

o       variabila masurata cu scala proportionala, va oferi, in plus, fata de metodele mentionate anterior, si calculul mediei geometrice sau a celei armonice. Rezulta din mentionarile deja facute ca o scala mai evoluata permite utilizarea statisticii descriptive specifice scalelor anterioare.


Un al doilea nivel de aprofundare a investigatiei datelor de marketing este acela care presupune punerea in corelatie a unei variabile cu o alta variabila. Aceasta analiza a legaturii dintre doua variabile, care este o expresie a analizei bivariate, se poate face avand in vedere doua situatii, si anume:

ca o analiza a unei legaturi posibile intre o variabila, respectiv o intrebare, si o alta variabila, respectiv o alta intrebare, alta decat o variabila de caracterizare a subiectilor;

ca o analiza a unei legaturi posibile intre o variabila a cercetarii si o variabila de caracterizare a subiectilor (sex, educatie, venituri, profesie, stare civila etc.


Pentru evidentierea acestor legaturi, ca statistica descriptiva, se poate utiliza metoda tabelarii incrucisate . Ea consta in dispunerea in cadrul unor tabele a datelor aferente celor doua variabile, pe grupuri, categorii sau clase cu scopul de a face comparatii. Aceste tabele se mai numesc tabele de contingenta in masura in care cuprind totalurile pe randuri si pe coloane, datele respective fiind exprimate, fie ca marimi absolute, fie ca marimi procentuale.

O alta metoda de evidentiere a legaturii dintre doua variabile masurate metric, este ceea ce se numeste harta evaluarilor sau analiza cadranelor. In acest caz se realizeaza evaluarea caracteristicilor cercetate sub forma mediilor, in cazul fiecarei variabile in parte, si apoi se face amplasarea acestora intr-unul din cele patru cadrane pe care le are acest instrument de masura. Amplasarea unei caracteristici intr-un punct desemnat de cele doua medii, in interiorul unui cadran, ofera informatii despre modul de evaluare a acesteia de catre subiecti.

Pentru a sesiza mai usor rezultatele obtinute in cazul acestei analize preliminarii, ca statistica a esantionului, pot fi utilizate reprezentarile grafice. Acestea sunt adecvate tipurilor de analiza si se obtin cel mai lesnicios de catre calculator, ca de altfel si prelucrarea statistica mentionata anterior.

In prezent sunt o serie de programe specializate de prelucrare a datelor de marketing ce acopera practic toate metodele de analiza statistica a datelor de marketing. In acest sens, unul din cele mai performante pachete de programe este SPSS sub diferitele sale variante: SPSS SPSS 8.5 for Windows, SPSSX etc.

Alte pachete de programe mai sunt: SAS, SYSTAT, MINITAB, EDUSTAT, STATPAK.

Sunt si o serie de programe de genul Spreadsheet Pakages precum LOTUS 1-2-3, QUATTRO PRO sau EXCEL (97 sau 2000) care sunt utile managementului bazelor de date si care au incorporate unele programe pentru analiza descriptiva, analiza pe baza de grafice si o analiza statistica limitata. Deosebit de important este faptul ca programul SPSS, spre exemplu, poate prelua si apoi prelucra datele introduse in programele EXCEL


Testarea ipotezelor cercetarii.


Cercetarile descriptive si cercetarile cauzale, bazate pe esantioane probabilistice, reprezentative, impun cunoasterea variabilelor cercetarii la nivelul populatiei cercetate. Aceasta cunoastere necesita realizarea inferentei sau extrapolarii rezultatelor obtinute in cadrul statisticii descriptive asupra populatiei din care a provenit esantionul. Statistica inferentiala permite deci estimarea parametrilor populatiei cu o anumita eroare si cu un anumit nivel de incredere sau probabilitate. De asemenea, ea permite testarea ipotezelor statistice ale cercetarii, masurarea intensitatii legaturii dintre variabile, compararea diferentelor existente intre parametrii proveniti de la diferite grupuri sau populatii. Logica inferentei statistice se sprijina pe testele statistice.

Testele statistice, foarte numeroase, pot fi clasificate pornind de la mai multe criterii. 747e46h Cele mai importante trei criterii sunt:

Ø     criteriul parametric si neparametric. El are in vedere daca variabilele cercetate au o distributie normala sau un alt tip de distributie, cunoscuta sau necunoscuta precum si modul de masurare si marimea esantionului. Un test este parametric daca observarile provin de la populatii distribuite normal in raport cu un parametru sau altul, daca populatiile avute in vedere au aceeasi varianta, daca datele sunt masurate metric (interval sau proportional) si daca esantionul este suficient de mare (n>30). Un test este neparametric daca distributia populatiei este alta decat cea normala sau nu poate fi cunoscuta, daca variabilele sunt masurate cu orice tip de scala si daca esantionul are o marime mica (n<30);

Ø     criteriul numarului de esantioane. Se pune deci problema daca datele care fac obiectul analizei provin de la un singur esantion sau de la mai multe esantioane. Atunci cand provin de la doua sau mai multe esantioane trebuie cunoscut daca esantioanele respective sunt independente sau dependente (sau perechi). Esantioanele sunt independente atunci cand fiecare reprezinta un grup distinct de indivizi iar datele provin de la fiecare grup in parte. Esantioanele sunt perechi (dependente) atunci cand se are in vedere un singur grup de la care se obtin date in momente diferite de timp. Acest ultim tip de esantioane se utilizeaza in cazul experimentelor de marketing, cand de la aceleasi grup se obtin date inainte si dupa realizarea experimentului respectiv;

Ø     criteriul unilateral sau bilateral. In cazul unui test unilateral ipoteza nula are in vedere o inegalitate a carui sens se anticipeaza. Spre exemplu, pornind de la valorile observate, se cauta sa se afle daca o valoare care masoara un parametru al populatiei este mai mare decat o alta valoare prag predeterminata, plasata la una din extremitatile curbei de distributie. In acest sens, va fi un test unilateral stanga sau un test unilateral dreapta. In cazul unui test bilateral ipoteza nula are in vedere doua regiuni de respingere, adica se urmaresste sa se cunoasca daca o valoare observata este mai mica sau mai mare comparativ cu o valoare ce defineste doua praguri de acceptare -respingere plasate la cele doua extremitati ale curbei de distributie.


Testarea ipotezelor cercetarii in conditiile unei repartitii normale.


Sunt doua modalitati de testare a ipotezei nule:


prin utilizarea intervalului de incredere;

prin determinarea raportului critic.


Utilizarea intervalului de incredere

In cazul unui test bilateral ipotezele sunt:


H0 : μ = μ0

H1 :


Daca se are in vedere un test unilateral, ipotezele vor fi:


H0 : μ

H1 : μ > in cazul testului unilateral dreapta sau

H1 : μ < in cazul unui test unilateral stanga


unde μ reprezinta media reala a populatiei pentru variabila avuta in vedere, iar μ0 reprezinta media populatiei conform ipotezei nule pe care am stabilit-o.

In cazul in care se va accepta un nivel de semnificatie α = 0,05, iar n > 30, valoarea z in cazul unui test bilateral, asa cum se identifica ea din tabelul distributiei normale (distributia z) va fi ± 1,96. Considerand cunoscuta abaterea standard a populatiei, σ, se determina abaterea standard de la medie, adica . Ca urmare, intervalul de incredere va fi:


In aceste conditii, daca media rezultata din esantion se afla in interiorul celor doua valori care definesc limita inferioara si limita superioara a intervalului de incredere, inclusiv acestea, atunci ipoteza nula se accepta. Daca media rezultata din esantion este mai mare decat limita superioara sau mai mica decat limita inferioara, atunci ipoteza nula se respinge si, ca atare, se accepta ipoteza alternativa.

In cazul unui test unilateral dreapta ipoteza nula se accepta daca media rezultata din esantion are o valoare mai mica decat limita superioara a intervalului. Daca ea este mai mare atunci ipoteza nula se respinge. In cazul unui test unilateral stanga ipoteza nula se accepta daca media rezultata din esantion este mai mare decat limita inferioara a intervalului de incredere; daca va fi mai mica ipoteza nula se respinge si se accepta ipoteza alternativa. De precizat ca in cazul testelor unilaterale valoarea lui z este ± 1,64, ceea ce evident, va genera alte valori pentru cele doua limite ale intervalului, comparativ cu cele ale unui test bilateral.

De cele mai multe ori nu se cunoaste abaterea standard a populatiei pentru parametrul si variabila avute in vedere. Ca atare σ se va estima prin abaterea standard a esantionului, s. In aceasta situatie abaterea standard de la medie a populatiei se va estima prin abaterea standard de la medie a esantionului. Deci,

Aceasta inseamna ca intervalul de incredere se va determina astfel:



In cazul in care avem o marime redusa a esantionului, se va utiliza distributia t in vederea determinarii intervalului de incredere. Valoarea ± 1,96 de mai sus va fi inlocuita cu valoarea lui t corespunzatoare unui test bilateral sau cu valoarea lui t corespunzatoare unui test unilateral, identificata in tabelul distributiei t in functie de numarul gradelor de libertate si nivelul de semnificatie ales. Regula de acceptare sau respingere a ipotezei nule ramane aceeasi.

Determinarea raportului critic. In acest caz, daca avem in vedere un test bilateral, unde:


H0 : μ =

H1 : μ ≠ μ0


Valoarea raportului critic in cazul distributiei z si a distributiei t, in conditiile in care se are in vedere estimarea abaterii standard de la medie a populatiei se va stabili astfel:


iar


In cazul in care se accepta α 0,05, regula de decizie se va formula astfel in cazul testului bilateral:

Daca zobs zc.l. , unde zc.l. reprezinta valoarea lui z din tabelul distributiei normale in functie de nivelul de incredere ales (c.l.), atunci se accepta ipoteza nula. Daca zobs > zc.l. ipoteza nula se va respinge. Aceasta inseamna ca la nivelul de semnificatie mentionat mai sus, in cazul unui test bilateral, ipoteza nula se va accepta daca zobs va fi mai mic sau egal cu 1,96 si se va respinge daca va fi mai mare decat 1,96. Daca zobs va avea valoare negativa, atunci ipotezza nula se va accepta daca aceasta va fi mai mare decat –1,96 si se va respinge daca va fi mai mica decat –1,96. Cu alte cuvinte, ipoteza nula se va accepta daca zobs se va situa intre –1,96 si +1,96, inclusiv, si se va respinge daca se va situa in afara acestor valori.

In cazul testelor unilaterale, regula de decizie privind ipoteza nula va fi:

in cazul unui test unilateral dreapta se accepta ipoteza nula daca zobs este mai mic decat 1,96 si se respinge daca este mai mare;

in cazul unui test unilateral stanga, ipoteza nula se accepta daca zobs este mai mare decat –1,96 si se respinge daca este mai mic.

In situatia in care esantionul este mic, se va utiliza raportul critic pe baza distributiei t. Ca atare, valorile tobs vor fi comparate cu valorile t din tabelul distributiei t avand in vedere nivelul de semnificatie ales si numarul gradelor de libertate. Regulile de decizie privind ipoteza nula vorfi similare cu cele ale distributiei z, asa cum s-a mentionat mai sus.

Daca parametrul cercetat este un procent, metodologia cercetarii este identica ca cea prezentata mai sus.In esenta se parcurg urmatoarele etape:

Se formuleaza ipotezele:


H0 : π

H1 : π ≠ π0 in cazul unui test bilateral sau

H1 : π > π0 in cazul unui test unilateral dreapta sau

H1 : π < π0 in cazul unui test unilateral stanga


Intervalul de incredere ce poate fi utilizat pentru testare in situatia cea mai frecventa cand se opteaza pentru α 0,05 si pentru un test bilateral, va fi:



Deoarece abaterea standard a populatiei in cazul procentelor σp practic nu poate fi cunoscuta, se opteaza pentru o estimatie a acesteia SP, care se determina astfel:

Deci, in relatia intervalului de incredere de mai sus, valoarea σp va fi inlocuita cu valoarea Sp.

Regula de decizie privind ipoteza nula, in contextul mentionat mai sus, va fi: daca procentul rezultat din esantion, notat cu p, se va situa intre –1,96 si +1,96, inclusiv, se accepta ipoteza nula. Daca p va fi mai mare decat +1,96 sau mai mic decat –1.96, atunci se respinge ipoteza nula si se accepta ipoteza alternativa. In mod similar, ca in cazul parametrului medie, se va lua o decizie cu privire la ipoteza alternativa, in cazul testelor unilaterale ca si in cazul distributiei t.

Metoda cea mai lesnicioasa de testare a ipotezelor, ca si in cazul mediei, este determinarea raportului critic. In cazul procentelor, in situatia distributiei z sau t, raportul critic se determina astfel:


unde:

p = procentul din esantion

π0 procentul presupus din cadrul populatiei

Sp = estimarea abaterii standard a procentelor


Deciziile privind ipoteza nula sunt idenntice cu cele stabilite in cazul mediilor. Astfel, daca testul este bilateral, in cazul distributiei z, ipoteza nula se va accepta daca valoarea zobs va fi mai mica decat valoarea lui z din cadrul tabelului distributiei normale standardizate avand in vedere nivelul de semnificatie ales. Se va respinge ipoteza nula si se va accepta ipoteza alternativa daca daca zobs va fi mai mare decat valoarea lui z din tabelul distributiei z. Se va proceda corespunzator in cazul testelor unilaterale sau in situatia distributiei t.


Analiza bivariata. Teste pentru compararea diferentelor dintre medii si a diferentelor dintre procente.


Aceste teste au ca obiect cunoasterea deosebirilor, deci a diferentelor de atitudine, de comportament, de caracteristici, dintre indivizii care compun doua grupuri care pot fi independente sau perechi. Testul unei diferente reprezinta o cercetare a ipotezei care indica ca doua sau mai multe grupuri difera sub aspectul marimii unei variabile exprimata ca medie sau ca procent.

Tipurile de teste privind diferentele dintre doua grupuri se diferentiaza in raport cu modalitatile de masurare a variabilei cercetate si in raport cu tipul grupurilor (independente sau perechi). Aceste teste pot fi parametrice si neparametrice.


Teste parametrice de comparare a diferentelor.


v    Teste de comparare a doua medii

a)     Testul z si testul t de comparare a mediilor a doua esantioane independente. Se formuleaza ipoteza nula si se opteaza pentru una din cele trei forme ale ipotezei alternative:


H0 : μ1

H1 :

H1 : >

H1 : <


Se determina raportul critic:



deoarece μ1 - μ2 0 cand H0 este adevarata. In relatia de mai sus reprezinta valorile medii ale primului si ale celui de al doilea esantion iar este abaterea standard comuna a diferentelor mediilor.

Daca abaterile standard σ1 si σ2 sunt cunoscute iar n1 si n2 arata marimea celor doua esantioane, atunci:


Daca abaterile standard nu sunt cunoscute, atunci abaterea standard a diferentelor mediilor se aproximeaza prin:



unde s1 si s2 sunt abaterile standard calculate pe baza primului si respectiv, celui de al doilea esantion; sau dispersiile celor doua esantioane, asa cum figureaza ele sub radicalul de mai sus.

Daca optam pentru un nivel de semnificatie α = 0,05 si pentru un test bilateral, atunci valorile z care vor delimita regiunea de acceptare-respingere a ipotezei nule vor fi –1,96 si +1,96. Regula de decizie va fi:


se accepta H0 daca valoarea raportului critic se va situa intre –1,96 si +1,96 inclusiv;

se repige H0 daca RC < -1,96 sau daca RC >


In situatia in care cele doua esantioane independente sunt de dimensiuni reduse (n1 < 30 , n2 <30) se va folosi distributia t in ipoteza ca cele doua esantioane provin de la populatii repartizate normal si in ipoteza ca variantele celor doua populatii sunt egale. In acest caz raportul critic va fi:


Deoarece este putin probabil sa fie cunoscuta abaterea standard comuna a diferentelor mediilor, se va realiza estimarea acesteia pe baza relatiilor de mai jos:


unde



Regula de decizie va fi:


se respinge ipoteza nula daca tobs > t ; df din tabelul distributiei t;

se accepta ipoteza nula daca tobs ≤ tα; df


b).Testarea diferentelor intre medii in cazul esantioanelor perechi.

In acest caz exista observari realizate in doua momente de timp provenite de la membrii aceluiasi grup. Spre exemplu, performantele sub forma unui scor mediu, pentru un grup de persoane care au urmat o forma de perfectionare, realizate inainte si dupa parcurgerea acesteia.

Realizarea testului presupune:

formularea ipotezei nule care arata inexistenta unei diferente intre performantele atinse inainte de parcurgerea pregatirii respective si cele obtinute dupa : H0 : ΅1 = iar H1 : μ 1 ≠ μ2 ;

stabilirea diferentei di dintre cele doua scoruri corespunzatoare fiecarui cuplu de observari din cele n existente;

calculul mediei si a dispersiei diferentelor:



determinarea abaterii standard a diferentelor, sd , ca radical din dispersie;

calculul raportului critic pe baza relatiei:


stabilirea regulii de decizie privind ipoteza nula:


o       se accepta ipoteza nula daca valoarea raportului critic determinata in contextul distributiei z sau t este mai mica decat valoarea teoretica din tabelul distributiei respective;

o       se respinge ipoteza nula daca valoarea RC este mai mare.


v    Testarea diferentelor dintre doua procente

De la doua populatii independente, deci de la doua esantioane, pot rezulta doua procente a celor care opteaza pentru ceva. Se pune problema de a cunoaste daca intre cele doua populatii se manifesta diferente semnificative in cazul variabilei studiate.

Testul necesita urmatoarele determinari:


a)stabilirea ipotezei nule si a uneia din ipotezele alternative posibile:


H0 : π1 = π2

H1 : π1 ≠ π2

H1 : π1 >

H1 : <


b)    determinarea raportului critic



deoarece :   π1 – π2 = 0

unde:           p1 = procentul din esantionul grupului 1

p2 = procentul din esantionul grupului 2

π12 = procentul presupus al populatiei 1 minus procentul presupus al populatiei 2

*= abaterea standard a diferentelor dintre procente


Deoarece practic nu avem cum sa cunoastem abaterea standard a diferentelor dintre procente, raportul critic se va stabili pe baza estimarii acesteia pornind de la datele din esantioane, folosind relatia:



unde:   = estimarea comuna a procentului de succes la nivelul celor doua esantioane

arata estimarea comuna a procentului de insucces la nivelul celor doua esantioane

n1, n2, = marimea esantionului pentru grupul 1 si pentru grupul 2


Pentru a calcula estimatorul comun se foloseste relatia:



Regula de decizie privind ipoteza nula se adopta in functie de nivelul de semnificatie ales, in functie de tipul distributiei (z sau t) si tipul ipotezei alternative, dupa regulile mentionate deja. Astfel, daca se merge pe un test bilateral, in conditiile distributiei z, ipoteza nula se va accepta daca valoarea raportului critic se va incadra intre limita pozitiva si cea negativa a valorilor teoretice ale lui z in functie de nivelul de semnificatie ales. Ipoteza nula se va respinge daca valoarea raportului critic va fi mai mica decat limita negativa sau mai mare decat limita pozitiva a valorilor critice z.







Teste neparametrice de comparare a diferentelor


Sunt situatii cand populatia nu este distribuita normal iar datele sunt masurate nominal si ordinal. Ca urmare se impune folosirea testelor neparametrice. Cele mai importante sunt:


Ø           testul c2 ( hi patrat)


El se foloseste pentru testarea semnificatiei statistice a distributiei frecventelor care se pot exprima ca marimi absolute sau procentuale. Testarea ipotezei nule presupune compararea frecventelor observate, asa cum rezulta ele din raspunsurile date de subiecti, cu frecventele asteptate, adica cu frecventele care au la baza o teorie despre distributia populatiei, sau anumite proportii pe care le presupunem conform ipotezei nule.Testul c2 impune parcurgerea urmatoarelor etape:


formularea ipotezei nule si a ipotezei alternative; ipoteza nula presupune ca intre frecventele observate si cele asteptate nu exista diferente semnificative. Ipoteza alternativa afirma ca exista diferente semnificative intre frecventele respective;

stabilirea nivelului de semnificatie a

dispunerea intr-un tabel de contingenta a frecventelor observate;

calcularea frecventelor teoretice asteptate presupunand ca ipoteza nula ar fi adevarata.Frecventele asteptate, notate cu Eij, se determina pornind de la frecventele observate astfel:



determinarea valorii critice c2calc.



unde: Oij = frecventa observata in celula ij

Eij = frecventa asteptata in celula ij

stabilirea regulii de decizie privind ipoteza nula. Aceasta presupune compararea valorii c2calc. cu valoarea teoretica c a; df din tabelul repartitiei c2 avand in vedere nivelul de semnificatie ales si numaru gradelor de libertate calculat astfel: (r-1)(c-1).Regula de decizie va fi



- se accepta H0 daca c2calc. £ c a; df

- se respinge H0 si se accepta H1 daca c2calc. > c2a; df


Ø     Testul Wilcoxon (sau testul semnului si al rangului)


Se foloseste pentru compararea marimii diferentelor dintre doua ordonari care pot proveni fie de la doua esantioane independente , fie de la doua esantioane dependente.

Aplicarea testului o vom exemplifica luand in considerare un experiment care presupune doua esantioane dependente, adica un grup de persoane, relativ mic, (n<30) de la care se obtin date inainte si dupa experiment. Datele sunt masurate cu o scala ordinala, la nivelul fiecarei persoane obtinandu-se un scor inainte si dupa realizarea experimentului, care figureaza intr-un tabel.

Ipoteza nula si ipoteza alternativa le formulam astfel:


H0 : m m H1 : m ¹ m


Conform ipotezei nule rezulta ca la nivelul grupului respectiv experimentul nu a avut nici un efect. Ipoteza nula indica existenta unei deosebiri semnificative intre performantele existente inainte de experiment si cele obtinute dupa experiment.(m si m indica la nivelul grupului media performantelor, adica media scorurilor ininte si dupa experiment

Pornind de la scorurile realizate de fiecare membru al grupului, se stabilesc semnele si diferentele absolute dintre fiecare pereche de observari. Daca doua evaluari sunt identice, ele se exclud din analiza. Pornind apoi de la marimea aboluta a diferentelor, se realizeaza o ordonare a acestora atribuind rangul 1 celei mai mici diferente, rangul 2 diferentei imediat superioare s.a.m.d.. Daca sunt doua sau mai multe perechi egale ale diferentelor, atunci se determina un nivel mediu al scorului care exprima ordinea.Presupunem ca diferentei abolute 6 ii revenea rangul 3 in conditiile in care mai exista o diferenta absoluta 6 careia ar trebui sa-i revina rangul 4. Ca atare, rangul 3 + rangul 4 3,5 . Valoarea 3,5 va indica ordinea, rangul, pentru fiecare din cele doua diferente egale. In final se face o repartizare a rangurilor in functie de semnul avut (pozitiv, negativ) si apoi se realizeaza suma rangurilor pozitive, TP, si suma rangurilor negative, Tn.

Se va stabili valoarea Tcalc. ca fiind valoarea cea mai mica dintre valorile TP si Tn. Sa presupunem ca Tcalc are valoarea lui Tn.

In testul Wilcoxon valoarea obtinuta Tcalc se va compara cu valoarea Tn; a asa cum se afla ea in tabelul special al valorilor critice T, ale testului Wilcoxon, avand in vedere numarul de perechi, n, nivelul de semnificatie si tipul testului (bilateral sau unilateral)

Regula de decizie cu privire la ipoteza nula va fi:



se accepta ipoteza nula daca Tcalc > Tn;a

se respinge ipoteza nula si se accepta ipoteza alternativa daca Tcalc £ Tn;a


Cand marimea esantionului este mai mare, adica n > 30, atunci distributia de esantionare este aproximativ normala si in acest caz testul va avea la baza valorile z. Raportul critic se calculeaza pe baza urmatoarei relatii:


unde:

reprezinta media valorilor T iar radicalul de la numitor arata abaterea standard a valorilor T, sT

Valoarea raportului critic, zcalc se compara cu valoarea teoretica a lui z si se adopta decizia care se impune.


Ø     Testul Mann – Whitney (testul U)


Acest test parametric permite compararea diferentelor in situatia in care populatiile respective nu sunt distribuite normal si nu sunt egale sub aspectul variantelor.

Specificul testului Mann – Whitney este acela ca valorilor cantitative (initial masurate metric) corespunzatoare celor doua grupuri independente, li se asociaza ranguri si se ajunge astfel la o variabila ordinala cu mai multe modalitati. Spre exemplu, se urmareste compararea vanzarilor realizate de doua grupuri independente de vanzatoare care desfac aceleasi produse intr-un mare magazin universal. Unul din aceste grupuri se deosebeste de celalalt prin faptul ca a urmat un curs special de pregatire. Se doreste a se afla daca volumul vanzarilor realizate intr-un anumit interval de timp de acest grup se diferentiaza semnificativ de vanzarile celuilalt grup. Ca urmare, ipoteza nula se enunta astfel: H0 : m m , adica media vanzarilor unui grup nu se deosebeste de media vanzarilor celuilalt grup. Ipoteza alternativa, H1 : m ¹ m presupune existenta unor deosebiri esentiale intre cele doua grupuri sub aspectul performantelor in munca.

Testul implica parcurgerea urmatoarelor etape:

alegerea nivelului de semnificatie a

ordonarea in sens crescator a vanzarilor realizate de fiecare membru al celor doua grupuri si acordarea fiecarei sume a unui numar de ordine crescator incepand cu 1.

calcularea valorilor R1 si R2 care reprezinta suma numerelor de ordine aprtinand fiecarui grup.

determinarea valorilor U1 si U2 pe baza urmatoarelor relatii:



stabilirea valorii U care va fi testata, Ucalc, ca valoarea minima dintre U1 si U2 ; Ucalc = min (U1 , U2 )

testul U se diferentiaza in raport cu marimea fiecaruia din cele doua esantioane in parte. Sunt trei situatii posibile:


cand n1 si n2 < 9;

cand n1 este cuprins intre 1 – 20 iar n2 ³

cand n1 si n2 sunt suficienti de mari pentru ca valorile U sa fie distribuite normal.


Regula de decizie privind ipoteza nula se diferentiaza in raport cu fiecare din situatiile mentionate mai sus astfel:


Cand n1 si n2 < 9 ; din tabelele speciale ale distributiei U se identifica probabilitatea realizarii valorii Ucalc in raport cu marimea lui n1 si n2. Presupunem ca aceasta este p. Regula de decizie va fi:


Ø     se accepta ipoteza nula daca: 2p > a , adica daca probabilitatea p din tabel, dublata, este mai mare decat nivelul de semnificatie;

Ø     se respinge ipoteza nula si se accepta ipoteza alternativa daca 2p £ a


Cand n1 este cuprins intre 1 si 20 iar n2 este mai mare sau egal cu 9, pana la maximum 20. In acest caz tabelele pentru testul U vor indica valori critice ale lui U avand in vedere diferitele nivele de semnificatie care corespund unui test bilateral sau unilateral. Dupa determinarea valorilor R1 si R2 , a valorilor U1 si U2 si a valorii Ucalc , conform metodologiei anterioare, se procedeaza astfel:


*  se identifica din tabel valoarea Ua in functie de nivelul de semnificatie corespunzator testului bilateral sau unilateral;

*  se adopta regula de decizie: se accepta ipoteza nula daca Ucalc > Ua ; se respinge ipoteza nula daca Ucalc £ Ua


Cand valorile U sunt distribuite normal, cand n1 si n2 sunt suficienti de mari, se va utiliza disrtibutia z si se va calcula raportul critic avand in vedere Ucalc , media si abaterea standard a valorilor U.

Media distributiei U , notata cu mU se determina astfel:


Estimarea abaterii standard U se determina pe baza relatiei:



Raportul critic va fi:


Regula de decizie va fi:


*  se accepta ipoteza nula daca zU £ za

*  se respinge ipoteza nula si se accepta ipoteza alternativa daca zU > za

Ø     Testul Kolmogorov – Smirnov


Se utilizeaza in cazul esantioanelor independente cand se au in vedere variabile ordinale ce au putine modalitati.El se aplica fie cu scopul compararii repartitiei raspunsurilor observate cu o repartitie definita apriori, in cazul a doua esantioane independente de aceeasi marime, fie cu scopul compararii raspunsurilor provenite de la doua esantioane independente de marimi diferite.

Daca vom lua in considerare esantioane independete de marimi diferite, pentru acestea se calculeaza frecventele relative cumulate F1(k) si F2(k) unde k reprezinta o modalitate a variabilei ordinale. Notam cu n1 si n2 marimile celor doua esantioane. Prin intermediul testului se urmareste sa se verifice statistic daca exista diferente intre repartitiile celor doua esantioane. Ipotezele se enunta astfel:

H0 : diferenta maxima intre cele doua frecvente cumulate este zero;

H1 : diferenta maxima intre cele doua frecvente cumulate este diferita de zero


Testul presupune identificarea diferentei maxime, cu marimea absoluta cea mai mare, dintre diferentele frecventelor cumulate aferente fiecarui nivel al variabilei ordinale cercetate. Deci,


Dcalc = max F1(k) – F2(k)

k

Valorile Dcalc, pentru un test bilateral, se compara cu valoarea teoretica cuprisa in tabelul repartitiei Kolmogorov – Smirnov, avand in vedere un nivel de semnificatie a si marimea celor doua esantioane .De retinut ca in cazul unui test unilateral intervine repartitia c

Valorile teoretice pentru D in cazul a doua esantioane independente de marimi diferite si pentru a = 0,05, se determina pe baza relatiei:



Regula de decizie va fi:

se accepta H0 daca Dcalc £ Dcritic

se respinge H0 si se accepta H1 daca Dcalc > Dcritic


Daca vom avea in vedere o scala ordinala cu o structura a raspunsurilor predeterminata, corespunzatoare unei perioade anterioare, putem sa aflam, pe baza unor observatii ulterioare provenite de la un esantion de aceeasi marime ca cel anterior, in ce masura acestea se diferentiaza de cele initiale. Metodologia de determinare a lui Dcalc este aceeasi ca cea anterioara. In privinta valorilor critice, acestea se afla intr-un tabel special unde in functie de nivelul de semnificatie si de marimea esantionului se indica sau se pot calcula aceste valori. Calculul se face numai atunci cand marimea esantionului depaseste 35. La un nivel de semnificatie a = 0,05 relatia de calcul a valorii critice este:


Regula de decizie se stabileste ca in situatia anterioara.


Ø     Analiza variantei

Reprezinta o metoda care presupune existenta relatiei cauza – efect dintr-o variabila dependenta masurata metric si una sau doua variabile independente masurate nominal, cu mai multe modalitati de manifestare fiecare. Se doreste a se cunoaste efectul, sau in ce masura modificarea unei variabile sau a celor doua variabile independente influenteaza variabila dependenta.


Analiza variantei avand in vedere o singura variabila independenta. Ea presupune repartizarea variantei totale a variabilei dependente (spre exemplu, vanzarile unui produs) pe doua tipuri de variante:


a)     varianta atribuita influentei variantelor, sau nivelurilor variabilei independente, denumita si efect de tratament, concretizata in deviatiile mediei nivelurilor fata de media generala;

b)    varianta datorata unor factori necunoscuti, care arata deviatii in interiorul nivelelor;


Ca urmare, modelul de analiza a variantei in cazul unei singure variabile independente se prezinta astfel:

unde:

yij = valoarea lui y pentru observarea i apartinand modalitatii j (j = 1……c) (i = 1….nj)

= media generala a variabilei dependente y pe care o explicam

Cj = efectul nivelului j al variabilei independente

Eij = valoarea aleatoare, necunoscuta (eroarea) corespunzatoare observarii i apartinand nivelului j


Variantele se determina prin metoda celor mai mici patrate, astfel incat :

Suma patratelor variantei totale este egala cu suma patratelor variantei in interiorul nivelelor plus suma patratelor variantei intre nivele, deci,

SST = SS in niv. + SS intre niv.

In conditiile in care variabila independenta, presupunem, are trei modalitati sau nivele, (presupunem trei forme de preturi) ipoteza nula considera ca cele trei medii corespunzatoare fiecarui nivel sunt egale: H0 :

Ipoteza alternativa presupune existenta unor diferente semnificative intre aceste medii, ceea ce denota influenta exercitata de fiecare forma de pret asupra volumului vanzarilor. Deci, H1 : .

Testarea ipotezei nule se realizeaza prin intermediul testului F.

Determinarile care se fac pe baza celor mentionate mai sus se regasesc intr-un tabel ANOVA:


Tabel 6.3. ANOVA cu o singura variabila


Tipul

variantei

Suma patratelor

Grade de

libertate

Media sumei



patratelor

Fcalc

Intre

nivele

SS intre nivele:


c-1

MS intre niv =


In interiorul

nivelelor

SS in nivele:


n-c

MS in nivele =


____

Totala

SST:


n-1




____


Fcalc se va compara cu valoarea critica a lui Fa;df din tabelul distributiei F, avand in vedere nivelul de semnificatie stabilit si numarul gradelor de libertate pentru numarator (c-1) si pentru numitor (n-c).

Regula de decizie va fi:


se accepta ipoteza nula daca: Fcalc £ Fa;df.

Se respinge ipoteza nula si se admite H1 daca: Fcalc > Fa; df.


Analiza variantei avand in vedere doua variabile

Pornind de la exemplul anterior, presupunem ca pe langa cele trei variante de preturi se ia in considerare si o a doua variabila care are doua variante de reclama.In acest caz, modelul liniar aditiv pentru o observare se prezinta sub doua ipostaze dupa cum cele doua variabile independente se afla sau nu se afla in raporturi de interactiune:

a)     Doua variabile explicative care se afla in interactiune:

b) Doua variabile explicative care nu se afla in raporturi de interactiune:

unde:

yijk = valoarea variabilei dependete pentru observarea k din esantionul cu nj nivele ale randurilor (i = 1nj) si cu c nivele ale coloanelor (j = 1..c)

= media generala a variabilei dependente

Ri = efectul mediu al nivelului i al variabilei de pe randuri

Cj = efectul mediu al nivelului j al variabilei de pe coloane

Iij = efectul mediu de interactiune reyultat din nivelul i al variabilei de pe randuri si nivelul j al variabilei de pe coloane


unde: = media variabilei dependente la nivelul i al variabilei de pe randuri si nivelul j al variabilei de pe coloane

Vr = (Iij + eijk) = valoarea reziduala in cazul variabilelor fara interactiune

Eijk = eroarea in cazul variabilelor cu interactiune


Pornind de la modelul ANOVA cu doua variabile, pe baza metodei celor mai mici patrate, pot fi determinate componentele sumei patratelor abaterilor totale astfel:

a.      in cazul a doua variabile care interactioneaza: suma totala a patratului abaterilor = suma patratica a abaterilor de pe randuri + suma patratica a abterlor de pe coloane + suma patratica a abaterilor de interactiune + suma patratica a erorii; deci,


SST = SSC + SSR + SSI + SSE


b.     in cazul a doua variabile care nu interactioneaza:


SST = SSC + SSR + SSVr


Fiecare suma din cele de mai sus se determina astfel:






unde notatiile folosite au urmatoarele semnificatii:


yijk = valoarea variabilei dependente pentru observarea k din esantionul cu r nivele ale randurilor (i = 1.r) si cu c nivele ale coloanelor (j = 1c)

= media generala a variabilei dependente

= media nivelului j a variabilei independente de pe coloane

media nivelului i a variabilei independente de pe randuri

*= media variabilei dependente pentru nivelul i al variabilei de pe randuri si nivelul j al variabilei de pe coloane (media unei celule)

nj = numarul de observari corespunzatoare coloanei j

ni = numarul total de observari corespunzator randului i

nij = numarul de observari dintr-o celula

c = numarul coloanelor (modalitatii j)

r = numarul randurilor (modalitatii i)

n = numarul total al observatiilor


Dupa realizarea determinarilor mentionate mai sus, rezultatele pot fi sintetizate in urmatoarele doua tabele in functie de relatiile care se manifesta intre cele doua variabile independente:


Tabel 6.4. ANOVA cu doua variabile fara interactiune


Tipul variantei

Suma

patratelor

Grade de libertate

Media sumei patratelor


Fcalc


De pe coloane


SSC


c-1





De pe randuri


SSR


r-1





Valoare

Reziduala



SSVr


n-r-c+1


Totala

SST


n-1




Testul de semnificatie statistica are in vedere fiecare variabila in parte. Deci, se va formula cate o ipoteza nula si o ipoteza alternativa pentru variabila de pe coloane si pentru cea de pe randuri.

Pentru variabila de pe coloane:

H0 = mediile sunt egale

H1 = mediile sunt diferite

Regula de decizie : se accepta ipoteza nula daca Fcalc £ Fa; df ; se respinge ipoteza nula daca Fcalc > Fa; df.


Pentru variabila de pe randuri:

H0 : mediile sunt egale

H1 : mediile sunt diferite

Regula de decizie se adopta ca in cazul variabilei anterioare.


Tabel 6.5. ANOVA cu doua variabile aflate in interactiune


Tipul variantei


Suma patratelor

Grade de libertate

Media patratelor

Fcalc

De pe coloane



SSC


c-1


De pe randuri



SSR


r-1





De interactiune




SSI


(r-1)(c-1) sau rc-c-r+1




Eroarea




SSE


n-rc



___

Totala


SST

n-1

___

___




Testarea ipotezelor se face distinct, pentru variabila de pe coloane, pentru variabila de pe randuri si pentru efectul de interactiune. Formularea ipotezelor si luarea deciziilor privind situatia ipotezei nule se realizeaza dupa procedura mentionata mai inainte.


Analiza bivariata. Masurarea asocierii dintre variabile


Masurarea si testarea gradului de asociere dintre variabile se realizeaza prin intermediul unor metode statistice, fiecare dintre acestea avand in vedere modalitatile de masurare a variabilelor, natura esantioanelor si numarul acestora.

Studierea asocierii dintre doua variabile are in vedere:

*  de a pune in evidenta printr-un test, existenta unei asocieri, adica a unei legaturi mai mult sau mai putin puternice;

*  de a masura intensitatea legaturii;

*  de a cunoaste directia de evolutie a variabilelor respective (variatii in acelasi sens sau in sens contrar.


Masurarea asocierii intre variabile nominale


a.     Coeficientul de contingenta C. Se determina pe baza relatiei:


unde:

C = coeficientul de contingenta

c2 = valoarea calculata a lui c2 in cayul celor variabile nominale

n = marimea esantionului sau numarul total de observatii.


Cu cat C este mai mare, cu atat mai puternica este legatura dintre variabile. Cand C = 0 se manifesta o situatie de independenta, variabilele nefiind legate intre ele (in acest caz c

Marimea coeficientului de contingenta este o functie a numarului de celule din tabelul de contingenta si acesta niciodata nu poate atinge valoarea maxima egala cu 1, chiar daca intre variabile ar fi o asociere perfecta. Valoarea limita a lui c2 este egala cu n(k-1), unde k reprezinta numaru de modalitati sub care se manifesta variabila independenta. Valoarea maxima a lui C va fi deci,

Spre exemplu, valoarea maxima a lui C va fi 0,707 pentru un tabel 2x2, 0,816 pentru un tabel 3x3, 0,866 pentru un tabel 4x4 etc. Pentru a aprecia gradul de intensita te a legaturii, valoarea calculata a lui C se va compara cu nivelul sau maxim ce poate fi atins.


b.     Coeficientul T al lui Ciuprov.


Acest coeficient are in vedere numarul de grade de libertate existente intr-un tabel de contingenta. Astfel, pentru un tabel cu r linii si c coloane, numarul gradelor de libertate va fi df = (r-1)(c-1). El se determina astfel:

Acest coeficient nu poate atinge valoarea 1 decat pentru tabelele care au un numar egal de randuri si coloane. El este comparabil numai pentru tabele de aceeasi talie.




c.     Coeficientul V al lui Cramer


Daca se va nota cu t = min [(r-1), (c-1)], atunci,


Acest coeficient poate atinge valoarea 1 in functie de dimensiunile tabelului.


Masurarea asocierii intre variabile nominale binare.


In situatia in care avem doua variabile nominale dichotomice (binare) dispuse in cadrul unui tabel 2 x 2 de forma:



x

y

a

b

c

d


Putem determina gradul lor de asociere prin intermediul coeficientului phi f sau prin intermediul coeficientului Q a lui Yule.

Coeficientul f este indicat, indeosebi, pentru tabele de mici dimensiuni, tip 2x2 sau cand una din dimensiuni este 2. Relatia de calcul este:



Acest coeficient poate avea valori cuprinse intre –1 si +1.Valoarea 1 va exista numai atunci cand una din digonale va fi nula, adica a = d = 0 sau b = c = 0. Valorile apropiate de –1 sau +1 indica o asociere intre cele doua variabile, in timp ce valorile apropiate de zero arata inexistenta legaturii dintre variabile. Semnificatia statistica a coeficientului f se determina folosind repartitia c2 , pe baza relatiei: c2 = nf


Coeficientul Q a lui Yule. Relatia de calcul este:



Acest coeficient ia valori cuprinse intre –1 si +1

Se impune a preciza ca cei doi coeficienti prezentati mai sus reprezinta metode neparametrice de masurare a intensitatii legaturii dintre variabile ce exprima aspecte de ordin calitativ.


Asocierea intre variabile ordinale


In acest caz se pune problema de a determina daca intre doua grupuri independente care fac o ordonare a unor obiecte avand in vedere un anumit criteriu (preferinta spre exemplu), exista o asociere. Pentru aceasta se pot utiliza doi coeficienti: coeficientul de corelatie a rangurilor a lui Spearman (rs) si coeficientul de corelatie a rangurilor a lui Kendall, t (tau) care si ei sunt modalitati neparametrice de masurare a asocierii.


Ø     Coeficientul de corelatie a rangurilor a lui Spearman se determina astfel:


unde: di = diferenta rangurilor observate intre cele doua ordonari (clasificari)

n = numarul de elemente de clasificat.


Coeficientul de corelatie a rangurilor variaza intre –1 si +1. Atunci cand exista o asociere pozitiva perfecta, el este +1; cand asocierea este negativa, perfecta, el este –1; cand este zero intre cele doua ordonari nu exista nici o relatie.

O testare a semnificatiei statistice a coeficientului rs cand n < 30 se poate face pe baza relatiei:


care reprezinta o distributie Student (t) cu n-2 grade de libertate. H0 presupune ca = 0. Se accepta ipoteza nula daca £ ta df si se respinge daca va fi mai mare.

In cazul in care n ³ 30 se utilizeaza statistica aferenta unui raport critic pe baza distributiei z:



Se pleaca de la H0 : rs = o si H1 ¹ 0, de la un nivel de semnificatie ales, si de la tipul respectiv de test (bilateral sau unilateral). Regula de decizie in cazul unui test bilateral va fi: se accepta ipoteza nula daca £ za sau daca ³ - za


Ø     Coeficientul t (tau) de corelare a rangurilor a lui Kendall

In esenta, construirea coeficientului de corelare se bazeaza pe aflarea numarului de puncte discordante si a celor concordante dintre perechile de observari.

Doua observari sunt concordante daca xi < xj si, in acelasi timp, daca yi < yj . Ele sunt discordante daca xi < xj , dar in schimb, yi > yj. Daca vom nota:

dij = 1 cand i si j sunt concordante si

dij = -1 cand i si j sunt discordante, atunci:



Relatia pe baza careia se calculeaza coeficientul de corelatie a rangurilor a lui Kendall este:



Acest coeficient poate avea valori intre –1 si +1.


Masurarea asocierii intre variabile metrice


Masurarea intensitatii dependentei liniare dintre doua variabile cantitative se poate realiza prin intermediul coeficientului de corelatie a lui Karl Pearson, denumit frecvent, coeficient de corelatie. El exprima covariatia dintre doua variabile masurate metric si are valori cuprise intre –1 si +1. Relatia de calcul este urmatoarea:


Valoarea absoluta a coeficientului de corelatie exprima forta sau intensitatea asocierii liniare dintre variabila x si variabila y. Semnul coeficientului reflecta sensul de corelare: valorile pozitive corespund variatiilor deacelasi sens, valorile negative indica variatii de sens contrar.

In practica, in functie de nivelul atins de coeficientul de corelatie, intesitatea legaturii dintre cele doua variabile se apreciaza astfel:


£ r < 0,2 Þ nu exista o legatura semnificativa;

£ r < 0,5 Þ exista o legatura slaba;

£ r < 0,75 Þ exista o legatura de intensitate medie;

£ r < 0,95 Þ exista o legatura puternica;

£ r < 1,00 Þ exista o legatura perfecta (functionala).


Testul pentru coeficientul de corelatie, in ipoteza in care cele doua variabile sunt distribuite normal, ipoteza nula indica lipsa legaturii, r = 0, iar numarul de observatii este mai mic ca 30, se face utilizand relatia:



Pentru nivelul de semnificatie ales, pentru tipul de test si pentru n-2 grade de libertate, se adopta regula de decizie cunoscuta: daca tr £ ta; df se accepta ipoteza nula; daca este mai mare se va respinge.


Testele de asociere in cazul esantioanelor perechi


Aceste teste se refera la masurarea inferentei unei variabile independente asupra asupra unei variabile dependente, avand in vedere doua sau mai multe esantioane perechi. Ele se folosesc in activitatea de experimentare sau atunci cand datele provin de la paneluri.

Cele mai importante teste de evidentiere a asocierii in cazul a doua esantioane perechi sunt: testul Mc. Nemar cand variabila dependenta este ordinala, testul Wilcoxon si testul semnului cand variabila dependenta este ordinala, testul t in cazul variabilelor metrice. Atunci cand este vorba de mai multe esantioane perechi, testele care se pot utiliza sunt: testul Q a lui Cochran, cand variabila dependenta este nominala, testul lui Friedman si extensia testului medianei in cazul cand variabila dependenta este ordinala, analiza variantei si covariantei in cazul unei variabile dependente metrice.


Analiza multivariata.


Metodele de analiza multivariata ne ofera posibilitatea sa cunoastem efectele simultane a mai mult de doua variabile independente asupra uneia sau mai multor variabile dependente.

Metodele statistice de analiza multivariata, in functie de raporturile care pot exista intre variabila sau variabilele dependente si variabilele independente, pot fi grupate in doua mari categorii: [14, p.137 ]


a.      metode de analiza a dependentelor

b.     metode de analiza a interdependentelor


Fara a analiza pe larg continutul acestor metode, deoarece natura si complexitatea lor depasesc cadrul acestei lucrari, vom prezenta in cele ce urmeaza numai elementele principiale care le definesc.


a.      Metodele de analiza a dependentelor explica sau prevad evolutia uneia sau mai multor variabile dependente pe baza a trei sau mai multor variabile independente. Aceste metode analizeaza deci raporturi de dependenta: cum variabila sau variabilele dependente depind de variabilele independente. Spre exemplu, cum evolutia vanzarilor depinde de variabile precum: pret, reclama, ambalaj, venituri etc.

Metodele de analiza a dependentelor se clasifica atat in functie de numarul variabilelor aflate in raporturi de dependenta cat si in functie de modalitatile de masurare a acestor variabile. Cele mai importante metode sunt:

*  atunci cand exista o singura variabila dependenta, daca aceasta este masurata metric, se utilizeaza analiza de regresie multipla; daca este masurata nemetric, se face apel la analiza discriminarii;

*  daca sunt mai multe variabile dependente, masurate metric, se aplica analiza variantei multivariate, iar masurate nemetric, se recurge la analiza conjoint;

*  cand sunt numeroase variabile aflate in raporturi de independenta si dependenta, masurate metric sau nemetric, se face apel la analiza canonica.


Analiza de regresie. Aceasta metoda descrie prin intermediul unui model relatia dintre o variabila dependenta si una sau mai multe variabile independente. Cand relatia are in vedere o singura variabila, se manifesta regresia simpla, cand sunt mai multe variabile independente, se manifesta regresia multipla.

Regresia simpla este o functie liniara de tipul:



unde: b si b sunt cei doi parametrii ai regresiei care urmeaza a fi determinati

x variabila independenta ce se presupune cunoscuta

e o valoare aleatoare (eroare) ce exprima influenta unor factori neobservati, dar prezenti in variabila y.


Modelul regresiei liniare multiple se prezinta astfel:



unde: b = interceptul (o constanta)

b bk = cei k parametrii ai modelului

xi1, xi2,xik = variabile independente cu valori cunoscute

ei = o variabila aleatoare care insumeaza influenta unor variabile independente externe (necunoscute) necuprinse in model cu efectele corespunzatoare asupra variabilei dependente (erorile).


Analiza discriminarii are ca obiect studierea relatiilor dintre o variabila dependenta, masurata nominal, care presupune deci existenta a doua sau mai multor grupuri disjuncte, si un ansamblu de variabile independente, explicative, masurate interval sau proportional. Gruparea subiectilor in doua sau mai multe grupuri mutual exclusive rezulta deci din modalitatile pe care le are variabila nominala. In functie de valorile variabilelor explicative se adopta o regula de decizie privind apartenenta indivizilor la o anumita clasa.[29, p.695-698]


Analiza multivariata a variantei. Analiza variantiei, (ANOVA) care a fost abordata anterior, se poate extinde in mai multe directii:


*  a explicarii mai multor variabile dependente masurate metric, avand in vedere mai multe variabile independente calitative; in acest caz vorbim despre analiza multivariata a variantei (MANOVA)

*  a analizei efectelor variabilelor independente masurate metric si calitativ asupra unei variabile dependente masurata metric; in acest caz avem in vedere analiza covariantei ( ANCOVA)

*  a analizei efectelor mai multor variabile independente masurate mixt (metric si calitativ) asupra mai multor variabile dependente masurate metric; in acest caz se poate vorbi despre analiza multivariata a covariantei (MANCOVA)


Analiza conjoint. Obiectivul general al analizei conjoint este acela de a explica preferintele consumatorilor pentru diferite produse prin caracteristicile sau atributele acelor produse. Rolul specific al analizei conjoint este acela de a studia structura optiunii sau alegerii, adica modul in care atributele produsului sunt percepute de catre consumator si se combina pentru a determina preferinta sa globala. Obiectivul principal este acela de a descompune utilitatea globala a unui produs (a unui obiect sau a unei oferte) cu scopul de a calcula utilitatile partiale ale atributelor.[25, p. 72-74]


Analiza canonica. In esenta, analiza canonica reprezinta o metoda de studiere a legaturilor dintre doua ansambluri de variabile. Cand n indivizi sunt descrisi prin doua multimi de variabile se cauta examinarea corelatiilor existente intre aceste doua multimi cu scopul de a sti daca ele masoara sau nu aceleasi proprietati.[31, p.92]


b. Metodele de analiza a interdependentelor. Aceasta categorie de metode are menirea de a da un inteles unui set de variabile sau de a grupa intr-un anumit mod variabilele. Aceste metode sunt utilizate in identificarea segmentelor de piata sau a grupurilor care sunt cele mai profitabile pentru o firma. In functie de modul de masurare a variabilelor, metodele de analiza a interdependentelor se pot clasifica astfel:

*  cand variabilele sunt masurate metric: analiza in componente principale, clasificarea (analiza grupurilor) si analiza corespondentelor;

*  cand variabilele sunt masurate nemetric: scalarea multidimensionala nemetrica.


Analiza in componente principale. Aceasta metoda are in vedere o restructurare a variabilelor astfel incat un numar mic de variabile sa poata explica o parte importanta a informatiei generata de un numar foarte mare de variabile. Analiza in componente principale consta deci in identificarea, pornind de la un ansamblu de variabile, a unui numar foarte mic de factori care pot sintetiza cea mai mare parte a informatiei totale cuprinse in variabilele initiale. Pentru a extrage factorii dintr-un ansamblu de variabile, se pot utiliza doua proceduri de calcul, numite: analiza in componente principale si analiza factoriala “clasica”.

Analiza in componente principale presupune ca factorii sunt exprimati sub forma unor combinatii liniare de variabile ( dupa cum si variabilele se pot exprima sub forma combinatiilor liniare de factori).[31, p.76-79 ]

Analiza factoriala “clasica” are in vedere faptul ca fiecare variabila se compune din doua parti: una care reprezinta o combinatie liniara de factori comuni si alta care reprezinta eroarea.


Clasificarea (taxonomia) sau analiza grupurilor. Este o metoda ce are in vedere gruparea indivizilor, caracterizati printr-o serie de atribute, intr-un numar restrans de clase omogene. Gruparea este efectuata astfel incat sa se satisfaca simultan doua cerinte: clasele constituite (grupurile) sa fie cat mai omogene, adica indivizii care le vor compune sa fie cat mai asemanatori (similari), iar diferentele dintre clase sa fie cat mai pronuntate, adica indivizii apartinand unor clase diferite sa fie cat mai deosebiti.[23, p.630-631]


Analiza corespondentelor. Obiectivul de baza al analizei corespondentelor il reprezinta studierea simultana a liniilor si coloanelor unui tabel de contingenta cu scopul de a pune in evidenta legaturile sau corespondentele intre cele doua ansambluri de variabile. Sunt doua modalitati principale de realizare a analizei corespondentelor:


*  analiza legaturilor intre cele doua variabile a caror observari le regasim intr-un tabel de contingenta;

*  analiza legaturilor existente intre un ansamblu de variabile (tipuri de raspunsuri ale subiectilor) si un alt ansamblu de variabile calitative cu mai multe modalitati.


Pe langa principalele metode de analiza prezentate anterior, incepand cu cele univariate si terminand cu cele multivariate, cercetarea de marketing face apel si la alte metode, unele din ele deosebit de complexe, iar altele de data recenta, cum ar fi, spre exemplu, analiza variabilelor latente sau neoservabile sau modelele structurale care au ca scop estimarea relatiilor de cauzalitate dintre variabile. Asimilarea acestor metode poate face obiectul unor cursuri post-universitare, iar aplicarea lor in cadrul unor cercetari complexe necesita, de cele mai multe ori, o colaborare intre specialistii din domeniul marketingului cu cei din domeniile statisticii, informaticii, sociologiei, psihologiei si a altor stiinte care se interfereaza cu marketingul.








Politica de confidentialitate



Copyright © 2010- 2021 : Stiucum - Toate Drepturile rezervate.
Reproducerea partiala sau integrala a materialelor de pe acest site este interzisa.

Termeni si conditii - Confidentialitatea datelor - Contact