Egyszempontos variancia analízis
Statisztika I., 5. alkalom
Számos t-próba versus variancia analízis Kreativitás vizsgálata -nık -férfiak ->kétmintás t-próba I. Fajú hiba=α Kreativitás vizsgálata -informatikusok -építészek -színészek ->három kétmintás t-próba I. Fajú hiba=3α Megoldás: Variancia analízis, egyetlen teszt több minta összehasonlítására A variancia analízis szemlélete: függı változó (normális eloszlású): kreativitás független változó (nominális v. ordinális): foglalkozás
Egyszempontos variancia analízis A variancia analízis Ronald A. Fisher nevéhez köthetı. Alkalmazási feltételek: -normális eloszlású, független minták -a szórások azonosak H0: A csoportok kreativitása közt nincs különbség H1: A csoportok kreativitása közt van különbség
µ1 = µ2 = µ3
H0-t elutasítjuk, ha legalább két csoport esetében van különbség.
Egyszempontos variancia analízis Ha H0 igaz, a csoportok átlagai a populáció szintjén megegyeznek, azaz mindhárom átlag azonos átlagot becsül. A becslés hibája kétféleképpen számolható: -csoporton belüli ingadozás: az értékek ingadozása a csoport átlag körül -csoportok közötti ingadozás: a mintaátlagok ingadozása a közös átlag körül Ha H0 igaz, akkor az átlagos csoporton belüli ingadozás és a csoportok közti ingadozás véletlen hiba következménye és nem tér el szignifikánsan egymástól. Ha H0 nem igaz, akkor a csoportok közötti ingadozás nagyobb (becslés hibája + csoportkülönbségekbıl adódó szórás), mint az átlagos csoporton belüli ingadozás.
Egyszempontos variancia analízis (Ábrák a Máth jegyzetbıl)
0.8 0.8
0.6 0.6
0.4 0.4
0.2 0.2
5 5
10
15
20
10
15
20
Egyszempontos variancia analízis Példa a Máth jegyzetbıl: Kígyó fóbiát kezelünk három terápiával: belátás (A), deszenzitizálás(B), elárasztás (C). A három terápia hatásfokát mérjük. A
B
C
13
21
8
16
17
10
10
19
12
H0: Hatásfokuk azonos. H1: Hatásfokuk nem azonos. (Az, hogy valamely terápiának nagyobb a hatásfoka, nem azt jelenti, hogy ez egy jó terápia, csak azt, hogy jobb mint a másik.)
Egyszempontos variancia analízis A csoportátlagok és a közös átlag kiszámítása:
terápia
minta nagyságok csoport átlagok az összes minta-elem átlaga (teljes átlag)
A x11= 13 x12= 16 x13= 10 N1 = 3 x1+ = 13 x++ = 14
B x21= 21 x22= 17 x23= 19 N2 = 3 x2+ = 19
C x31= 8 x32= 10 x33= 12 N3 = 3 x3+ = 10
Egyszempontos variancia analízis Hibavariancia:
csoporton belüli ingadozás csoporton belüli eltérések átlaga négyzetösszeg osztva a szabadságfokkal
N1 − 1 + N 2 − 1 + N 3 − 1
Hozzávetıleg khi-négyzet eloszlású, szabadság fok: N1-1+N2-1+N3-1 Csoport négyzetösszegek vagyis csoporton BELÜLI ingadozás
∑ ( x1i − x1+ ) 2 i
= 18
∑ ( x2 i i
0 2 + 32 + 32 = 18 ∑i ∑k
− x 2+ ) 2 = 8
2 +2 +0 =8 2
2
2
∑ ( x3i i
− x3+ ) 2 = 8
2 +0 +2 =8 2
2
( x − x ) = 18 + 8 + 8 = 34 2
ik
i+
Szabadság fok: n1-1 + n2-1 + n3-1 = 2 + 2 + 2 = 6
2
Egyszempontos variancia analízis Hatásvariancia: csoportok közötti ingadozás csoportátlagok eltéréseinek súlyozott átlaga (súlyozva a mintanagyságokkal) négyzetösszegek osztva a szabadságfokkal Hozzávetıleg khi-négyzet eloszlású, szabadság fok: k-1
Csoportok KÖZÖTTI ingadozás
∑ j
n j ( x j + − x++ ) 2 = 126
Szabadsági fok: 3-1 = 2
Egyszempontos variancia analízis Két varianciaértéket kell összevetnünk. Az F-próba erre szolgál. F-eloszlást követ f1=k-1, f2=N-k szabadságfokkal.
126 Hatásvariancia F= = 2 = 11.12 34 Hibavariancia 6
f1=2, f2=6
A próba szignifikáns eltérést mutat p<0.01, F(2,6). Hol van jelentıs eltérés? Átlagok:13, 19, 10 Erre a kérdésre a választ a post hoc testek adhatják meg.
Páronkénti-, kontraszt- és trendvizsgálatok
A variancia analízisben a csoportok közötti és csoporton belüli variancia összehasonlítása révén a mintaátlagok azonosságát teszteljük. Ha a mintaátlagok a variancia analízis alapján nem azonosak, páronkénti vizsgálatok segítségével deríthetjük ki, hogy mely mintaátlagok különböznek. További lehetıség, hogy egyes mintacsoportokat más mintacsoportokhoz hasonlítsunk, ezt kontrasztvizsgálatnak nevezzük. Ha a független változó legalább intervallum skálát alkot, akkor azt is tesztelhetjük, hogy a mintaátlagok lineárisan vagy kvadratikusan nınek-e, azaz trendvizsgálatot folytathatunk. Ez a probléma szintén kontrasztvizsgálatra vezet.
Páronkénti vizsgálatok -Bonferroni próba: Lényegében t-próbákat végez páronként, de a szignifikancia szintet a vizsgált párok számának megfelelıen alakítja. Az eljárás viszonylag kevés számú pár esetén érvényes -Tukey próba: Nagyszámú pár esetében is alkalmas eljárás. Legjobban azonos mintanagyságnál mőködik. -Dunnett próba: Egy mintát hasonlít az összes többi mintához, pl. kontroll csoport használata esetében kézenfekvı eljárás.
Kontrasztvizsgálatok Példa a Máth jegyzetbıl: Kígyó fóbiát kezelünk három terápiával: belátás (A) deszenzitizálás (B), elárasztás (C). A három terápia hatásfokát mérjük. A
B
C
13
21
8
16
17
10
10
19
12
Vajon az elárasztás hasonlóan jó-e, mint a másik kettı? A (m1) és B minta átlagát (m2) az C csoport átlagához (m3) hasonlítjuk. H0:
m1 + m2 = m3 , azaz H0: m1+m2–2m3=0 2
H0: C terápia hatásfoka azonos a másik kettı átlagos hatásfokával. H1: nem azonosak a hatásfokok. A kontrasztok ekkor: 1, 1, -2
Kontrasztvizsgálatok Az elızıekben tárgyalt probléma gyakorlatilag t-próbára vezet: a súlyozott átlagokat osztani kell a becsült szórással. t=
m1 + m2 − 2m3 k12 k22 k32 sp + + n1 n2 n3
SE = s p
k12 k22 kc2 + + ... + n1 n2 n1
(n1 − 1) s12 + ( n2 − 1) s22 + ... + ( nc − 1) sc2 sp = ( n1 − 1) + (n2 − 1) + ... + (nc − 1) t=
13 + 19 − 20 12 = ≈ 2.39 1 1 4 4.47 2 4.47 + + 3 3 3
f=7 p=0.048
Ugyanezt a problémát variancia analízissel is lehet vizsgálni. Egy n szabadságfokú t-eloszlású változó négyzete egy (1,n) szabadságfokú F- eloszlású változó. Az eredmény azonos lesz. Az F érték a t érték négyzete, a próba valószínőségi értéke pedig ugyan az.
Trendvizsgálatok Példa a Máth jegyzetbıl: A, B és C terápia egy nyugtatóból 50, 100 és 150 mg- napi adagot jelent. A három terápia hatásfokát mérjük. A
B
C
13
21
8
16
17
10
10
19
12
Vajon a hatás lineáris vagy esetleg kvadratikus ütemő javulást idéz-e elı? A hipotéziseknek megfelelı kontrasztokat kell használnunk. A kontrasztok képzésénél fontos, hogy: -lineárisan nınek -összegük nulla legyen
Trendvizsgálatok A kontrasztok mindig a minták számától függenek. Csoportok száma 3 4 5 6 7
Lineáris kontraszt -1, 0, 1 -3,-1, 1, 3 -2, -1, 0, 1, 2 -5, -3, -1, 1, 3, 5 -3, -2, -1, 0, 1, 2, 3
Kvadratikus kontraszt 1, -2, 1 1, -1, -1, 1 2, -1, -2, -1, 2 5, -1, -4, -4, -1, 5 5, 0, -3, -4, -3, 0, 5
Esetünkben tehát: a lineáris kontraszt: H0: -m1+0m2+m3=0, nem növekszik a hatás a gyógyszeradag emelésével H1: Az összeg nem egyenlı nullával, azaz a gyógyszeradag növelése (a vizsgált intervallumon) a hatásfok lineáris növekedéséhez vezet. Szintén t-próbára vezet.
t=
−13 + 10 −3 = ≈ −0.80 1 1 2 2.81 + 2.81 3 3 3
f=7 p=0.45
Lineáris regresszióval szintén a lineáris összefüggést vizsgáljuk.