Alapfogalmak áttekintése
Pszichológiai statisztika, 1. alkalom
Hipotézisek Milyen a jó null hipotézis? ? H0: Léteznek kitőnı tanuló diszlexiások. ? H1: Nem léteznek. Sokkal inkább: H0: Nincs diszlexiás kitőnı tanuló általános iskolában Mo-on. H1: Van. Fontos definiálni, hogy kit tekintünk diszlexiásnak, kitőnı tanulónak és mely populációt vizsgáljuk. ?H0: A taktaharkányi kerti törpe gyárban nincsenek a nık bér tekintetében hátrányosan megkülönböztetve. Sokkal inkább: H0: A taktaharkányi kerti törpe gyárban a nık ugyanannyit keresnek, mint a férfiak. H1: A taktaharkányi kerti törpe gyárban a nık keresete eltér a férfiakétól. Ha minden más tekintetben párhuzamba állítható nıi és férfi csoportot lehet elkülöníteni, az eredeti kérdés is vizsgálható. A jó null hipotézis egyértelmően vizsgálható és tagadása bizonyítható. A null hipotézis állítja, hogy nincs kapcsolat, nincs változás, a vizsgált jelenségek függetlenek, ugyanakkorák.
Hipotézisek A jó alternatív/ellenhipotézis következik a H0 tagadásából, alternatívák nincsenek, éppen ezért egyes kutatók (Harris, 1997 in Vargha, 2000) cáfolják az egyoldali ellenhipotézis létjogosultságát. H0: X antidepresszáns nincs hatással a depressziós betegek állapotára (BDI kérdıíven elért pontszám kezelés után nem változik). H1: X antidepresszáns kedvezı hatással van a depressziós betegek állapotára !!! X antidepresszáns rontja a depressziós betegek állapotát. H0 tagadása (ha H0 megfelelıen valószínőtlen): H1 H0 megtartása: Nem H1 tagadása, hanem H1 tagadása nem bizonyított. Diszlexiás példa: Diszlexiás kitőnı tanulók (ált. isk., Mo.) léte a vizsgált minta alapján nem bizonyított. Kerti törpe gyár példa: A gyárban dolgozó nık és férfiak bére nem tér el szignifikáns mértékben. Antidepresszáns példa: A gyógyszer 95%-os valószínőséggel nem befolyásolja a depressziós betegek állapotát.
Változók Statisztikai változó: A megfigyelési egységek jellemzıi Itt is fontos az egyértelmőség! Egy változó lehet adott kérdésre adott válasz. Pl. ?Ön hazudik-e? a. Igen b. Nem c. Ritkán Inkább: a.Gyakran b. Ritkán c. Soha ?Ön szerint a globális felmelegedés oka… a. a dohányzás b. a gépkocsiforgalom Inkább a. a dohányzás b. a gépkocsiforgalom c. Egyéb, éspedig….. Vagy Ön szerint melyik felelıs leginkább az alább felsoroltak közül a globális felmelegedésért?
Változók Skála típusai: Nominális Milyen cigarettát szív? Ordinális (értékei sorba rendezhetık) Dohányzik? Gyakran, ritkán, soha. Intervallum (értékei sorba rendezhetık, fokozatai azonos mértékő különbséget jelentenek) Dohányzási szokásokat mérı kérdıív alapján a függıség. Arány (értékei sorba rendezhetık, fokozatai azonos mértékő különbséget jelentenek, van abszolút nulla értéke, értelmezhetı az értékek más számokkal való osztása, szorzása) Naponta elszívott cigaretták száma Kvalitatív: Nominális, ordinális. Kvantitatív: Intervallum, arány. Értékek száma alapján: diszkrét (nominális és majdmind ordinális), folytonos (összes többi)
Populáció, minta Fontos tisztázni a megfigyelés egységét. A pszichológiában általában a személy, de lehet az iskola vagy család is. Populáció: A számunkra érdekes megfigyelési egységek összessége, melyekrıl állításokat akarunk megfogalmazni. Minta: A kísérleti vagy vizsgálati egységek összessége. A minta akkor ideális, ha reprezentatív a populációra nézve, ha kellıen nagy és ha véletlen, független mintaválasztást alkalmazunk. A minta kiválasztása lehet random mintavétel vagy önkéntes jelentkezés. Csak random mintavétel esetében következtethetünk a populációra! Megkülönböztetünk kísérletet (kontrollált körülmények) és megfigyelést. Pl. Belsı és külsı motiváció és kreativitás (Teresa Amabile vizsgálata) Ok-okozati összefüggést csak kísérlet esetében lehet levonni, mert lehetnek olyan változók a megfigyelésben, amelyeket nem ismerünk, de a csoportba sorolást és az eredményt is befolyásolják. Pl. A fizikai erı a kerti törpe gyárban hat a teljesítményre és az a fizetésre. Megfigyelés is hasznos: -ok-okozati összefüggés feltárása nem mindig cél (kínai és európai reakciója nyugtatóra) -megalapozhat kísérletet (a szoba színe és a teljesítmény) -ritkán mégiscsak levonható ok-okozati összefüggés (gyermekrablás és PTSD)
Populáció, minta
Csoportba sorolás random (kísérlet)
Csoportba sorolás nem random (megfigyelés)
Random mintavétel
Populációra vonatkozó következtetések
Random mintavétel hiánya
Nem következtethetünk a populációra Ok-okozati következtetés levonható
Ok-okozati következtetés nem vonható le
Randomizálás Mindenki azt mondja, hogy véletlen mintavételt alkalmaz, ill. random módon sorol csoportokba azonban szinte senki nem teszi ezt tökéletesen. 1. Példa : A ruhák fekete színének megırzését vizsgáló mosószerekkel kapcsolatos attitődvizsgálat során 10 üzletben a mosószert vásárlókat kérdıíves módszerrel vizsgálják. 2 probléma 2. Példa: A cél a debreceni munkahelyek tipikus szervezeti struktúrájának vizsgálata. A mintavétel a Debrecen térkép segítségével történik. A véletlenszerően kiválasztott koordinátákhoz legközelebb esı munkahelyeket választják be a mintába. http://travel.yahoo.com/p-map-485339-map_of_debrecen-i 3. Példa: Különbözı munkaterápiák hatásának vizsgálata pszichiátrián kezelt betegekre. A folyosón szembe jövı elsı tíz beteg az udvaron dolgozik, következı tíz iratmegsemmisítést végez, azután következı tíz a konyhán segít.
Mintavétel-hipotézisvizsgálat A populáció: N(2,2), µ=2, σ=2
Számos mintavétel, a mintaátlagokat kiszámoljuk
x1 = 1.6
x2 = 2.3
x3 = 1.8
x4 = 2.1
A mintaátlag a legritkább esetben egyezik a populációátlaggal, viszont jobb híján belıle következtetünk a pop. átlagra. Minél nagyobb a minta annál jobb a közelítés.
Centrális határeloszlás elve: bármely eloszlásból kellıen nagy elemszámú számos mintát véve a paraméterek eloszlása normális lesz. Ez teszi kiemelkedıvé a normális eloszlást.
Normál eloszlás
Egy normál eloszlás sőrőségfüggvénye, Gauss-görbe 2 N(2,2) azaz µ = 2, σ = 2
Normál eloszlás
Mindig szimmetrikus
4 γ 2 = E ( Z ) − 3 csúcsossági együttható mindig 0
Értékei az átlag körüli 3 szórásnyi távolságon belül figyelhetıek meg
Az átlag körüli 2 szórásnyi intervallum tartalmazza az adatok 68%-át 4 szórásnyi intervallum 95%-át 6 szórásnyi intervallum 99.8%-át
Ha a minta elemszám elég nagy, bármely változó értékeibıl kiválasztott véletlen minta átlagának eloszlása megközelíti Centrális határeloszlás elmélet: A populációból vett minták átlagainak eloszlása normális.
Standard normál eloszlás
N(0,1)
Standard normál eloszlás
95% 2.5% -1.96
2.5% 1.96
Z eloszlás, a görbe alatti terület adja egy-egy intervallum valószínőséget
Standard normál eloszlás
Elutasítási tartomány
Megtartási tartomány
-1.96 Kritikus érték
Elutasítási tartomány 1.96 Kritikus érték
Következtetések A releváns következtetésekhez szükséges (lehet): -Kontroll a vizsgálatot esetleg torzító tényezık felett -Kezdeti állapot ismerete A jó következtetés (Occam’s razor) a lehetı legegyszerőbb magyarázattal szolgál (letisztult, leborotválja a sallangokat). Törpegyár: A vezetı szexuális frusztráltságából adódóan hátrányosan megkülönbözteti a nıket. Einstein: A modell legyen olyan egyszerő, amennyire csak lehet, de nem egyszerőbb. Antidepresszáns: Hatással van a depressziós betegekre.
Következtetések
Valóság H0 igaz Döntés H0-t megtartjuk
H0-t elutasítjuk
H0 nem igaz
Következtetések
Valóság H0 igaz
H0 nem igaz
jogos elfogadás
II. fajú hiba
Döntés H0-t megtartjuk
H0-t elutasítjuk
I. fajú hiba
jogos elutasítás
Következtetések Az elsı fajú hiba(α ) meghatározza a szignifikancia szintet, a téves elutasítás valószínőségét. Leggyakoribb értékei 0.05, 0.01. A másodfajú hiba (β ) meghatározza a statisztikai próba erejét (1- β), a kihagyás és indirekt módon a jogos megtartás valószínőségét. Leggyakrabban 0.2. Egyoldali ellenhipotézis esetén beszélhetünk ún. harmadik fajú hibáról (Vargha, 2000). Ez annak valószínősége, hogy H1 és H2 közül rosszul választunk (α /2)
Következtetések és mintanagyság
Amennyiben meghatározható a legkisebb lényeges eltérés a H0-tól ( δ) szakmai szempontok alapján, akkor a szükséges mintanagyság kiszámolható.
N≈
10(1 − β )s 2
δ2
R-ben: power.t.test, power.anova.test A mintanagyság nem változtatható az eredmény fényében!! Túl nagy minta sem jó.
Normál eloszlás és következtetések α = 0.05 esetén megállapíthatjuk (ha H0-t elutasítjuk), hogy az eredmény 5%-os szinten szignifikáns, jelölése (p<0.05). (ha H0-t megtartjuk) α = 0.05-ös szignifikanciaszint mellett H1 nem bizonyított.
α = 0.1 esetén (ha H0-t elutasítjuk) az eredmény 1%-os szinten szignifikáns, jelölése (p<0.01). (ha H0-t megtartjuk) α = 0.1 -ös szignifikanciaszint mellett H1 nem bizonyított.
α = 0.01 tendencia