Statisztika 1 el˝oad´as Baran S´andor
2016/17 tan´ev, 1. f´el´ev
1 / 189
Irodalom I
Hunyadi L´aszl´o., Vita L´aszl´ o: Statisztika I. Aula Kiad´o, Budapest, 2008.
I
Hunyadi L´aszl´o, Vita L´aszl´ o: Statisztika II. Aula Kiad´o, Budapest, 2008.
I
Kereszt´ely Tibor, Sug´ar Andr´as, Szarvas Beatrix: Statisztika k¨ozgazd´aszoknak. P´eldat´ar ´es feladatgy˝ ujtem´eny. Nemzeti Tank¨onyvkiad´o, Budapest, 2005.
I
Fazekas Istv´an: Val´ osz´ın˝ us´egsz´am´ıt´as. Egyetemi Kiad´o, Debrecen, 2009.
I
Denkinger G´eza: Val´ osz´ın˝ us´egsz´am´ıt´as gyakorlatok. Nemzeti Tank¨onyvkiad´o, Budapest, 2008.
Syllabus, eredm´enyek, inform´aci´ok arato.inf.unideb.hu/baran.sandor/mischu.html 2 / 189
Tartalom Alapfogalmak Sokas´ag egy ism´erv szerinti le´ır´asa Sokas´ag t¨obb ism´erv szerinti le´ır´asa ¨ Osszehasonl´ ıt´as standardiz´al´assal ´es indexsz´am´ıt´assal Mintav´etel Pontbecsl´esek ´es tulajdons´agaik Nagy sz´amok t¨orv´enyei Intervallumbecsl´esek Hipot´ezisvizsg´alat
3 / 189
Mi a statisztika? A statisztika olyan gyakorlati tev´ekenys´eg , illetve tudom´anyos m´odszertan, amely arra szolg´al, hogy a val´ os´ag t´enyeinek nagy t¨omeg´et t¨om¨oren, sz´amszer˝ uen jellemezze. I I
Gyakorlati tev´ ekenys´ eg: alapadatokat gy˝ ujt, feldolgoz, elemez, majd k¨ozz´eteszi ezek eredm´eny´et. Tudom´ anyos m´ odszertan: az elemz´eshez sz¨ uks´eges megfontol´asok, elj´ar´asok megad´asa.
A statisztika mindig a t´enyek valamilyen nagy – esetleg v´egtelen nagy – t¨omeg´er˝ol igyekszik t¨ om¨ or, sz´amszer˝ u k´epet adni. P´ elda Az alkalmaz´asban ´all´ok l´etsz´ama a nemzetgazdas´agban 2016. j´ unius-j´ ulius: 2767.5 ezer f˝ o. P´enz¨ ugyi, biztos´ıt´asi tev´ekenys´eg: 61.6 ezer f˝ o. Az alkalmaz´asban ´all´ok havi brutt´ o munkaj¨ ovedelme a nemzetgazdas´agban 2016. j´ unius-j´ ulius: 271 280 Ft. P´enz¨ ugyi, biztos´ıt´asi tev´ekenys´eg: 554 719 Ft. Forr´as: KSH 5 / 189
A val´os´ag jellemezni k´ıv´ant t´enyei bizonyos egys´egekhez k¨othet˝oek. P´ elda I
Az alkalmaz´asban ´all´ ok.
I
Adott id˝oszakban Magyarorsz´agra ´erkez˝ o k¨ ulf¨oldiek.
A vizsg´alat t´argy´anak egyedeir˝ ol szerzett, megfelel˝o m´odon r¨ogz´ıtett k¨ ul¨onf´ele inform´aci´ okat alapadatoknak, m´as n´even elemi adatoknak nevezz¨ uk. Az alapadatok nem felt´etlen¨ ul sz´amszer˝ uek. A vizsg´alt egys´egek bizonyos k¨ or´et ¨ osszess´eg´eben jellemz˝o sz´amszer˝ u inform´aci´okat ´altal´anoss´agban adatoknak, bizonyos speci´alis esetekben pedig mutat´osz´amoknak h´ıvjuk. A mutat´ osz´am elnevez´es t¨obbnyire a szabv´anyos´ıtott tartalm´ u, egy-egy jelens´eg jellemz´es´ere visszat´er˝oen haszn´alt sz´amszer˝ u inform´aci´ ok megjel¨ol´es´ere szolg´al. A tov´abbiakban adatok ´es mutat´ osz´amok helyett csak adatokat fogunk emlegetni. 6 / 189
P´eld´ak Alapadatok I
A Magyarorsz´agra ´erkez˝ o k¨ ulf¨ oldiek nemzetis´ege.
I
A Magyarorsz´agra ´erkez˝ o k¨ ulf¨ oldiek ´eletkora.
I
A Magyarorsz´agra ´erkez˝ o k¨ ulf¨ oldiek itt-tart´ ozkod´asi ideje.
Adatok I
Egy adott id˝oszak alatt Magyarorsz´agra ´erkez˝o k¨ ulf¨oldiek sz´ama (2015-ben 48 345 ezer f˝ o).
I
Egy adott id˝oszak alatt Magyarorsz´agra ´erkez˝o k¨ ulf¨oldiek ¨osszes p´enzk¨olt´ese (2015-ben 1 607 668 milli´ o Ft).
Mutat´ ok I
Egy idel´atogat´o k¨ ulf¨ oldi napi ´atlagok p´enzk¨ olt´ese (2015-ben 13.4 ezer Ft).
I
Az vend´eg´ejszak´ak ´atlagos sz´ama (2015-ben 2.5 ´ejszaka).
Fontosak a m´ert´ekegys´egek! 7 / 189
Sokas´agok A vizsg´alat t´argy´at k´epez˝ o egys´egek ¨ osszess´eg´et, halmaz´at statisztikai sokas´agnak, r¨oviden sokas´agnak (popul´aci´ onak) nevezz¨ uk. A sokas´ag egys´egei k¨ ul¨onf´ele tulajdons´agaik megad´as´aval jellemezhet˝ok. E tulajdons´agok egy r´esze a sokas´ag minden egys´eg´ere n´ezve k¨oz¨os, m´as r´esze azonban nem. Egy sokas´ag megadhat´ o: I egys´ egeinek felsorol´as´aval; I eloszl´ as´aval. Sokas´agok t´ıpusai, I.: I Diszkr´ et, pl. a magyar n´epess´eg 2016. janu´ar 1.-´en (9 830 485 f˝o); 2015-ben Magyarorsz´agra ´erkez˝ o k¨ ulf¨oldiek sz´ama (48 345 ezer f˝o). I Folytonos, ¨ onk´enyesen elk¨ ul¨ on´ıthet˝ o egys´egek, pl. 2014 teljes b´ uzaterm´ese (5 261 890 tonna); a belf¨ old¨ on k¨oz´ uton sz´all´ıtott ´aruk mennyis´ege 2015-ben (158 490 tonna). I Fikt´ ıv, valamilyen eloszl´assal megadott, pl. 2017 lehets´eges b´ uzaterm´es eredm´enyei.
8 / 189
Sokas´agok Sokas´agok t´ıpusai, II.: ´ o, azaz valamely id˝ I All´ opontra vonatkozik (stock), pl. a magyar n´epess´eg 2016. janu´ar 1.-´en; az IK beiratkozott hallgat´oi 2016. szeptember 22.-´en. I
Mozg´o, azaz valamely id˝ otartamra ´ertend˝ o (flow), pl. 2014 teljes b´ uzaterm´ese; a belf¨ old¨ on k¨ oz´ uton sz´all´ıtott ´aruk mennyis´ege 2015-ben; az IK hallgat´ oi ´altal a 2015/16 tan´ev 2. f´el´ev´enek szorgalmi id˝ oszak´aban elfogyasztott s¨ or mennyis´ege.
Sokas´agok t´ıpusai, III.: I
V´eges, pl. a magyar n´epess´eg 2016. janu´ar 1.-´en.
I
V´egtelen, pl. 2017 lehets´eges b´ uzaterm´es eredm´enyei.
9 / 189
Sokas´agok Aggerg´alt sokas´ag: k¨ ul¨ onf´ele dolgokb´ ol elfogyasztott/felhaszn´alt term´ekek vagy szolg´altat´asok ¨ ossz´ert´eke. Pl. Magyarorsz´ag teljes exportja 2015-ben (28 013.5 milli´ard forint); az IK hallgat´oi ´altal a 2015/16 tan´ev 2. f´el´ev´enek szorgalmi id˝ oszak´aban elfogyasztott alkoholtartalm´ u italok ¨ossz´ert´eke. Az aggreg´alt sokas´ag nagys´aga (aggreg´atum): A=
n X
qi pi =
i=1
n X
νi
i=1
qi : az i-edik fajta egys´egeinek mennyis´ege valamilyen alkalmas m´ert´ekegys´egben; pi : az i-edik fajta egys´eg egys´eg´ara; νi : az i-edik fajta egys´egek ¨ ossz´ert´eke; n: az egys´egek sz´ama. 10 / 189
Ism´ervek Az ism´ervek olyan vizsg´alati szempontok, melyek alapj´an a sokas´ag r´eszekre bonthat´o. A sokas´ag egys´egeinek valamely adott szempont szerint lehets´eges tulajdons´agait ism´ervv´altozatoknak nevezz¨ uk. Ha sz´amszer˝ uek az ism´erv v´altozatok, akkor ezeket ism´erv´ert´ekeknek, mag´at az ism´evet pedig v´altoz´ onak nevezz¨ uk. Az ism´ ervek fajt´ ai I
ter¨ uleti, pl. lakhely, sz¨ ulet´esi hely;
I
id˝obeli, pl. sz¨ ulet´esi id˝ o, munk´aba ´all´as id˝ opontja;
I
min˝os´egi, pl. nem, foglalkoz´as;
I
mennyis´egi, pl. ´eletkor, testmagass´ag, testt¨ omeg, tanulm´anyi ´atlag.
11 / 189
M´er´esi sk´al´ak Ism´ervv´altozatok ´atk´odolhat´ oak sz´amokk´a. Csak olyan m˝ uveletek megengedettek, amik az eredeti v´altozatokkal is. M´ er´ esi szintek I
Nomin´alis: csak az vizsg´alhat´ o, k´et ´ert´ek egyenl˝o-e, pl. n´ev, lakhely, foglalkoz´as. Nincs m´ert´ekegys´ege.
I
Ordin´alis: csak az ´ert´ekek sorendje sz´am´ıt, t´avols´aga nem, pl. vizsgajegyek, v´egzetts´eg. Nincs m´ert´ekegys´ege.
I
K¨ ul¨onbs´egi: az ´ert´ekek k¨ ul¨ onbs´ege is inform´aci´ot hordoz, de az ar´anyuk nem, pl. h˝ om´ers´eklet. A sk´ala kezd˝opontja ¨onk´enyes (Celsius, Kelvin, Fahrenheit fok), van m´ert´ekegys´ege.
I
Ar´any: kezd˝opont egy´ertelm˝ uen adott, az ar´any is ´ertelmezhet˝o, pl. havi j¨ovedelem, testmagass´ag. Van m´ert´ekegys´ege.
12 / 189
P´elda Sokas´ ag
A Mordorba ir´ anyul´ o idegenforgalom a harmadkor 3018. ´ev´eben
A Galaktikus Birodalom n´epess´ege YU1 4-ben
1
Egy konkr´et egys´eg
Zs´ akos Frod´ o
Ism´erv ´ allampolg´ ars´ ag tart´ ozkod´ asi id˝ o (nap) ´eletkor (´ev) u ´tit´ arsak sz´ ama ig´enybe vett sz´ all´ asfajta faj nem
Ism´ervv´ altozat megyelak´ o
Ism´ervfajta min˝ os´egi
M´er´esi sk´ ala nomin´ alis
7
mennyis´egi
ar´ any
50 2
mennyis´egi mennyis´egi
ar´ any ar´ any
szabad ´eg alatt ember f´erfi
min˝ os´egi
nomin´ alis
min˝ os´egi min˝ os´egi (alternat´ıv) ter¨ uleti
nomin´ alis nomin´ alis
id˝ obeli ter¨ uleti mennyis´egi min˝ os´egi
intervallum nomin´ alis ar´ any nomin´ alis
Luke Skywalker
sz¨ ulet´esi hely sz¨ ul. id˝ o anyabolyg´ o ´eletkor (´ev) foglalkoz´ as
Polis Massa bolyg´ o YE1 19 Tatuin 24 Jedi lovag
nomin´ alis
YE ill. YU: a yavini csata (a Hal´ alcsillag megsemmis´ıt´ese) el˝ ott ill. ut´ an. 13 / 189
Hib´ak A statisztikai adatok, mutat´ osz´amok c´elszer˝ u megad´asi m´odja: A±a A: k¨ozel´ıt˝o ´ert´ek. a: abszol´ ut hibakorl´at. A − a ≤ val´ odi ´ert´ek ≤ A + a Relat´ıv hibakorl´at: α = a/A. P´ elda Magyarorsz´ag n´epess´ege 2016. janu´ar 1.-´en: 9 830 ezer f˝o. A = 9830, a = 0.5, α = 0.5/9830 ≈ 0.00005 = 0.005%. K´et k¨ozel´ıt˝o ´ert´ek ¨osszeg´enek vagy k¨ ul¨ onbs´eg´enek abszol´ ut hibakorl´atja a megfelel˝o abszol´ ut hibakorl´atok ¨ osszege. K´et k¨ozel´ıt˝o ´ert´ek szorzat´anak vagy h´anyados´anak relat´ıv hibakorl´atja nagyj´ab´ol a megfelel˝o relat´ıv hibakorl´atok ¨ osszege. 14 / 189
Statisztikai alapm˝uveletek I. A sokas´ ag jellemz´ ese valamely erre alkalmas adattal vagy mutat´ osz´ ammal. A sokas´aghoz hozz´arendel¨ unk egy annak eg´esz´et jellemz˝o adatot, pl. a nagys´ag´at, ´atlag´at, v´arhat´ o ´ert´ek´et. ¨ II. Osszehasonl´ ıt´ as. Egy adott jelens´eg id˝obeli alakul´as´ar´ ol, ter¨ uleti elt´er´eseir˝ol, vagy egym´ashoz valamilyen m´ odon kapcsol´ od´ o jelens´egek viszony´ar´ol ad sz´amszer˝ u inform´aci´ot. Fontos, hogy az adatok ¨ osszehasonl´ıthat´oak legyenek. Az adatokb´ol k´epezhet¨ unk k¨ ul¨ onbs´egeket vagy h´anyadosokat. Az alkalmaz´ asban ´ all´ ok havi brutt´ o´ atlagkeresete ´ Ev 2010 2011 2012 2013 2014 Kereset (Ft) 202525 213094 223060 230714 237695 El˝ oz˝ o ´ev=100% 101.3 105.2 104.7 103.4 103.0
2015 247924 104.3 15 / 189
T¨obb sokas´ag adatainak ¨osszehasonl´ıt´asa A sokas´ agok viszonya egym´ ashoz Id˝ oben ´es/vagy t´erben k¨ ul¨ onb¨ oz˝ o sokas´ agok
Id˝ oben ´es/vagy t´erben k¨ ul¨ onb¨ oz˝ o aggreg´ alt sokas´ agok Id˝ oben ´es/vagy t´erben azonos, de k¨ ul¨ onb¨ oz˝ o fajta egys´egekb˝ ol ´ all´ o sokas´ agok
A sokas´ agok adatainak felsorol´ as´ ara h´ anyados´ ara haszn´ alt elnevez´es o ¨sszehasonl´ıt´ o sor o ¨sszehasonl´ıt´ o vi(id˝ osor/ter¨ uleti sor) szonysz´ am (dinamikus viszonysz´ am ter¨ uleti o ¨sszehasonl´ıt´ o viszonysz´ am) o ¨sszehasonl´ıt´ o sor index(sz´ am) (id˝ osor/ter¨ uleti sor) (ter¨ uleti/id˝ obeli)
–
intenzit´ asi viszonysz´ am
A h´ anyados m´ert´ekegys´ege –, illetve %
–, illetve %
a k´et adat m´ert´ekegys´eg´enek h´ anyadosa
Hunyadi, Vita (2008, 1.4 t´ abl´ azat) 16 / 189
P´elda Sorsz´ am 1. 2. 3. 4. 5.
Megnevez´es Alkalmazottak ´evi ´ atl. sz´ ama Ebb˝ ol: fizikai foglalkoz´ as´ u Feldolgozott cukorr´epa Cukortermel´es Fizikai foglalkoz´ as´ uak ´ altal teljes´ıtett munka´ or´ ak sz´ ama
M´ert´ekegys´eg
2005
2006
f˝ o f˝ o 1000 t 1000 t 1000 h
307 261 650 85 520
236 208 475 70 360
Dinamikus viszonysz´ am (2005=100) 76.9 79.7 73.1 82.4 69.2
Hunyadi, Vita (2008, 1.5 t´ abl´ azat)
Intenzit´ asi viszonysz´ amok 650 ezer t I Termel´ ekenys´eg 2005: 520 ezer h = 1.25 t/h. I Egy fizikai dolgoz´ ora es˝ o munka´ or´ak sz´ama 2005 ill. 2006: 360 ezer h 520 ezer h o ill. 208 f˝o = 1730.8 h/f˝o 261 f˝ o = 1992.3 h/f˝ Dinamikus viszonysz´ am I Egy fizikai dolgoz´ o munka´ or´ainak v´altoz´asa: 1730.8 h/f˝ o 1992.3 h/f˝ o = 0.8687 = 86.87% 17 / 189
Statisztikai alapm˝uveletek III. Oszt´ alyoz´ as. Valamely adott sokas´ag egy vagy t¨ obb ism´erv szerinti tagol´asa, oszt´alyoz´asa. A csoportok valamilyen szempontb´ ol homog´enebbek, mint az eg´esz sokas´ag. Oszt´alyok: az oszt´alyoz´as sor´an kapott csoportok. Csoportk´epz˝o ism´erv(ek): az oszt´alyok elhat´arol´as´ara szolg´al´o ism´erv(ek). P´ elda. Az ´evfolyam oszt´alyoz´asa a Mikro¨ okon´ omia jegyei alapj´an. Elv´ ar´ asok egy oszt´ alyoz´ assal szemben: I legyen teljes; I legyen ´ atfed´esmentes; I eredm´ enyezzen homog´en oszt´alyokat. N´omenklat´ ura: szabv´anyos´ıtott oszt´alyoz´asi rendszer. Foglalkoz´asok Egys´eges Oszt´alyoz´asi Rendszere (FEOR’08). 10 f˝ ocsoport, 42 csoport, 136 alcsoport, 632 foglalkoz´as. 18 / 189
Csoportos´ıt´o sor
Ci : fi : k: N:
Oszt´aly C1 C2 .. .
Egys´egek sz´ama f1 f2 .. .
Ci .. .
fi .. .
Ck ¨ Osszesen
fk N
az i-edik oszt´aly azonos´ıt´ oja (i = 1, 2, . . . , k); az i-edik oszt´aly gyakoris´aga; az oszt´alyok sz´ama, ´alt. k a legkisebb eg´esz, melyre 2k ≥ N; P a sokas´ag nagys´aga. N = ki=1 fi .
Oszt´aly m´asik elnevez´ese: r´eszsokas´ag. Akkor haszn´aljuk, ha az oszt´alyokat k¨ ul¨on is tov´abb akarjuk vizsg´alni. 19 / 189
Kombin´aci´os (kontingencia) t´abla Az X ism´erv szerinti oszt´alyok C1x C2x .. . Cix .. .
Az Y ism´erv szerinti C1Y C2Y . . . CjY f11 f12 . . . f1j f21 f22 . . . f2j .. .. .. . . ... . fi1 fi2 . . . fij .. .. .. . . ... .
Cx Pr i
fr 1 f·1
fr 2 f·2
... ...
frj f·j
oszt´alyok . . . CcY . . . f1c . . . f2c .. ... . ... ... ... ...
P
j
f1· f2· .. .
fic .. .
fi· .. .
frc f·c
fr · N
CiX : az X szerinti i-edik oszt´aly azonos´ıt´ oja (i = 1, 2, . . . , r ); Y Cj : az Y szerinti j-edik oszt´aly azonos´ıt´ oja (j = 1, 2, . . . , c); fij : azon elemek sz´ama, melyek mind CiX , mind pedig CjY elemei; r , c: az X illetve Y szerinti oszt´alyok sz´ama. c r c r r X c X X X X X fij = fi· , fij = f·j , f·j = fi· = fij = N. j=1
i=1
j=1
i=1
i=1 j=1
20 / 189
Viszonysz´amok A viszonysz´am k´et adat h´anyadosa: V = A/B. V : viszonysz´am; A: a viszony´ıt´as t´argya; B: a viszony´ıt´as alapja. A = B · V,
B = A/V .
T´ıpusai I Dinamikus: id˝ osorok adataib´ ol sz´am´ıtott h´anyadosok. I Intenzit´ asi: k´et egym´assal kapcsolatban l´ev˝ o, de nem felt´etlen¨ ul azonos fajta egys´egekb˝ ol ´all´ o sokas´ag nagys´ag´ab´ol k´epzett h´anyadosok. I Megoszl´ asi: valamely sokas´agr´esznek az eg´eszhez viszony´ıtott nagys´ag´at mutatja. 21 / 189
P´elda A magyar lak´as´allom´any megoszl´asa (ezer) adott ´ev janu´ar 1.-´en Szob´ak sz´ama 1 2 3 ´es t¨ obb ¨ Osszesen
1980 973 1720 849 3542
1990 645 1681 1527 3853
2016 456 1679 2285 4420 Forr´ as: KSH
Szob´ ak sz´ ama 1 2 3 ´es t¨ obb ¨ Osszesen
Sz´ azal´ekos megoszl´ as 1980 1990 2016 27.5 16.7 13.3 48.6 43.6 38.0 23.9 39.6 51.7 100 100 100
1990. ´evi 2016. ´evi ´ allom´ any (1980=100) 66.3 46.9 97.7 97.6 179.9 269.1 108.8 124.8
2016. ´evi ´ allom´ any (1990=100) 70.7 99.9 149.6 114.7
22 / 189
Dinamikus viszonysz´ amok kett˝ on´ el t¨ obb adat eset´ en Y1 , Y2 , . . . , Yt , . . . , Yn : az id˝ osor adatai. B´azisviszonysz´am: bt = Yt /Yb , L´ancviszonysz´am: `t = Yt /Yt−1 ,
t = 1, 2, . . . , n. t = 2, 3, . . . , n.
I
Egym´ast k¨ovet˝o b´azisviszonysz´amok h´anyadosa: bt /bt−1 = Yt /Yb : Yt−1 /Yb = Yt /Yt−1 = `t .
I
´ b´azisra (pl. Yb -r˝ Uj ol Yc -re) val´ o ´att´er´es: bt /bc = Yt /Yb : Yc /Yb = Yt /Yc .
I
L´ancviszonysz´amok szorzata: `1 · `2 · . . . · `k =
I
Yb+1 Yb+2 Yb+k Yb+k · · ... · = = bb+k . Yb Yb+1 Yb+k−1 Yb
K´et ugyanazon id˝ oegys´egre vonatkoz´ o b´azisviszonysz´amsor h´anyadosa: At /Ab : Bt /Bb = At /Bt : Ab /Bb = Vt /Vb . 23 / 189
P´elda A h´azi gyerekorvosi betegell´at´as adatai 2005–2009 ´ Ev 2005 2006 2007 2008 2009
H´ azi gyerekorvosok sz´ ama (f˝ o) 1571 1557 1554 1559 1548
Bejelentkezett lakosok sz´ ama (ezer f˝ o) 1475.5 1474.2 1461.3 1463.4 1452.3
Betegforgalom (ezer eset) 9634.4 9856.7 9676.1 9780.6 10284.2
Forr´ as: KSH
A h´azi gyerekorvosi betegell´at´as id˝ obeli v´altoz´asa
´ Ev
Orvosok sz´ ama
2005 2006 2007 2008 2009
100.0 99.1 98.9 99.2 98.5
Bejelentkezettek sz´ ama 2005=100 100.0 99.9 99.0 99.2 98.4
Betegforgalom
Orvosok sz´ ama
100.0 102.3 100.4 101.5 106.7
– 99.1 99.8 100.3 99.3
Bejelentkezettek sz´ ama El˝ oz˝ o´ ev=100 – 99.9 99.1 100.1 99.2
Betegforgalom – 102.3 98.2 101.1 105.1 24 / 189
P´elda A h´azi gyerekorvosi betegell´at´ast jellemz˝ o intenzit´asi viszonysz´amok ´ Ev 2005 2006 2007 2008 2009
Egy h´ azi gyerekorvosra jut´ o bejelentkezett betegforgalom lakos (f˝ o) (eset) 939 6132 947 6331 940 6227 939 6274 938 6644
Sz´ azezer bejelentkezett lakosra jut´ o h´ azi gyerekorvos 106.5 105.6 106.3 106.5 106.6
Egy lakosra jut´ o betegforgalom (eset) 6.53 6.69 6.62 6.68 7.08
Az el˝oz˝o t´abl´azatb´ol sz´amolt dinamikus viszonysz´amok
´ Ev
2005 2006 2007 2008 2009
Egy h´ azi gyerekorvosra jut´ o bejelentkezett betegforgalom lakos (f˝ o) (eset) 2005 el˝ oz˝ o´ ev 2005 el˝ oz˝ o´ ev =100 =100 =100 =100 100.0 – 100.0 – 100.9 100.9 103.2 103.2 100.1 99.3 101.5 98.4 100.0 99.9 102.3 100.8 99.9 99.9 108.3 105.9
Sz´ azezer bejelentkezett lakosra jut´ o h´ azi gyerekorvos 2005 el˝ oz˝ o´ ev =100 =100 100.0 – 99.2 99.2 99.8 100.7 100.0 100.2 100.1 100.1
Egy lakosra jut´ o betegforgalom (eset) 2005 el˝ oz˝ o´ ev =100 =100 100.0 – 102.5 102.5 101.4 99.0 102.3 100.9 108.4 106.0 25 / 189
Grafikus ´abr´azol´as
Id˝osorok ´abr´azol´asa: vonaldiagram Mennyis´egi ism´ervek kapcsolata: pontdiagram Szerkezeti megoszl´as ´abr´azol´asa: osztott k¨ or-, oszlop vagy szalagdiagram. Mennyis´egi ism´erv eloszl´as´anak ´abr´azol´asa: hisztogram.
26 / 189
Mennyis´egi sorok Y : mennyis´egi ism´erv; N: a sokas´ag elemsz´ama; Y1 , Y2 , . . . , YN : az Y ism´erv v´altozatai, amik k¨ ul¨onbs´egi, vagy ar´any sk´al´an m´ert sz´am´ert´ekek. Diszkr´et: csak megsz´aml´alhat´ o sz´amoss´ag´ u ´ert´eket vehet fel. Valamilyen sz´aml´al´as eredm´enye, pl. h´aztart´as nagys´aga, csal´adban l´ev˝o g´epj´arm˝ uvek sz´ama. Megadhat´ o a pontos ´ert´eke. Folytonos: kontinuum sz´amoss´ag´ u ´ert´eket vehet fel. Valamilyen m´er´es eredm´enye, pl. a h´aztart´as ¨ osszj¨ ovedelme, a csal´adban l´ev˝o ´ g´epj´arm˝ uvek ¨ossz´ert´eke. Ert´eke csak bizonyos pontoss´agra kerek´ıtve adhat´o meg. Ha a diszkr´et ism´erv nagyon sok ´ert´eket vehet fel, kezelhetj¨ uk folytonosk´ent, pl. nagyv´arosok n´epess´ege. A rangsor a megfigyel´esi egys´egekhez tartoz´ o Yi ism´erv´ert´ekeknek az Yi monoton nemcs¨ okken˝ o sorrendj´eben t¨ ort´en˝ o felsorol´asa. A ∗ rangsor i-edik tagj´at Yi -gal jel¨ olj¨ uk. 28 / 189
Gyakoris´agi sor Az Y szerint k´epzett oszt´ aly als´ o hat´ ara fels˝ o hat´ ara Y10 Y11 Y20 Y21 .. .. . . Yi1 Yi0 .. .. . . Yk1 Yk0 ¨ Osszesen
Oszt´ alyk¨ oz´ep Y1 Y2 .. . Yi .. . Yk –
Abszol´ ut Relat´ıv gyakoris´ ag f1 g1 f2 g2 .. .. . . fi gi .. .. . . fk gk N 1
Yi0 ´es Yi1 : az Y ism´erv szerint k´epzett Ci oszt´aly hat´arai. Egybe is eshetnek. Oszt´alyk¨oz¨os gyakoris´agi sor: Yi0 ´es Yi1 nem esik egybe. fi : a Ci oszt´aly gyakoris´aga. gi = fi /N: a Ci oszt´aly relat´ıv gyakoris´aga. Yi = Yi0 + Yi1 /2: oszt´alyk¨ oz´ep. 29 / 189
Gyakoris´agi sor a) Y diszkr´et ´es kev´es ´ert´eket vesz fel. P´ elda 405 szem´elyg´epkocsi hengersz´am szerinti megoszl´asa. A hengerek sz´ ama (darab) Yi 3 4 5 6 8 ¨ Osszesen
sz´ ama fi 4 207 3 84 107 405
A szem´elyg´epkocsik sz´ azal´ekos megoszl´ asa gi 1.0 51.1 0.8 20.7 26.4 100
A rangsor egy´ertelm˝ uen fel´ırhat´ o.
30 / 189
Gyakoris´agi sor b) Y folytonos vagy diszkr´et ´es sok ´ert´eket vesz fel. P´ elda Magyarorsz´ag v´arosainak n´epess´egsz´am szerinti megoszl´asa, 2006. janu´ar 1. (Hunyadi, Vita, 2008, 2.3. t´abl´azat).
A n´ epess´ eg sz´ ama (f˝ o) 1001 – 5000 5001 – 10000 10001 – 20000 20001 – 40000 40001 – 70000 70001 – 110000 110001 – 160000 160001 – 210000 ¨ Osszesen
Oszt´ alyk¨ oz hossz´ us´ ag 4000 5000 10000 20000 30000 40000 50000 50000 –
sz´ ama 56 95 76 39 11 5 3 3 288
sz´ am´ anak megoszl´ asa 19.4 33.0 26.4 13.5 3.8 1.7 1.0 1.0 99.8
A v´ arosok n´ epess´ eg´ enek sz´ ama (f˝ o) 199629 685534 1078313 1088993 622350 436468 400349 541758 5053394
n´ epess´ eg´ enek megoszl´ asa 4.0 13.6 21.3 21.5 12.3 8.6 7.9 10.7 99.9
Oszt´alyk¨ozhossz: hi = Yi1 − Yi0 Ha Y10 ´es/vagy Yk1 nem ismert, akkor ´ertelmesen megbecs¨ ulj¨ uk. 31 / 189
´ ek¨osszegsor Ert´ Az ´ert´ek¨osszegsor az Y ism´erv alapj´an kialak´ıtott oszt´alyokhoz az egyes oszt´alyokba tartoz´ o egys´egekn´el fell´ep˝ o ism´erv´ert´ekek Si -vel jel¨olt ¨osszeg´et rendeli hozz´a. Si =
X
Y,
i = 1, 2, . . . , k.
Yi0 ≤Y ≤Yi1
Si : t´enyleges ´ert´ek¨osszeg. Ha Yi0 = Yi = Yi1 , akkor Si = fi · Yi . Oszt´alyk¨oz¨os gyakoris´agi sor – becs¨ ult ´ert´ek¨ osszeg. Sei = fi · Yi ,
i = 1, 2, . . . , k.
Relat´ıv ´ert´ek¨osszeg: Si Zi = Pk
i=1 Si
vagy
Sei Zei = Pk . e i=1 Si 32 / 189
P´elda T´enyleges ´es becs¨ ult ´ert´ek¨ osszegek. A n´ epess´ eg sz´ ama 1001 – 5000 5001 – 10000 10001 – 20000 20001 – 40000 40001 – 70000 70001 – 110000 110001 – 160000 160001 – 210000 ¨ Osszesen
fi 56 95 76 39 11 5 3 3 288
Yi 3000 7500 15000 30000 55000 90000 135000 185000 –
Sei = fi Yi 168000 712500 1140000 1170000 605000 450000 405000 555000 5205500
Zei 3.23 13.69 21.90 22.48 11.62 8.64 7.78 10.66 100.00
Si 199629 685534 1078313 1088993 622350 436468 400349 541758 5053394
Zi 3.95 13.56 21.34 21.55 12.32 8.64 7.92 10.72 100.00
Hunyadi, Vita, (2008, 2.6. t´ abl´ azat)
Kumul´ al´ as Gyakoris´agok, ´ert´ek¨osszegek: fi 0 =
Pi
j=1 fj ,
Si0 =
Pi
j=1 Sj
.
33 / 189
Kvantilisek Az Yi/k i-edik k-adrend˝ u kvantilis az a sz´am, amelyn´el az ¨osszes el˝ofordul´o ism´erv´ert´ek legfeljebb i/k-ad r´esze kisebb ´es legfeljebb (1 − i/k)-ad r´esze nagyobb, ahol k ≥ 2, i = 1, 2, . . . , k − 1. Az i/k helyett tetsz˝oleges 0 < p < 1 szerepelhet. k 2 4 5 10 100
Elnevez´es medi´an kvartilis kvintilis decilis percentilis
Jel¨ ol´es Me Qi Ki Di Pi
Lehets´eges kvantilisek Me Q1 , Q2 , Q3 K1 , K2 , K3 , K4 D1 , D2 , . . . , D9 P1 , P2 , . . . , P99
Y1∗ , Y2∗ , . . . , YN∗ : rangsor sp = p(N + 1). Ha sp ∈ Z: Yp = Ys∗p . Ha sp ∈ 6 Z: Yp = Y[s∗p ] + {sp } Y[s∗p ]+1 − Y[s∗p ] . 34 / 189
P´elda N´eh´ any als´ o k¨ oz´epkateg´ ori´ as szem´elyg´epkocsi vegyes fogyaszt´ asa.
Teljes´ıtm´ eny (LE) Fogyaszt´ as (l/100km)
Teljes´ıtm´ eny (LE) Fogyaszt´ as (l/100km)
Kia cee’d 1.4 CVVT 100 6.0 Mazda 3 1.6 MZR 105 6.5
Citro¨ en C4 1.4 Vti 95 6.1 Opel Astra 1.4 Ecotec 100 5.5
Ford Focus 1.6 Ti-VCT 105 5.9 Renault M´ egane 1.6 100 6.7
Honda Civic 1.4i 100 5.4 Volkwagen Golf 1.2 TSI 105 5.7
Forr´ as: Az Aut´ o, 2012/9.
Rangsor: 5.4, 5.5, 5.7, 5.9, 6.0, 6.1, 6.5, 6.7 Als´ o kvartilis: p = 1/4, sp = 9/4, [sp ] = 2, {sp } = 0.25. Q1 = 5.5 + 0.25(5.7 − 5.5) = 5.55. Medi´ an: p = 1/2, sp = 9/2, [sp ] = 4, {sp } = 0.5. Q2 = Me = 5.9 + 0.5(6.0 − 5.9) = (5.9 + 6.0)/2 = 5.95. Fels˝ o kvartilis: p = 3/4, sp = 27/4, [sp ] = 6, {sp } = 0.75. Q3 = 6.1 + 0.75(6.5 − 6.1) = 6.4. 35 / 189
Kvantilisek Oszt´alyk¨oz¨os gyakoris´agi sor: a kvantilis k¨ ozel´ıt´ese adhat´o meg. hq 0 . Yep = Yq0 + pN − fq−1 fq q: annak a legels˝o oszt´alynak a sorsz´ama, melyre fq0 ≥ pN (a kvantilist tartalmaz´o oszt´aly). Yq0 , hq , fq : a kvantilist tartalmaz´ o oszt´aly als´ o hat´ara, sz´eless´ege ill. gyakoris´aga. 0 : a kvantilist tartalmaz´ fq−1 o oszt´aly el˝ otti oszt´allyal z´ar´od´o kumul´alt gyakoris´ag. Relat´ıv gyakoris´agokkal val´ o megad´as: hq 0 Yep = Yq0 + p − gq−1 , gq 0 Yep = Yq0 + 100p − 100gq−1
hq . 100gq 36 / 189
P´elda A n´ epess´ eg sz´ ama 1001 – 5000 5001 – 10000 10001 – 20000 20001 – 40000 40001 – 70000 70001 – 110000 110001 – 160000 160001 – 210000 ¨ Osszesen
hi 4000 5000 10000 20000 30000 40000 50000 50000 –
fi 56 95 76 39 11 5 3 3 288
100gi 19.44 32.99 26.39 13.54 3.82 1.74 1.04 1.04 100.00
fi 0 56 151 227 266 277 282 285 288 –
100gi0 19.44 52.43 78.82 92.36 96.18 97.92 98.96 100.00 –
Als´ o kvartilis: p = 1/4, pN = 72, q = 2, Yq0 = 5000, hq = 5000, fq = 95, 0 fq−1 = 56. e1 = 5000 + (72 − 56) · 5000/95 = 5842. Q 0 Medi´ an: p = 1/2, q = 2, Yq0 = 5000, hq = 5000, gq = 0.3299, gq−1 = 0.1944.
e2 = Me = 5000 + (0.5 − 0.1944) · 5000/0.3299 = 9632. Q Fels˝ o kvartilis: p = 3/4, 100p = 75.00, q = 3, Yq0 = 10000, hq = 10000, 0 100gq = 26.39, 100gq−1 = 52.43. e3 = 10000 + (75.00 − 52.43) · 10000/26.39 = 18552. Q 37 / 189
Gyakoris´agi eloszl´asok grafikus ´abr´azol´asa Leveles ´ag ´abra (stem-and-leaf). F¨ ugg˝oleges vonal. T˝ole balra az ism´erv´ert´ekek legels˝o helyi´ert´ek˝ u sz´amjegyei (´agak). A vonal jobb oldal´an az ism´erv´ert´ekek tov´abbi azonos´ıt´as´ahoz sz¨ uks´eges sz´amjegyek sz´ ok¨ ozzel vagy vessz˝ovel elv´alasztva (levelek). Doboz ´abra (box plot, box-and-whiskers plot). V´ızszintes vagy f¨ ugg˝oleges tengelyen ´abr´azolja a kvartiliseket, ezek alkotj´ak a dobozt, valamint a legnagyobb ´es a legkisebb ism´erv´ert´eket. Q1 : a doboz alja; Q3 : a doboz teteje; Me: a doboz oszt´ovonala. Hisztogram. Oszt´alyk¨oz¨os gyakoris´agi sorban az oszt´alyk¨ oz¨ ok f¨ ol´e oszlopokat emel¨ unk, melyek ter¨ ulete ar´anyos az adott oszt´aly gyakoris´ag´aval (gyakoris´ag hisztogram) vagy relat´ıv gyakoris´ag´aval (s˝ ur˝ us´eg hisztogram). 38 / 189
Helyzetmutat´ok (k¨oz´ep´ert´ekek). Medi´an A medi´an az az ism´erv´ert´ek, amelyikn´el az ¨ osszes el˝ofordul´o ism´erv´ert´ek legfeljebb fele kisebb ´es legfeljebb fele nagyobb. p = 1/2-hez tartoz´o kvantilis. N X
|Yi − A| minimumhelye
A = Me.
i=1
Rangsorb´ol sz´amolva: ∗ N = 2n + 1 : Me = Yk+1 ,
N = 2n :
∗ Me = Yk∗ + Yk+1 /2.
Oszt´alyk¨oz¨os gyakoris´agi sorb´ ol sz´amolva: hme e = Yme,0 + N/2 − f 0 Me . me−1 fme 0 ≥ N/2. me: a legels˝o olyan oszt´alyk¨ oz sorsz´ama, ahol fme 39 / 189
Helyzetmutat´ok (k¨oz´ep´ert´ekek). M´odusz Diszkr´et ism´erv eset´en a m´ odusz a leggyakrabban el˝ofordul´o ism´erv´ert´ek, folytonos ism´erv eset´en pedig a s˝ ur˝ us´egf¨ uggv´eny maximumhelye. Oszt´alyk¨oz¨os gyakoris´agi sorb´ ol sz´amolhat´ o: e = Ymo,0 + Mo
da · hmo . da + df
mo: a m´oduszt tartalmaz´ o oszt´alyk¨ oz sorsz´ama; da = fmo − fmo−1 ,
df = fmo − fmo+1 .
Egyenl˝o oszt´alyk¨oz¨ok: da ´es df a t´enyleges gyakoris´agok k¨ ul¨onbs´egei. Nem egyenl˝o oszt´alyk¨oz¨ ok: da ´es df az egys´eges´ıtett (korrig´alt) gyakoris´agok k¨ ul¨onbs´egei. 40 / 189
P´elda Magyar v´arosok gyakoris´againak egys´eges´ıt´ese. A n´epess´eg sz´ ama (f˝ o) 1001 – 5000 5001 – 10000 10001 – 20000 20001 – 40000 40001 – 70000 70001 – 110000 110001 – 160000 160001 – 210000 ¨ Osszesen
Oszt´ alyk¨ oz hossz´ us´ ag 4000 5000 10000 20000 30000 40000 50000 50000 –
Eredeti Egys´egnyi 5000 f˝ o hossz´ us´ ag´ u oszt´ alyk¨ oz¨ ok gyakoris´ aga 56 0.014 70 95 0.019 95 76 0.0076 38 39 0.00195 9.75 11 0.000367 1.84 5 0.000125 0.63 3 0.00006 0.30 3 0.00006 0.30 288 Hunyadi, Vita (2008, 2.11. t´ abl´ azat).
mo = 2, fmo = 95, fmo−1 = 70, fmo+1 = 38, Ymo,0 = 5000, hmo = 5000, da = 95 − 70 = 25, df = 95 − 38 = 57. f = 5000 + Mo
25 · 5000 = 6524. 25 + 57 41 / 189
Helyzetmutat´ok (k¨oz´ep´ert´ekek). Sz´amtani ´atlag Y1 , Y2 , . . . , Yn : ism´erv´ert´ekek. Sz´amtani ´atlag (s´ ulyozatlan eset): Y1 + Y2 + . . . + Yn = Y = N N X (Yi − A)2
PN
i=1 Yi
N
minimumhelye
P =
Y . N
A = Y.
i=1
S ´ert´ek¨osszegb˝ol: Y = S/N. Gyakoris´agi sorb´ol (s´ ulyozott eset): Pf Pk Pk P P X fY gY i=1 fi Yi i=1 fi Yi NY Y = Pk = = = Pf = P = gY . N N g N i=1 fi Yi : az i-edik oszt´aly egyedi ´ert´eke vagy oszt´alyk¨ ozepe; fi : az i-edik oszt´aly gyakoris´aga. 42 / 189
Sz´or´od´asi mutat´ok. Terjedelemmutat´ok Terjedelem: R = YN∗ − Y1∗ = Ymax − Ymin . Oszt´alyk¨oz¨os gyakoris´agi sor: probl´em´as. Interkvartilis t´avols´ag: R0.5 = Q3 − Q1 . P´ elda Szem´elyg´epkocsik vegyes ´atlagfogyaszt´asa. Rangsor: 5.4, 5.5, 5.7, 5.9, 6.0, 6.1, 6.5, 6.7 R = 6.7 − 5.4 = 1.3 l/100km. Kvartilisek: Q1 = 5.55, Q3 = 6.4. R0.5 = 6.4 − 5.55 = 0.85 l/100km. 43 / 189
Sz´or´od´asi mutat´ok. Sz´or´as, variancia, relat´ıv sz´or´as Sz´or´as: v v u u N N u1 X u1 X t 2 (Yi − Y ) = t di2 σ= N N i=1 i=1 v sP u Pk k 2 2 u i=1 fi di i=1 fi (Yi − Y ) σ= =t P Pk k i=1 fi i=1 fi
s´ ulyozatlan eset,
s´ ulyozott eset.
di = Yi − Y : az ´atlagt´ ol val´ o elt´er´es. Variancia (sz´or´asn´egyzet): σ 2 . N X
2
(Yi − Y ) =
i=1
N X
2
Yi2 − NY ,
2
azaz σ 2 = Y 2 − Y .
i=1
Relat´ıv sz´or´as: V =
σ . Y 44 / 189
P´elda Szem´elyg´epkocsik vegyes ´atlagfogyaszt´asa. Ism´erv´ert´ekek: 6.0, 6.1, 5.9, 5.4, 6.5, 5.5, 6.7, 5.7. 6.0 + 6.1 + . . . + 5.7 = 5.975 l/100 km. 8 r (6.0 − 5.975)2 + (6.1 − 5.975)2 + . . . + (5.7 − 5.975)2 σ= 8 = 0.4265 l/100 km.
Y =
V = 0.4265/5.975 = 0.0714.
45 / 189
P´elda Magyar v´arosok n´epess´ege A n´ epess´ eg sz´ ama 1001 – 5000 5001 – 10000 10001 – 20000 20001 – 40000 40001 – 70000 70001 – 110000 110001 – 160000 160001 – 210000 ¨ Osszesen
fi 56 95 76 39 11 5 3 3 288
Yi 3000 7500 15000 30000 55000 90000 135000 185000 –
fi Yi 168000 712500 1140000 1170000 605000 450000 405000 555000 5205500
di = Yi − Y -15075 -10575 -3075 11925 36925 71925 116925 166925 –
fi di2 12726315000 10623909375 718627500 5546019375 14998011875 25866028125 41014366875 83591866875 195085145000
Y = 5205500/288 = 18074.65 ≈ 18075. r σ=
195085145000 = 2.6026.51 ≈ 26027. 288
V = 26026.51/18074.65 = 1.4399. 46 / 189
Koncentr´aci´o A sokas´aghoz tartoz´o teljes ´ert´ek¨ osszeg jelent˝ os r´esz´enek vagy eg´esz´enek kev´es egys´egre val´ o¨ osszpontosul´as´at koncentr´aci´onak nevezz¨ uk. Kicsi sokas´ag: abszol´ ut koncentr´aci´ o. Nagy sokas´ag: relat´ıv koncentr´aci´ o. Lorenz g¨ orbe Egyedi adatok: Y1∗ , Y2∗ , . . . , YN∗ rangsor, S ´ert´ek¨ osszeg. ! Pk Y∗ k (0, 0) ´es , i=1 i , k = 1, 2, . . . , N, pontok. N S Oszt´alyk¨oz¨ok: gi0 , Zi0 oszt´alyk¨ oz¨ os kumul´alt relat´ıv gyakoris´agok ´es relat´ıv ´ert´ek¨osszegek. (0, 0) ´es
(gi0 , Zi0 ), i = 1, 2, . . . , k,
pontok.
Koncentr´aci´os egy¨ utthat´ o: a g¨ orbe ´es a n´egyzet ´atl´oja ´altal bez´art ter¨ ulet (koncentr´aci´os ter¨ ulet) ar´anya a n´egyzet fel´ehez. Jele: L. 47 / 189
P´elda Magyar v´arosok n´epess´egeinek relat´ıv gyakoris´agai ´es ´ert´ek¨osszegei. A n´ epess´ eg sz´ ama 1001 – 5000 5001 – 10000 10001 – 20000 20001 – 40000 40001 – 70000 70001 – 110000 110001 – 160000 160001 – 210000 ¨ Osszesen
fi 56 95 76 39 11 5 3 3 288
gi 19.44 32.99 26.39 13.54 3.82 1.74 1.04 1.04 100.00
gi0 19.44 52.43 78.82 92.36 96.18 97.92 98.96 100.00 –
Si 199629 685534 1078313 1088993 622350 436468 400349 541758 5053394
Zi 3.95 13.56 21.34 21.55 12.32 8.64 7.92 10.72 100.00
Zi0 3.95 17.51 38.85 60.40 72.72 81.36 89.28 100.00 –
100 90 80
Koncentr´aci´ os egy¨ utthat´o:
70
Zi′
60
L = 0.523.
50 40 30
K¨ ozepes koncentr´aci´o.
20 10 0 0
20
40
60
80
100
gi′
48 / 189
Koncentr´aci´o Herfindahl index: HI =
N X
Zi2 .
i=1
HI = 1/N: nincs koncentr´aci´ o. HI = 1: teljes koncentr´aci´o. P´ elda Aut´ogy´arak piaci r´eszesed´ese (%) Eur´ op´aban 2010 ´es 2011 j´ unus´aban: Gy´ art´ o 2011 2010 Gy´ art´ o 2011 2010
VW csop. 22.7 20.9 Fiat csop. 7.3 7.3
PSA csop. 13.0 13.6 BMW csop. 6.5 5.8
Renault csop. 9.4 10.8 Daimler csop. 5.3 5.0
GM csop. 9.4 9.6 Toyota csop. 3.2 4.1
Ford 8.1 7.4 Egy´eb 15.1 15.5
Forr´ as: Eur´ opai Aut´ ogy´ art´ ok Sz¨ ovets´ ege
2011: HI = 0.2272 + 0.1302 + . . . + 0.1512 = 0.12885. 2010: HI = 0.2092 + 0.1362 + . . . + 0.1552 = 0.12543. 49 / 189
Momentumok A k¨or¨ uli r -edik momentum: N N 1 X 1 X r r Mr (A) = (Yi − A) = di (A) N N i=1 i=1 Pk k fi (Yi − A)r 1 X r Mr (A) = i=1Pk = fi di (A) N i=1 fi i=1
s´ ulyozatlan eset,
s´ ulyozott eset.
di (A) = Yi − A: az A ´ert´ekt˝ ol val´ o elt´er´es. A = 0: r -edik momentum; A = Y : r -edik centr´alis momentum. Speci´ alis esetek: I
M1 (0) = Y , M1 (Y ) = 0.
I
M2 (0) = Y 2 , M2 (Y ) = σ 2 . 50 / 189
Alakmutat´ok Csucsosabb Jobbra elnyulo Balra elnyulo Lapultabb Normalis eloszlas
Asszimetria: jobbra vagy balra elny´ ul´ o. Cs´ ucsoss´ag: hegyesebb vagy lapultabb, mint az ugyanolyan v´arhat´o ´ert´ek˝ u ´es sz´or´as´ u norm´alis eloszl´as.
51 / 189
Asszimetriamutat´ok Ferdes´eg (skewness): α3 =
M3 (Y ) . σ3
Pearson-f´ele mutat´o: P=
3(Y − Me) . σ
Decilisek ´es a medi´an elt´er´es´en alapul´ o mutat´ o: F0,1 =
Mutat´o Ferdes´eg Pearson Decilisek
(D9 − Me) − (Me − D1 ) , (D9 − Me) + (Me − D1 ) Jobbra elny´ ul´ o α3 > 0 P>0 F0,1 > 0
−1 ≤ F0,1 ≤ 1.
Szimmetrikus α3 ≈ 0 P≈0 F0,1 ≈ 0
Balra elny´ ul´o α3 < 0 P<0 F0,1 < 0 52 / 189
P´elda Szem´elyg´epkocsik vegyes ´atlagfogyaszt´asa. Ism´erv´ert´ekek: 6.0, 6.1, 5.9, 5.4, 6.5, 5.5, 6.7, 5.7. Y = 5.975, σ = 0.4265, Me = 5.95. (6.0 − 5.975)3 + (6.1 − 5.975)3 + . . . + (5.7 − 5.975)3 8 = 0.0262.
M3 (Y ) =
α3 = P=
0.0262 = 0.3372, 0.42653 3(5.975 − 5.95) = 0.1759. 0.4265
Jobbra elny´ ul´o. 53 / 189
Cs´ucsoss´agi mutat´o Lapults´ag (kurtosis): M4 (Y ) − 3. σ4 Norm´alis eloszl´as eset´en az elm´eleti ´ert´eke 0. Azonos param´eter˝ u norm´alishoz hasonl´ıtjuk. α4 =
Norm´alisn´al cs´ ucsosabb α4 > 0
Megegyez˝ o α4 ≈ 0
Norm´alisn´al lapultabb α4 < 0
P´ elda Szem´elyg´epkocsik vegyes ´atlagfogyaszt´asa. Ism´erv´ert´ekek: 6.0, 6.1, 5.9, 5.4, 6.5, 5.5, 6.7, 5.7. (6.0 − 5.975)4 + (6.1 − 5.975)4 + . . . + (5.7 − 5.975)4 8 = 0.0648.
M4 (Y ) =
0.0648 − 3 = −1.0408. 0.42654 Lapultabb, mint az 5.975 v´arhat´ o ´ert´ek˝ u, 0.4265 sz´or´as´ u norm´alis. 54 / 189 α4 =
Heterog´en sokas´agok Az elemz´es Y ism´erve szempontj´ab´ ol l´enyegesen elt´er˝o jellegzetess´egeket mutat´o r´eszekre bonthat´ o sokas´agokat az adott ism´erv szempontj´ab´ol heterog´en sokas´agoknak nevezz¨ uk. A f˝osokas´agot M darab r´eszsokas´agra bontjuk valamilyen csoportk´epz˝o ism´erv alapj´an. R´eszviszonysz´amok: Vj = Aj /Bj ,
j = 1, 2, . . . , M.
¨ Osszetett viszonysz´am: PM V =
j=1 Aj PM j=1 Bj
PM PM P A j=1 Bj Vj j=1 Aj = P = PM = PM A . j B j=1 Bj j=1 Vj
Aj ´es Bj helyett a bel˝ol¨ uk k´epzett megoszl´asi viszonysz´amok is haszn´alhat´oak. 56 / 189
P´elda A magyar lak´as´allom´any megoszl´asa (ezer) adott ´ev janu´ar 1.-´en Szob´ ak sz´ ama 1 2 3 ´es t¨ obb ¨ Osszesen
Lak´ asok sz´ ama 1980 1990 2016 973 645 456 1720 1681 1679 849 1527 2285 3542 3853 4420
Sz´ azal´ekos megoszl´ as 1980 1990 2016 27.5 16.7 10.3 48.6 43.6 38.0 23.9 39.6 51.7 100 100 100
2016. ´evi ´ allom´ any (1990=100) 70.7 99.9 149.6 114.7
Utols´o oszlop els˝o 3 sor: r´eszviszonysz´amok. Utols´o oszlop utols´o sor: ¨ osszetett viszonysz´am. 645 · 70.7 + 1681 · 99.9 + 1527 · 149.6 441972.6 = = 114.7087%, 3853 3853 16.7 · 70.7 + 43.6 · 99.9 + 39.6 · 149.6 11460.49 = = 114.6049%. 100 100 4420 100 = 114.7138%, 10.3 38.0 = 114.7243%. 456 1679 2285 51.7 70.7 + 99.9 + 149.6 70.7 + 99.9 + 149.6 57 / 189
R´esz- ´es f˝o´atlagok Yij : a j-edik r´eszsokas´ag (j = 1, 2, . . . , M) i-edik ´ert´eke (i = 1, 2, . . . , Nj ). P N= M osokas´ag nagys´aga. j=1 Nj : a f˝ A j-edik r´esz´atlag: Nj Sj 1 X , Yj = Yij = Nj Nj
j = 1, 2, . . . , M.
i=1
PNj
Sj =
i=1 Yij :
a j-edik r´eszsokas´ag ´ert´ek¨ osszege.
A f˝o´atlag: PM PM M Nj M 1 XX 1 X j=1 Nj Yj j=1 Sj Y = = PM S , Yij = Sj = PM j N N j=1 Nj j=1 i=1
j=1
mivel Sj = Nj Yj ,
azaz Nj =
j=1 Yj
Sj . Yj 58 / 189
Teljes sz´or´as ´es variancia ´ Atlagt´ ol val´o elt´er´es: dij = Yij − Y = Bij + Kj ,
i = 1, 2, . . . , Nj , j = 1, 2, . . . , M.
Bels˝o elt´er´es: Bij = Yij − Yj ,
i = 1, 2, . . . , Nj , j = 1, 2, . . . , M.
K¨ uls˝o elt´er´es: Kj = Yj − Y ,
j = 1, 2, . . . , M.
Teljes sz´or´as: v v u u Nj Nj u X u X M X M X u1 u1 2 σ=t (Yij − Y ) = t dij2 . N N j=1 i=1
j=1 i=1
Teljes variancia: M Nj M Nj 1 XX 1 XX 2 2 σ = (Yij − Y ) = dij . N N 2
j=1 i=1
j=1 i=1
59 / 189
Bels˝o sz´or´as ´es variancia R´eszsz´or´asok vagy csoporton bel¨ uli sz´ or´asok: v v u u Nj Nj u1 X u1 X t t 2 σj = (Yij − Yj ) = Bij2 , Nj Nj i=1
j = 1, 2, . . . , M.
i=1
Bels˝o sz´or´as: v v u u Nj Nj u X u X M X M X u1 u1 2 σB = t (Yij − Yj ) = t Bij2 . N N j=1 i=1
j=1 i=1
A σB bels˝o sz´or´as azt mutatja, hogy a f˝ osokas´ag egyes egys´egeihez tartoz´o Yij ism´erv´eret´ekek ´atlagosan mennyivel t´ernek el a saj´at r´esz´atlagukt´ol. A bels˝ o sz´ or´as n´egyzete a bels˝ o variancia. R´eszvarianci´ak ´es bels˝ o variancia kapcsolata: σB2
M 1 X = Nj σj2 . N j=1
60 / 189
K¨uls˝o sz´or´as ´es variancia K¨ uls˝o sz´or´as: v v u u Nj u X M X M u1 X u1 2 (Yj − Y ) = t Nj Kj2 . σK = t N N j=1 i=1
j=1
A σK k¨ uls˝o sz´or´as azt mutatja, hogy a r´esz´atlagok ´atlagosan mennyire t´ernek el a f˝ o´atlagt´ ol. Kapcsolat a varianci´ak k¨ oz¨ ott: 2 σ 2 = σB2 + σK .
N´egyzet¨osszegek k¨oz¨otti ¨ osszef¨ ugg´es: Nj Nj M X M X M X X X 2 Nj (Yj − Y )2 . (Yij − Y ) = (Yij − Yj )2 + j=1 i=1
j=1 i=1
j=1
SST = SSB + SSK SST a teljes, SSB a bels˝ o, SSK a k¨ uls˝ o n´egyzet¨ osszeg. 61 / 189
P´elda K¨oz´epf¨olde n´epei ´evenk´enti fogathajt´ o versenye d¨ ont˝oj´enek m´asodpercekben m´ert eredm´enyei: j N´epcsoport 1 T¨ und´ek 2 T¨ orp¨ ok 3 Emberek 4 Hobbitok ¨ Osszesen
Y =
54.3 55.0 52.1 44.8
Eredm´eny Yij 59.7 49.5 45.2 54.5 56.9 47.4 54.2
50.7
Nj 3 2 4 3 12
Sj 163.5 100.2 214.2 146.4 624.3
PNj
− Yj )2 52.08 48.02 22.35 47.12 169.57
i=1 (Yij
Y1 = 163.5/3 = 54.50,
Y2 = 100.2/2 = 50.10,
Y3 = 214.0/4 = 53.55,
Y4 = 146.4/3 = 48.80.
624.3 3 · 54.50 + 2 · 50.10 + 4 · 53.55 + 3 · 48.80 = = 52.025. 12 12 62 / 189
P´elda j N´epcsoport 1 T¨ und´ek 2 T¨ orp¨ ok 3 Emberek 4 Hobbitok ¨ Osszesen
54.3 55.0 52.1 44.8
Eredm´eny Yij 59.7 49.5 45.2 54.5 56.9 54.2 47.4
50.7
Nj 3 2 4 3 12
Sj 163.5 100.2 214.2 146.4 624.3
PNj
− Yj )2 52.08 48.02 22.35 47.12 169.57
i=1 (Yij
Y1 = 54.50, Y2 = 50.10, Y3 = 53.55, Y4 = 48.80, Y = 52.025. SST = (54.3 − 52.025)2 + . . . + (47.4 − 52.025)2 = 235.8625, SSK = 3 · (54.50 − 52.025)2 + . . . + 3 · (48.80 − 52.025)2 = 66.2925, SSB = SST − SSK = 169.57. r σ=
235.8625 = 4.4334, σB = 12
r
169.57 = 3.7591, σK = 12
σ1 =
p
52.08/3 = 4.1665,
σ3 =
p
22.35/4 = 2.3638,
r
66.292 = 2.3504. 12
p 48.02/2 = 4.9000, p σ4 = 47.12/3 = 3.9632. σ2 =
63 / 189
Az ism´ervek k¨oz¨otti kapcsolat fajt´ai Lehets´eges kapcsolatok k´et ism´erv k¨ oz¨ ott: I Az ism´ ervek f¨ uggetlenek egym´ast´ ol. Pl. hajsz´ın, testmagass´ag. I A k´ et ism´erv k¨oz¨ott sztochasztikus kapcsolat van, azaz pl. a sokas´ag egys´egeinek X szerinti hovatartoz´as´ab´ol, milyens´eg´eb˝ol k¨ovetkeztetni lehet az Y szerinti hovatartoz´asra, milyens´egre. Pl. hajsz´ın, szemsz´ın. I A k´ et ism´erv k¨oz¨ott f¨ uggv´enyszer˝ u, azaz determinisztikus kapcsolat van. Pl. ¨oszt¨ ond´ıj´atlag, tanulm´anyi ¨ oszt¨ond´ıj. Az ism´ervek fajt´ai szerinti csoportos´ıt´as: I Asszoci´ aci´o: mindk´et ism´erv min˝ os´egi vagy ter¨ uleti (nomin´alis sk´ala). I Vegyes kapcsolat: az egyik ism´ erv mennyis´egi, a m´asik min˝os´egi vagy ter¨ uleti (k¨ ul¨ onbs´egi vagy ar´any ´es nomin´alis sk´ala). I Korrel´ aci´o: mindk´et ism´erv mennyis´egi (k¨ ul¨ onbs´egi vagy ar´any sk´ala). I Rangkorrel´ aci´o: mindk´et ism´ervet sorrendi sk´al´an m´erj¨ uk. 64 / 189
Asszoci´aci´o A kontingenciat´abla ´altal´anos alakja: Az X ism´erv szerinti oszt´alyok C1x C2x .. . Cix .. .
Az Y ism´erv szerinti C1Y C2Y . . . CjY f11 f12 . . . f1j f21 f22 . . . f2j .. .. .. . . ... . fi1 fi2 . . . fij .. .. .. . . ... .
Cx Pr
fr 1 f·1
i
fr 2 f·2
... ...
frj f·j
oszt´alyok . . . CcY . . . f1c . . . f2c .. ... . ... ... ... ...
P
j
f1· f2· .. .
fic .. .
fi· .. .
frc f·c
fr · N
Utols´o sor: Y szerinti megoszl´as. Utols´o oszlop: X szerinti megoszl´as. Ha a soronk´enti megoszl´asok azonosak, akkor X ´es Y f¨ uggetlenek. Ha a soronk´ent legfeljebb egy nem 0 gyakoris´ag van, akkor X ´ert´eke egy´ertelm˝ uen meghat´arozza Y ´ert´ek´et, azaz f¨ uggv´enyszer˝ ua 65 / 189 kapcsolat.
T´enyleges ´es v´art gyakoris´agok A CiX · CjY t´enyleges illetve relat´ıv gyakoris´aga: fij illetve fij /N. fij P CiX · CjY ≈ , N
fi· P CiX ≈ , N
f·j P CjY ≈ . N
Ha CiX ´es CjY f¨ uggetlenek, akkor fi· f·j P CiX · CjY = P CiX · P CjY ≈ · . N N uggetlenek): NP CiX · CjY ≈ CiX · CjY v´art gyakoris´aga (ha f¨
fi· ·f·j N .
V´art gyakoris´agok (a f¨ uggetlens´eg felt´etelez´ese mellett): fij∗ =
fi· ·f·j N .
66 / 189
A kapcsolat szoross´aga Khi-n´egyzet (chi-square) mutat´ o: X2 =
r X c X (fij − fij∗ )2 i=1 j=1
fij∗
r X c X fij2 =N − 1 . fi· · f·j i=1 j=1
Lehets´eges ´ert´ekei: O ≤ X 2 ≤ N min (r − 1), (c − 1) .
X 2 = 0: X ´es Y f¨ uggetlenek. X 2 = N min (r − 1), (c − 1) : X ´es Y k¨ oz¨ ott f¨ uggv´enyszer˝ ua kapcsolat. Cram´er-f´ele asszoci´aci´ os egy¨ utthat´ o (SPSS: Cramer’s V): s X2 , 0 ≤ C ≤ 1. C= N min (r − 1), (c − 1) C = 0: X ´es Y f¨ uggetlenek. C = 1: X ´es Y k¨oz¨ott f¨ uggv´enyszer˝ u a kapcsolat. 67 / 189
P´elda Egy kutat´ ocsoport azt vizsg´ alta, milyen szoros az o ¨sszef¨ ugg´es egy bizonyos betegs´eg lefoly´ as´ anak s´ ulyoss´ aga ´es a betegek ´eletkora k¨ oz¨ ott. A vizsg´ alati adatok:
Lefoly´ as ¨ Osszesen
enyhe k¨ ozepes s´ ulyos
40 alatti 41 25 6 72
´ Eletkor 40–60 60 f¨ ol¨ otti 34 9 25 12 33 15 92 36
¨ Osszesen 84 62 54 200
r = c = 3, N = 200. V´ art gyakoris´ agok: 30.24 22.32 19.44 72 X2 =
38.64 28.52 24.84 92
15.12 11.16 9.72 36
84 62 54 200
(41 − 30.24)2 (34 − 38.64)2 (15 − 9.72)2 + + ... + = 22.5230. 30.24 38.64 9.72 r 22.5230 C = = 0.2373. Gyenge kapcsolat. 200 · 2 68 / 189
PRE elj´ar´as a kapcsolat szoross´ag´anak m´er´es´ere Hat´arozzuk meg annak a t¨ obbletinform´aci´ onak a mennyis´eg´et, amit a sokas´ag egys´egeinek az X szerinti hovatartoz´asa ny´ ujt az Y szerinti hovatartoz´asr´ol. PRE elj´ar´as: 1. Meghat´arozzuk, hogy ¨ osszess´eg´eben mekkora hib´aval j´arna, ha sokas´ag egys´egenek Y szerinti hovatartoz´as´at kiz´ar´olag azok Y szerinti megoszl´asa alapj´an pr´ ob´aln´ank meg megadni. Jel¨ol´es: E1 . 2. Meghat´arozzuk a hib´at akkor is, ha ismerj¨ uk az egys´egek X szerinti hovatartoz´as´at. Jel¨ ol´es: E2 . 3. Meghat´arozzuk a relat´ıv hibacs¨ okken´est: 0 ≤ PRE =
E1 − E 2 ≤ 1. E1
PRE = 0: X ´es Y f¨ uggetlenek. PRE = 1: X ´es Y k¨oz¨ ott f¨ uggv´enyszer˝ u a kapcsolat. 69 / 189
Vegyes kapcsolat Y a mennyis´egi, X a min˝ os´egi vagy ter¨ uleti ism´erv. Yij : a X szerint k´epzett j-edik r´eszsokas´ag i-edik egys´eg´ehez tartoz´o Y ism´erv´ert´ek (j = 1, 2, . . . , M, i = 1, 2, . . . , Nj ). X ismerete n´elk¨ ul az Y ´ert´ek´enek becsl´ese Y . A becsl´esi hiba: Nj M X X E1 = (Yij − Y )2 = SST . j=1 i=1
Ha tudjuk, a vizsg´alt egys´eg az X szerinti j-edik r´eszsokas´agba tartozik, akkor az Y ´ert´ek´enek becsl´ese Yj . A becsl´esi hiba: E2 =
Nj M X X
(Yij − Yj )2 = SSB.
j=1 i=1
PRE mutat´o: σ2 σ2 E1 − E 2 SST − SSB SSK PRE = = = = 1 − B2 = K2 = H 2 . E1 SST SST σ σ 70 / 189
Varianciah´anyados Varianciah´anyados: SSK SST − SSB = ≤ 1. SST SST H 2 az Y ism´erv sz´or´asn´egyzet´enek az X ism´erv ´altal megmagyar´azott h´anyada. 0 ≤ H2 =
H 2 = 0 ⇐⇒ SSK =
M X
Nj (Yj − Y )2 = 0 ⇐⇒ Y = Yj .
j=1
Ez teljes¨ ul, ha X ´es Y f¨ uggetlen. Nj M X X H = 1 ⇐⇒ SSB = (Yij − Yj )2 = 0 ⇐⇒ Yij = Yj . 2
j=1 i=1
Ekkor X ´es Y k¨oz¨ott f¨ uggv´enyszer˝ u a kapcsolat. √ Sz´or´ash´anyados: H = H 2 . 71 / 189
P´elda K¨oz´epf¨olde n´epei ´evenk´enti fogathajt´ o versenye d¨ ont˝oj´enek m´asodpercekben m´ert eredm´enyei: j N´epcsoport 1 T¨ und´ek orp¨ ok 2 T¨ 3 Emberek 4 Hobbitok ¨ Osszesen
SST = 235.8625,
54.3 55.0 52.1 44.8
Eredm´eny Yij 59.7 49.5 45.2 54.5 56.9 47.4 54.2
SSB = 169.57,
50.7
Nj 3 2 4 3 12
SSK = 66.2925.
66.292 = 0.2811 (28.11%), H = 0.5302. 235.8625 A n´epcsoporthoz val´o tartoz´as az Y sz´ or´asn´egyzet´enek 28.11%-´at magyar´azza. H = 0.5302 k¨ ozepesen er˝ os kapcsolatot jelez. H2 =
72 / 189
Empirikus (tapasztalati) regresszi´of¨uggv´eny X ´es Y mennyis´egi ism´ervek (ak´ar fel is cser´elhet˝ o a szerep¨ uk). X : csoportk´epz˝o ism´erv. X szerinti oszt´alyokat sorrendbe tudjuk ´all´ıtani X ´ert´ekei szerint. Vizsg´alhat´o az X ´es az Y k¨ oz¨ otti kapcsolat ir´anya. Ha X n¨oveked´es´evel Y ´ert´eke is n˝o, az ir´any pozit´ıv, ellenkez˝ o esetben negat´ıv. Az X szerint k´epzett r´eszsokas´agokhoz hozz´arendelt Yj r´esz´atlagok sorozat´at az Y v´altoz´o X v´altoz´ ora vonatkoz´ o (X szerinti) empirikus regresszi´of¨ uggv´eny´enek nevezz¨ uk. Grafikus ´abr´azol´as: az (Xi , Yi ) pontokat ¨ osszek¨ ot˝ o vonaldiagram. Y -nak X -re vonatkoz´o determin´aci´ os h´anyadosa (az X szerinti oszt´alyokb´ol sz´amolt varianciah´anyados): ηY2 |X =
2 (Y ) σK . σ 2 (Y )
2 (Y ) illetve σ 2 (Y ): Y k¨ σK uls˝ o, illetve teljes sz´ or´asn´egyzete. 73 / 189
P´elda A h´ aztart´ asok tagl´etsz´ ama ´es ´ atlagos egy f˝ ore jut´ o havi nett´ o j¨ ovedelme 2004-ben Budapesten ´es a k¨ ozs´egekben. A h´ aztart´ as tagjainak sz´ ama 1 2 3 4 5 6 ´es t¨ obb ¨ Osszesen
Az adott tagl´etsz´ am´ u h´ aztart´ asban l´ev˝ o szem´elyek sz´ azal´ekos megoszl´ asa egy f˝ ore jut´ o j¨ ovedelme (Ft) Budapesten k¨ ozs´egekben Budapesten k¨ ozs´egekben 13.0 7.9 99586 65921 26.6 19.7 94538 64996 25.6 20.2 83887 62287 21.4 26.7 69762 53235 8.5 14.9 65900 44985 4.9 10.6 58996 38796 100.0 100.0 82974 55619 Forr´ as: KSH
Legal´ abb 6 f˝ os h´ aztart´ asok ´ atlagos l´etsz´ ama Budapesten 6.55 f˝ o, a k¨ ozs´egekben 6.74 f˝ o.
74 / 189
Empirikus regresszi´of¨uggv´eny 100 Egy fore juto havi netto jovedelem (ezer Ft)
Budapest kozsegek 90
80
70
60
50
40
30
1
2
3
4 Tagletszam (fo)
5
6
7
Az egy f˝ ore jut´ o havi nett´ o j¨ ovedelem ´es a h´ aztart´ asok tagl´etsz´ ama k¨ oz¨ otti kapcsolat empirikus regresszi´ of¨ uggv´enyei.
75 / 189
Analitikus regresszi´of¨uggv´eny X ´es Y mennyis´egi ism´ervek. Az (Xi , Yi ) p´arokat vizsg´aljuk. K´erd´es: Felhaszn´alhat´ o-e az X v´altoz´ o Xi ´ert´eke az Y v´altoz´o ugyanazon egys´eg´ehez tartoz´ o Yi ´ert´ek el˝ orejelz´es´ere? Az X ´es Y k¨oz¨otti sztochasztikus kapcsolat term´eszet´et egy f (X ) f¨ uggv´ennyel, analitikus regresszi´ of¨ uggv´ennyel akarjuk le´ırni. P´eld´aul: f (X ) = β0 + β1 · X ,
line´aris regresszi´o;
f (X ) = β0 · β1X ,
exponenci´alis regresszi´o.
Az Y v´altoz´o Xi -hez tartoz´ o ´ert´ek´enek el˝ orejelz´ese f (Xi ). Pontdiagram: az (Xi , Yi ) p´arok ´abr´azol´asa a k´etdimenzi´os t´er pontjaik´ent. Utal az f (X ) l´etez´es´ere illetve alakj´ara. 76 / 189
Pontdiagram t´ıpusok b)
Y
Y
a)
c)
d)
Y
X
Y
X
X
X
a) X ´es Y f¨ uggetlen.
b) X ´es Y k¨ oz¨ ott pozit´ıv ir´ any´ u (line´ aris) kapcsolat.
c) X ´es Y k¨ oz¨ ott negat´ıv ir´ any´ u (line´ aris) kapcsolat.
d) X ´es Y k¨ oz¨ ott nemline´ aris kapcsolat.
77 / 189
Korrel´aci´o (Line´aris) korrel´aci´os egy¨ utthat´ o: P P dXi dYi Xi Yi − NX Y = r r (X , Y ) = qP P P P 2 dY2 i dX2 i X − N(X )2 Y 2 − N(Y )2 i
P
P
i
P
Xi Yi N Xi Yi − . = r P P 2 P 2 P 2 2 Xi Yi N Xi − N Yi − Az −1 ≤ r (X , Y ) ≤ 1 korrel´aci´ os egy¨ utthat´ o abszol´ ut ´ert´eke az X ´es Y k¨oz¨otti line´aris kapcsolat szoross´ag´at m´eri, el˝ojele pedig a kapcsolat ir´any´at mutatja. r (X , Y ) = ±1: f¨ uggv´enyszer˝ u line´aris kapcsolat; r (X , Y ) = 0: nincs line´aris kapcsolat. Korrel´alatlanok. Nem felt´etlen¨ ul f¨ uggetlenek! Min´el nagyobb |r (X , Y )|, ann´al szorosabb a kapcsolat. 78 / 189
Kovariancia X ´es Y kovarianci´aja: P C (X , Y ) =
dXi dYi . N
Kapcsolata a korrel´aci´ oval: r (X , Y ) =
C (X , Y ) . σX σY
σX , σY : X illetve Y sz´ or´asa. Kapcsolata a varianci´aval: C (X , X ) = σX2 . C (X , Y ) > 0: X ´es Y k¨ oz¨ ott pozit´ıv ir´any´ u kapcsolat; C (X , Y ) < 0: X ´es Y k¨ oz¨ ott negat´ıv ir´any´ u kapcsolat. C (X , Y ) = 0: nincs line´aris kapcsolat. Nem felt´etlen¨ ul f¨ uggetlenek! 79 / 189
Determin´aci´os egy¨utthat´o, s´ulyozott alakok Determin´aci´os egy¨ utthat´ o: r 2 . PRE mutat´o. 100r 2 azt mutatja, hogy az X ismerete h´any sz´azal´ekkal cs¨okkenti az Y nagys´ag´aval kapcsolatos bizonytalans´agot, ha X ´es Y k¨oz¨ott line´aris kapcsolat van. S´ ulyozott alakok: P fi · dXi dYi C (X , Y ) = , N
P fi · dXi dYi . r (X , Y ) = qP P fi · dX2 i fi · dY2 i
fi : az (Xi , Yi ) p´ar gyakoris´aga. P N = fi : a sokas´ag elemsz´ama.
80 / 189
P´elda N´eh´any als´o k¨oz´epkateg´ ori´as szem´elyg´epkocsi vegyes fogyaszt´asa ´es CO2 kibocs´at´asa.
Teljes´ıtm´ eny (LE) Fogyaszt´ as (l/100km) CO2 (g/km)
Teljes´ıtm´ eny (LE) Fogyaszt´ as (l/100km) CO2 (g/km)
Kia cee’d 1.4 CVVT 100 6.0 139 Mazda 3 1.6 MZR 105 6.5 149
Citro¨ en C4 1.4 Vti 95 6.1 140 Opel Astra 1.4 Ecotec 100 5.5 120
Ford Focus 1.6 Ti-VCT 105 5.9 136 Renault M´ egane 1.6 100 6.7 155
Honda Civic 1.4i 100 5.4 128 Volkwagen Golf 1.2 TSI 105 5.7 134
Forr´ as: Az Aut´ o, 2012/9.
X : 6.0, 6.1, 5.9, 5.4, 6.5, 5.5, 6.7, 5.7;
X = 5.975;
Y : 139, 140, 136, 128, 149, 129, 155, 134;
Y = 138.75. 81 / 189
dx : 0.025, 0.125, −0.075, −0.575, 0.525, −0.475, 0.725, −0.275; dy : 0.25, 1.25, −2.75, −10.75, 10.25, −9.75, 16.25, −4.75.
X
dx2 = 0.0252 + 0.1252 + . . . + (−0.275)2 = 1.455,
X
dy2 = 0.252 + 1.252 + . . . + (−4.75)2 = 611.5,
X
dx dy = 0.025 · 0.25 + . . . + (−0.275) · (−4.75) = 29.65.
P
dXi dYi 29.65 = = 3.7062, N 8 P dX dY 29.65 r (X , Y ) = qP i Pi =√ = 0.9940. 1.455 · 611.5 dX2 i dY2 i
C (X , Y ) =
Nagyon er˝os line´aris kapcsolat. 82 / 189
Pontdiagram 155
150
CO2 (Y )
145
140
135
130
125 5.4
5.6
5.8
6
6.2
6.4
6.6
6.8
Fogyasztas (X)
Korrel´aci´o: r (X , Y ) = 0.9940. Determin´aci´os egy¨ utthat´ o: r 2 = 0.9881. Az egyenes egyenlete: f (X ) = 16.9914 + 20.3780 · X .
83 / 189
Rangkorrel´aci´o Mindk´et ism´erv sorrendi sk´al´an m´erhet˝ o. RX ´es RY : az X ´es Y v´altoz´ o szerinti rangok. Kapcsolt rangok: az adott ism´erv t¨ obb ´ert´eke is megegyezik. A hozz´ajuk tartoz´o rangok ´atlag´at kapja meg mindegyik azonos ism´erv´ert´ek. Spearman-f´ele rangkorrel´aci´ os egy¨ utthat´ o: P 6 (RX − RY )2 −1 ≤ % = 1 − ≤ 1. N(N 2 − 1) % = 1: t¨ok´eletesen egyez˝ o rangsorol´as. % = −1: t¨ok´eletesen ellent´etes rangsorol´as. % = 0: nincs kapcsolat a rangsorol´asok k¨ oz¨ ott. Nincsenek kapcsolt rangok – % megegyezik a rangokb´ol sz´amolt r korrel´aci´os egy¨ utthat´oval. %2 : a kapcsolat szoross´ag´at m´er˝ o PRE mutat´ o. 84 / 189
P´elda A hazai informatikai k´epz˝ ohelyek 2015-¨ os, a hallgat´oi, illetve az oktat´oi kiv´al´os´ag szerinti rangsorai. (Forr´as: eduline.hu) Int´ezm´eny BME-VIK ELTE-IK SZTE-TTIK PE-MIK DE-IK DF OE-NIK PPKE-ITK GDF Kf-GAMFK ¨ Osszesen
%=1−
Hallgat´ ok (RX ) 1 2 3 7 5 10 4 6 9 8 55
Oktat´ ok (RY ) 5.5 8 2 3 5.5 7 4 1 9.5 9.5 55
6 · 110 1 = = 0.3(3), 10 · (100−1) 3
(RX − RY )2 20.25 36 1 16 0.25 9 0 25 0.25 2.25 110
1 %2 = = 0.1(1), 9
r = 0.3293.
Gyenge kapcsolat a rangsorok k¨ oz¨ ott. 85 / 189
¨ Osszetett intenzit´asi viszonysz´amok o¨sszehasonl´ıt´asa K´et azonos tartalm´ u, de k¨ ul¨ onb¨ oz˝ o¨ osszetett viszonysz´amot k´ıv´anunk ¨osszehasonl´ıtani. V0i = A0i /B0i , V1i = A1i /B1i : r´eszviszonysz´amok. ¨ Osszetett viszonysz´amok: P P P j Bsj Vsj j Asj j Asj = P = P A , Vs = P sj j Bsj j Bsj
s = 0, 1.
j Vsj
V 0 ´es V 1 elt´er´es´enek okai: I
elt´er˝oek lehetnek a k´et sokas´ag ugyanazon r´eszeire sz´am´ıtott V0i ´es V1i r´eszviszonysz´amok, ´es/vagy
I
elt´er˝o lehet a k´et sokas´ag szerkezete (¨ osszet´etele).
87 / 189
Jel¨ol´esek R´ eszsokas´ ag sorsz´ ama 1 2 .. . j .. . M F˝ osokas´ ag
sz´ aml´ al´ o A01 A02 .. . A0j .. . A0M P A0j
Els˝ o sokas´ ag neveviszonyz˝ o sz´ am B01 V01 B02 V02 .. .. . . B0j V0j .. .. . . B0M V0M P B0j V0
M´ asodik sokas´ ag sz´ amneveviszonyl´ al´ o z˝ o sz´ am A11 B11 V11 A12 B12 V12 .. .. .. . . . A1j B1j V1j .. .. .. . . . A1M B1M V1M P P A1j B1j V1
¨ Osszehasonl´ ıt´ as k¨ ul¨ onbh´ anyas´ eg dos k1 i1 k2 i2 .. .. . . kj ij .. .. . . kM iM K I
R´eszviszonysz´am k¨ ul¨onbs´egek: kj = V1j − V0j . R´eszviszonysz´am h´anyadosok: ij = V1j /V0j . ¨ Osszetett viszonysz´am k¨ ul¨ onbs´egek: K = V 1 − V 0 . ¨ Osszetett viszonysz´am h´anyadosok: I = V 1 /V 0 . 88 / 189
K¨ul¨onbs´egfelbont´as Teljes k¨ ul¨onbs´eg: K = V 1 − V 0 . P P B1 V1 B0 V0 K= P − P . B1 B0 R´eszhat´as k¨ ul¨onbs´eg(ek): P P P P Bs V0 Bs (V1 −V0 ) Bs k Bs V1 0 0 P − P = = P , K = Ks = P Bs Bs Bs Bs
s = 0, 1.
A r´eszviszonysz´amok k¨ oz¨ otti elt´er´esek hat´as´at mutatja. ¨ Osszet´ etel hat´as k¨ ul¨onbs´eg(ek): P P B1 Vs B0 Vs 00 00 K = Ks = P − P , s = 0, 1. B1 B0 A sokas´agok elt´er˝o ¨osszet´etel´enek a hat´as´at mutatja. Felt´etel: K = K 0 + K 00 . a) Ha K 0 -ben Bs = B0 , akkor K 00 -ben Vs = V1 (K = K00 + K100 ). b) Ha K 0 -ben Bs = B1 , akkor K 00 -ben Vs = V0 (K = K10 + K000 ). 89 / 189
P´elda Korcsoport (´ ev) 0–14 15–59 60–69 70– ¨ Osszesen
N´ epess´ eg sz´ ama (milli´ o f˝ o) Mexik´ o Sv´ edorsz´ ag 33.86 1.53 53.01 5.17 4.74 1.12 1.40 0.95 93.01 8.77
Hal´ aloz´ asok sz´ ama (f˝ o) Mexik´ o Sv´ edorsz´ ag 110 471 904 140 238 9 674 61 826 13 751 133 913 66 001 446 448 90 330
Hal´ aloz´ asi ar´ anysz´ am (h) Mexik´ o Sv´ edorsz´ ag 3.3 0.6 2.7 1.9 13.1 12.3 95.7 69.5 4.8 10.3
Kereszt´ ely, Sug´ ar, Szarvas (2005, B.7 feladat, 87. old.)
Korcsoport (´ ev) 0–14 15–59 60–69 70– ¨ Osszesen
N´ epess´ eg megoszl´ asa (%) Mexik´ o Sv´ edorsz´ ag 36.4 17.4 57.0 59.0 5.1 12.8 1.5 10.8 100.0 100.0
A1 : A0 : B1 : B0 : V1 : V0 :
K = V 1 − V 0 = 10.3 − 4.8 = 5.5 h
hal´aloz´asok sz´ama, Sv´edorsz´ag; hal´aloz´asok sz´ama, Mexik´o; n´epess´eg sz´ama, Sv´edorsz´ag; n´epess´eg sz´ama, Mexik´o; hal´aloz´asi ar´any, Sv´edorsz´ag; hal´aloz´asi ar´any, Mexik´o.
90 / 189
P´elda Korcsoport (´ ev) 0–14 15–59 60–69 70– ¨ Osszesen
N´ epess´ eg megoszl´ asa (% ) Mexik´ o Sv´ edorsz´ ag 36.4 17.4 57.0 59.0 5.1 12.8 1.5 10.8 100.0 100.0
Hal´ aloz´ asok sz´ ama (f˝ o) Mexik´ o Sv´ edorsz´ ag 110 471 904 140 238 9 674 61 826 13 751 133 913 66 001 446 448 90 330
Hal´ aloz´ asi ar´ anysz´ am (h) Mexik´ o Sv´ edorsz´ ag 3.3 0.6 2.7 1.9 13.1 12.3 95.7 69.5 4.8 10.3
17.4 · 3.3 + 59 · 2.7 + 12.8 · 13.1 + 10.8 · 95.7 = −3.9 h 100 36.4 · 0.6 + 57 · 1.9 + 5.1 · 12.3 + 1.5 · 69.5 − 4.8 = −1.8 h K00 = 100 K10 = 10.3 −
K100 = K − K00 = 5.5 + 1.8 = 7.3 h K000 = K − K10 = 5.5 + 3.9 = 9.4 h
K10 + K00 −3.9 − 1.8 = = −2.85 h 2 2 K 00 + K000 7.3 + 9.4 = 1 = = 8.35 h 2 2
0 K10 = 00 K10
91 / 189
H´anyadosfelbont´as ¨ Osszhat´ asindex: I = V 1 /V 0 . P P P P P P A0 A1 B1 B1 V1 B0 V0 A1 :P =P :P = P : P . I =P B1 B0 A0 B0 B1 B0 R´eszhat´asindex(ek): P P P Bs V1 Bs V0 Bs V1 0 0 I = Is = P : P =P , Bs Bs Bs V0
s = 0, 1.
A r´eszviszonysz´amok v´altoz´as´anak hat´as´at mutatja. ¨ Osszet´ etelhat´as index(ek): P P B1 Vs B0 Vs 00 00 I = Is = P : P , s = 0, 1. B1 B0 A sokas´agok ¨osszet´etele megv´altoz´as´anak a hat´as´at mutatja. Felt´etel: I = I 0 · I 00 . a) Ha I 0 -ben Bs = B0 , akkor I 00 -ben Vs = V1 (I = I00 · I100 ). b) Ha I 0 -ben Bs = B1 , akkor I 00 -ben Vs = V0 (I = I10 · I000 ). 92 / 189
P´elda Legmagasabb iskolai v´ egzetts´ eg
8´ alt. alatt 8´ altal´ anos Szakiskola K¨ oz´ episk. F¨ oiskola Egyetem ¨ Osszesen
2007 L´ etsz´ am f˝ o B0
megoszl´ as (% )
8866 315625 647433 726217 329675 189436 2217252
0.4 14.2 29.2 32.8 14.9 8.5 100.0
Havi brutt´ o ´ atlagkereset, eFt V0 126 109 129 172 270 407 184.9
2010 L´ etsz´ am f˝ o B1
megoszl´ as (% )
6236 263124 564221 689006 348364 196527 2067478
0.3 12.7 27.3 33.3 16.9 9.5 100.0
Havi brutt´ o ´ atlagkereset, eFt V1 127 123 144 186 300 440 209.7
2007= 100 i= V1 /V0 100.8 112.8 111.6 108.1 111.1 108.1 113.4
Forr´ as: Munka¨ ugyi adatt´ ar. 2008, 2011.
I = 113.4%, I10 = 209.7 : 190.96 = 1.0981 (109.81%), I000 = 113.4 : 109.81 = 1.0327 (103.27%), I00 = 203.18 : 184.9 = 1.0989 (109.89%), I100 = 113.4 : 109.89 = 1.0320 (103.20%). 93 / 189
Aggreg´atumok o¨sszehasonl´ıt´asa Aggreg´atum: A=
n X i=1
qi pi =
n X
νi
i=1
qi : az i-edik fajta egys´egeinek (term´ekeinek) mennyis´ege valamilyen alkalmas m´ert´ekegys´egben; pi : az i-edik fajta egys´eg egys´eg´ara; νi : az i-edik fajta egys´egek ¨ ossz´ert´eke. Ha a qi adatok: I termelt mennyis´ egek, akkor A a termel´es; I eladott mennyis´ egek, akkor A a forgalom; I fogyasztott mennyis´ egek, akkor A a fogyaszt´as. qi : valamilyen id˝oszakra ´ertelmezhet˝ o. pi : valamilyen id˝opontra ´ertelmezhet˝ o. Tov´abbiakban: qi – termelt mennyis´eg ; pi – egys´eg´ar . 94 / 189
K´et id˝oszak k¨oz¨otti o¨sszehasonl´ıt´as n term´ek k´et id˝oszakra vonatkoz´ oan: b´azisid˝ oszak, t´argyid˝oszak Term´ek sorsz´ama (i) 1 2 .. . i .. . n R¨ovid jel¨ol´es
Termelt Egys´eg´ar mennyis´eg a b´azisid˝ oszakban q01 p01 q02 p02 .. .. . .
Termelt Egys´eg´ar mennyis´eg a t´argyid˝oszakban q11 p11 q12 p12 .. .. . .
q0i .. .
p0i .. .
q1i .. .
p1i .. .
q0n q0
p0n p0
q1n q1
p1n p1
K´erd´esek egy term´ekkel vagy a term´ekek ¨ osszess´eg´evel kapcsolatban: a) hogyan v´altozott a termel´es ´ert´eke; b) hogyan v´altozott a termel´es mennyis´ege (volumene); c) hogyan v´altozott az ´ar , ill. az ´arszinvonal.
95 / 189
Egyedi indexek Egy term´ek vizsg´alata – dinamikus viszonysz´amok. iν =
q1i p1i ν1i = , qoi poi ν0i
iq =
q1i , qoi
ip =
p1i . poi
Az egy term´ekre vonatkoz´ oan meghat´arozott iν , iq ´es ip dinamikus viszonysz´amokat egyedi indexenknek nevezz¨ uk. Az egyedi indexek rendre azt mutatj´ak meg, hogy hogyan (h´any sz´azal´ekkal) v´altozott az adott term´ekre vonatkoz´ o I
termel´esi ´ert´ek,
I
termelt mennyis´eg,
I
egys´eg´ar
a b´azisid˝oszakr´ol a t´argyid˝ oszakra. ¨ Osszef¨ ugg´es az egyedi indexek k¨ oz¨ ott: iν = iq · ip . 96 / 189
´ ek- ´es volumenindex Ert´ ´ ekindex: Ert´
P P q1 p1 ν1 Iν = P =P . q0 p0 ν0
Az Iν ´ert´ekindex azt mutatja, hogy hogyan (h´any sz´azal´ekkal) v´altozott a teljes termel´es ´ert´eke a b´azisid˝ oszakr´ ol a t´argyid˝oszakra. Volumenindex:
P q1 ps Iq = P . q0 ps
ps : mindk´et id˝oszakra ´erv´enyesnek felt´etelezett egys´eg´ar. Az Iq volumenindex azt mutatja, hogy a termelt mennyis´egek ¨osszess´eg¨ ukben hogyan (h´any sz´azal´ekkal) v´altoztak, vagyis hogyan v´altozott a termel´es volumene a b´azisid˝ oszakr´ ol a t´argyid˝oszakra.
97 / 189
´ Arindex ´ Arindex:
P qs p1 Ip = P . qs p0
qs : mindk´et id˝oszakra ´erv´enyesnek felt´etelezett mennyis´eg. Az Ip ´arindex azt mutatja, hogy az egys´eg´arak ¨ osszess´eg¨ ukben hogyan (h´any sz´azal´ekkal) v´altoztak, amit az ´arszinvonal-v´altoz´as m´ert´ek´enek is szok´as nevezni. Iν , Iq , Ip : indexek aggreg´at form´ai. P P q1 p1 q1 ps Iν = P , Iq = P , q0 p0 q0 ps
P qs p1 Ip = P . qs p0
98 / 189
Legfontosabb volumen- ´es ´arindexformul´ak Meg kell v´alasztani a ps egys´eg´arakat ´es a qs mennyis´egeket. Haszn´alhatunk I b´ azisid˝oszaki adatokat: Iq -ban ps = p0 , Ip -en qs = q0 ; I t´ argyid˝oszaki adatokat: Iq -ban ps = p1 , Ip -en qs = q1 ; I a b´ azisid˝oszaki ´es t´argyid˝ oszaki indexek m´ertani ´atlag´at. B´azisid˝oszaki s´ ulyoz´as´ u, avagy Laspeyres-f´ele indexek: P P q1 p0 q0 p1 0 0 P Iq = , Ip = P . q0 p0 q0 p0 T´argyid˝oszaki s´ ulyoz´as´ u, avagy Paasche-f´ele indexek: P P q1 p1 q1 p1 1 1 P Iq = , Ip = P . q0 p1 q1 p0 M´ertani ´atlagol´as´ u, u ´n. Fisher-f´ele indexek: q q IqF = Iq0 · Iq1 , IpF = Ip0 · Ip1 . 99 / 189
P´elda Egy f˝ov´arosi piacon egy b¨ uf´eben a jellegzetes term´ekek t´eli ´es ny´ari ´arai ´es a fogyasztott mennyis´egek. Megnevez´es Nagyfr¨ occs (poh´ ar) S¨ or (kors´ o) L´ angos (db) Bableves (t´ al) Hurka (10 dkg)
December ´ ar eladott (Ft) mennyis´eg 70 1500 120 1740 100 2100 400 650 80 980
´ ar (Ft) 80 130 100 410 85
J´ ulius eladott mennyis´eg 1800 2110 2000 660 1060
Kereszt´ely, Sug´ ar, Szarvas (2005, Gy.108 feladat, 103. old.)
80 · 1800 + 130 · 2110 + 100 · 2000 + 410 · 660 + 85 · 1060 70 · 1500 + 120 · 1740 + 100 · 2100 + 400 · 650 + 80 · 980 979000 = = 1.1355 (113.55 %). 862200
Iν =
100 / 189
P´elda Megnevez´es Nagyfr¨ occs (poh´ ar) S¨ or (kors´ o) L´ angos (db) Bableves (t´ al) Hurka (10 dkg)
December ´ ar eladott (Ft) mennyis´eg 70 1500 120 1740 100 2100 400 650 80 980
´ ar (Ft) 80 130 100 410 85
J´ ulius eladott mennyis´eg 1800 2110 2000 660 1060
70 · 1800 + 120 · 2110 + 100 · 2000 + 400 · 660 + 80 · 1060 70 · 1500 + 120 · 1740 + 100 · 2100 + 400 · 650 + 80 · 980 928000 = = 1.0763 (107.63 %). 862200
Iq0 =
80 · 1800 + 130 · 2110 + 100 · 2000 + 410 · 660 + 85 · 1060 80 · 1500 + 130 · 1740 + 100 · 2100 + 410 · 650 + 85 · 980 979000 = = 1.0806 (108.06 %). 906000 √ IqF = 1.0763 · 1.0806 = 1.0784 (107.84 %). Iq1 =
101 / 189
P´elda Megnevez´es Nagyfr¨ occs (poh´ ar) S¨ or (kors´ o) L´ angos (db) Bableves (t´ al) Hurka (10 dkg)
December ´ ar eladott (Ft) mennyis´eg 70 1500 120 1740 100 2100 400 650 80 980
´ ar (Ft) 80 130 100 410 85
J´ ulius eladott mennyis´eg 1800 2110 2000 660 1060
80 · 1500 + 130 · 1740 + 100 · 2100 + 410 · 650 + 85 · 980 70 · 1500 + 120 · 1740 + 100 · 2100 + 400 · 650 + 80 · 980 906000 = = 1.0508 (105.08 %). 862200
Ip0 =
80 · 1800 + 130 · 2110 + 100 · 2000 + 410 · 660 + 85 · 1060 70 · 1800 + 120 · 2110 + 100 · 2000 + 400 · 660 + 80 · 1060 979000 = = 1.0550 (105.50 %). 928000 √ IqF = 1.0508 · 1.0550 = 1.0529 (105.29 %). Ip1 =
102 / 189
Indexek ´atlagform´ai Minden aggreg´at form´aban fel´ırhat´ o index egyben a megfelel˝o egyedi indexek s´ ulyozott ´atlaga, azaz ¨ osszetett viszonysz´am. Indexformula Iν Iq0 Iq1 Ip0 Ip1
A q1 p1 q1 p0 q1 p1 q0 p1 q1 p1
B q0 p0 q0 p0 q0 p1 q0 p0 q1 p0
V iν iq iq ip ip
Volumenindexek fel´ır´asa ´atlagforma alakban: P P P q0 p0 iq ν0 iq q1 p0 0 Iq = P = P = P q1 p0 , q0 p0 ν0 iq P P P q0 p1 iq q1 p1 ν1 Iq1 = P = P q 1 p 1 = P ν1 . q0 p1 iq iq 103 / 189
¨ Osszef¨ ugg´esek
Egyedi term´ekekre vonatkoz´ o¨ osszef¨ ugg´esek: q0 p0 · iq = q1 p0 ,
q0 p0 · ip = q0 p1 ,
q1 p1 = q0 p1 , iq
q1 p1 = q1 p0 , ip
q0 p0 · iν = q1 p1 , q1 p1 = q0 p0 . iν
Indexformul´ak ¨osszef¨ ugg´esei: Iq0 · Ip1 = Iν ,
Iq1 · Ip0 = Iν ,
IqF · IpF = Iν .
104 / 189
P´elda A kar´acsonyi feny˝ofapiac forgalmi adatair´ ol az al´abbiakat tudjuk:
Feny˝o fajt´aja Luc Ez¨ ust Fekete
A forgalom ´ert´ek´enek %-os megoszl´asa 2015-ben 50 30 20
´ altoz´as Arv´ (2014=100%) 105 107 115
Ismert, hogy a feny˝ok ¨ osszes forgalma 2014-r˝ ol 2015-re 20%-kal emelkedett. Sz´am´ıtsa ki a forgalom ´ert´ek-, ´ar- ´es volumenindex´et. Minden kapott eredm´enyt sz¨ ovegesen is ´ert´ekeljen.
105 / 189
A Laspeyres- ´es a Paache f´ele indexek elt´er´ese Volumenindexek: P P q0 p0 iq ν0 iq 0 P Iq = = P , q0 p0 ν0
Iq1
P q0 p1 iq = P . q0 p1
Az egyedi volumenindexek s´ ulyozott ´atlagai. A s´ ulyok: q0 p0 ν0 wL = P =P , q0 p0 ν0
q0 p1 wP = P . q0 p1
¨ Osszef¨ ugg´es a s´ ulyok k¨ oz¨ ott: q0 p0 p1 /p0 iP wP = P · P q p = wL · 0 . q0 p0 P 0 1 Ip q0 p0
106 / 189
Bortkiewicz formula Az Iq0 ´es Iq1 volumenindexek minden olyan esetben elt´er˝o eredm´enyt adnak, amikor I
sz´or´odnak az egyedi volumenindexek ´es
I
sz´or´odnak az egyedi ´arindexek ´es
I
az egyedi volumen- ´es egyedi ´arindexek k¨ oz¨ ott sztochasztikus kapcsolat van.
Ha az egyedi volumen- ´es ´arindexek k¨ oz¨ otti sztochasztikus kapcsolat pozit´ıv ir´any´ u, akkor Iq0 < Iq1 , ha negat´ıv ir´any´ u, akkor Iq0 > Iq1 . Bortkiewicz formula: Iq1 = 1 + Viq · Vip · riq ,ip . Iq0 Viq , Vip : az egyedi indexek relat´ıv sz´ or´asa; riq ,ip : az egyedi ´ar- ´es volumenindexek korrel´aci´ os egy¨ utthat´oja. 107 / 189
´ ok Aroll´ K´et egym´assal valamilyen kapcsolatban l´ev˝ o csoport indexeit hasonl´ıtjuk ¨ossze, legt¨obbsz¨ or ´arindexeket. ´ o: k´et ´arindex h´anyadosa. A leggyakoribb ´aroll´ok: Aroll´ I
agr´aroll´o: a mez˝ ogazdas´agi term´ekek termel˝ oi´ar-index´enek ´es a mez˝ogazdas´agi r´aford´ıt´asok ´arindex´enek h´anyadosa.
I
cserear´anyindex (terms of trade): az export´alt ´es import´alt term´ekek ´arindex´enek h´anyadosa.
Az ´aroll´o azt mutatja, hogy a bev´etelt biztos´ıt´ o term´ekek b´azisid˝oszakival azonos, illetve egys´egnyi volumen´e´ert mennyivel nagyobb vagy kisebb volumen˝ u m´asf´ele term´ek kaphat´ o cser´ebe a t´argyid˝oszakban.
108 / 189
Cserear´anyindex A cserear´enyindex azt mutatja, hogy az export´alt term´ekek ´es szolg´altat´asok b´azisid˝oszakival azonos, illetve egys´egnyi volumen´e´ert h´anyszor akkora volumen˝ u term´eket ´es szolg´altat´ast lehet import´alni a t´argyid˝oszakban, mint a b´azisid˝ oszakban. Ics =
Ipx . Ipm
Ipx : az export´alt term´ekek ´arindexe; Ipm : az import´alt term´ekek ´arindexe. P´elda. 2016 els˝o 6 h´onapj´aban az export forintban m´ert ´arsz´ınvonala 0.5%-kal, az import´e 2.8%-kal cs¨ okkent. Ipx = 99.5,
Ipm = 97.2,
Ics = 99.5/97.2 = 1.024.
A cserear´any 2.4%-kal javult. Forr´ as: A KSH jelenti. Gazdas´ ag ´es t´ arsadalom. 2016/7. 109 / 189
T¨obb id˝oszak k¨oz¨otti o¨sszehasonl´ıt´as Az indexsor valamely index – egy ´ert´ek-, egy ´ar- vagy egy volumenindex – kett˝on´el t¨obb id˝ oszakra vonatkoz´ o sorozata. Aggreg´atumok: Aij =
I
I
I
I
X
qi pj ,
i, j = 1, 2, . . . , k.
az ¨osszegz´es mindig a term´ekek ugyanazon k¨ or´ere terjed ki minden id˝oszakban; az i index azt jelzi, melyik id˝ oszak termel´esi ´ert´ek´er˝ol van sz´o, melyik id˝oszak mennyis´egi adatait vessz¨ uk alapul; a j index azt jelzi, a termel´esi ´ert´eket melyik id˝oszak egys´eg´arain sz´am´ıtott´ak; k: az id˝oszakok sz´ama.
Az Aij aggreg´atum nem m´as, mint az i-edik id˝ oszak termel´esi ´ert´eke a j-edik id˝oszak egys´eg´arain sz´am´ıtva. 110 / 189
Aggreg´atumm´atrix Aggreg´atumm´atrix: A = Aij . A f˝o´atl´oja: foly´o´aras aggreg´atumok. Az A m´atrix f˝o´atl´oj´aban tal´alhat´ o aggreg´atumok h´anyadosai ´ert´ekindexeket, valamely adott oszlop aggreg´atumainak h´anyadosai volumenindexeket, valamely sor adataib´ ol sz´am´ıtott h´anyadosok pedig ´arindexeket adnak. P´ elda Magyarorsz´agon a h´aztart´asokban az egy f˝ ore jut´ o fogyaszt´as ´ert´ekei 1997–2000 k¨oz¨ott. Fogyaszt´ as ´eve 1997 1998 1999 2000
1997 ´evi 219 240 261 288
1998 ´ arakon 223 244 266 293
1999 2000 (ezer Ft) 238 251 261 275 284 299 313 330
Kereszt´ely, Sug´ ar, Szarvas (2005, Gy.121 feladat, 111. old.) 111 / 189
Indexsorok 1. Ha a f˝o´atl´oban vagy valamely adott sorban/oszlopban l´ev˝o minden aggreg´atumot egy b´azisid˝ oszaknak v´alasztott id˝oszak aggreg´atum´aval osztunk, akkor b´azisindexsorokat kapunk, ha pedig minden aggreg´atumot a f˝ o´atl´ oban vagy valamely adott sorban/ oszlopban k¨ozvetlen¨ ul el˝ otte tal´alhat´ o aggreg´atummal osztunk, akkor l´ancindexsorokhoz jutunk. 2. Ha a volumen- ´es ´arindexsorok eset´eben az indexsor minden egyes tagj´at ugyanazon oszlop vagy sor aggreg´atumaib´ol sz´am´ıtjuk, akkor ´alland´o s´ uly´ u indexsorokhoz jutunk, ha viszont az indexsor minden egyes tagj´at m´as-m´as oszlopban/sorban tal´alhat´o k´et aggreg´atum h´anyadosak´ent sz´am´ıtjuk, akkor v´altoz´o s´ uly´ u indexsorokat kapunk. 3. A v´altoz´o s´ uly´ u l´ancvolumen- vagy l´anc´arindexek tagjair´ol mindig egy´ertelm˝ uen eld¨onthet˝ o, azok Laspeyres- vagy Paache-f´ele indexek-e. Meg kell n´ezni, az adott ,,l´ancszem” milyen s´ ulyoz´as´ u. 4. Egym´ast k¨ovet˝o l´ancindexek szorzata (´ert´ek vagy ´alland´o s´ uly´ u volumen ill. ´arindexek eset´en) b´azisindexet ad. 112 / 189
Ter¨uleti indexek Ter¨ uleti indexek: indexsz´am´ıt´asban az id˝ oszakok szerep´et ter¨ uleti egys´egek veszik ´at, a kapcsol´ od´ o aggreg´atumokat hasonl´ıtjuk ¨ossze. Saj´atoss´agai: I A ter¨ uleti egys´egeknek nincs sorrendje. Fontos, hogy az azonos rel´aci´oj´ u ¨osszehasonl´ıt´asok azonos eredm´enyhez vezessenek. I Adott orsz´ ag r´egi´ oi vagy azonos valut´aju orsz´agok eset´en a ter¨ uleti indexek jelent´ese ugyanaz, mint az eddigi indexek´e. Elt´er˝o valut´aju orsz´agok: nemzetk¨ ozi indexek. Az egyes orsz´agok aggreg´atumai m´as valut´aban vannak kifejezve. V´as´arl´oer˝o-parit´as: nemzetk¨ ozi ´arindex. Jel¨ol´ese: PPP (Purchasing Power Parity) A PPP(A/B)-vel jel¨olt A/B rel´aci´ oj´ u nemzetk¨ ozi ´arindex azt mutatja, hogy B orsz´ag egy valutaegys´ege A orsz´ag h´any valutaegys´eg´evel egyen´ert´ek˝ u, ha azt a vizsg´alt term´ekek megv´as´arl´as´ara ford´ıtjuk. 113 / 189
V´as´arl´oer˝o-parit´as Egyedi v´as´arl´oer˝o-parit´as: pA /pB , azaz a B orsz´ag egy valutaegys´ege h´any A valut´at ´er. A nemzetk¨ozi ´arindex az egyedi v´as´arl´ oer˝ o-parit´asok s´ ulyozott ´atlaga. P´ elda Big-Mac index (Economist, 2012 janu´ar). Egy Big Mac ´ara ´ Magyarorsz´agon 645 Ft, az Egyes¨ ult Allamokban 4.2 USD. 1 USD v´as´arl´oereje 645/4.2=153.6 Ft v´as´arl´ oerej´evel egyezik. HUF/USD ´arfolyam: 246Ft/ 1 USD. A forint 37%-kal volt alul´ert´ekelve a doll´arral szemben. 2011 j´ ulius´ahoz k´epest 23% es´es. Az ¨osszehasonl´ıtand´o orsz´agok lakoss´agsz´ama, ter¨ ulete, m´erete ´altal´aban jelent˝osen k¨ ul¨ onb¨ oz˝ o. Megold´as: egy f˝ ore vet´ıtett aggreg´atumokat vizsg´alnak. 114 / 189
Bilater´alis o¨sszehasonl´ıt´as A, B: k´et elt´er˝o valut´aj´ u orsz´ag. P P P qA pB · ppBA qA pA q p A A A P P P = = PPP (A/B) = qA pA , qA pB qA pB pA /pB P P P qB pB · ppBA qB pA qB pA B P P P = = PPP (A/B) = qB pA . qB pB qB pB pA /pB A Paache- ´es a Laspeyres-f´ele ´arindexek megfelel˝ oi. A Fisher index megfelel˝oje: q PPP F (A/B) = PPP A (A/B) · PPP B (A/B) = 1/PPP F (B/A). ´ ınvonalindex (Price Level Index): PLI (A/B) = Arsz´
PPP(A/B) ER(A/B) .
ER(A/B): valuta´arfolyam (Exchange Rate). Az ´arsz´ınvonalindex megadja, hogy az A orsz´ag ´arsz´ınvonala h´anyszorosa a B orsz´ag ´arsz´ınvonal´anak, ha az egys´eg´arakat azonos valut´aban fejezz¨ uk ki az ER(A/B) ´atv´alt´asi kulcs seg´ıts´eg´evel. 115 / 189
Sokas´agok megad´asa Egyetlen ism´erv szerint vizsg´alt sokas´ag megad´as´anak m´odjai. I
V´eges N elem˝ u sokas´ag eset´en az elemek felsorol´as´aval: Y1 , Y2 , . . . , YN .
I
V´egtelen sokas´ag eset´en diszkr´et ism´ervre megadjuk a P(Y = yk ) = Pk eloszl´ast vagy az F (y ) = P(Y < y ) eloszl´asf¨ uggv´enyt, folytonos ism´ervre pedig vagy az F (y ) eloszl´asf¨ uggv´enyt, vagy a f (y ) s˝ ur˝ us´egf¨ uggv´enyt, melyre Z y F (y ) = f (t)dt. −∞
117 / 189
Sokas´agi v´arhat´o ´ert´ek ´es sz´or´asn´egyzet Elemeivel adott sokas´ag eset´en: E(Y ) = Y =
n 1 X Yi = µ, N
Var(Y ) =
i=1
n 2 1 X Yi − Y = σ 2 . N i=1
Eloszl´as´aval adott sokas´ag eset´en diszkr´et esetben: X E(Y ) = yk P(Y = yk ) = µ, k
Var(Y ) =
X
2 yk − E(Y ) P(Y = yk ) = σ 2 ;
k
folytonos esetben: Z∞
Z∞ yf (y )dy = µ,
E(Y ) = −∞
Var(Y ) =
2 y −E(Y ) f (y )dy = σ 2 .
−∞ 118 / 189
Minta Minta (n elem˝ u): y = (y1 , y2 , . . . , yn ). Elemeivel megadott sokas´ag eset´en egy n elem˝ u minta elemei a sokas´ag elemei k¨oz¨ ul ker¨ ulnek ki. V´eletlen mintav´etel: minden sokas´agi elem el˝ ore megadott val´osz´ın˝ us´eggel ker¨ ul a mint´aba. Eloszl´as´aval megadott sokas´ag eset´en a mintaelemek a megadott eloszl´as´ u val´osz´ın˝ us´egi v´altoz´ ok. A mintalemek a mintav´etel el˝ ott val´ osz´ın˝ us´egi v´altoz´oknak tekinthet˝oek. A mintav´etel ut´an megkapjuk a minta egy realiz´aci´oj´at, ami konkr´et (sz´am)´ert´ekeket tartalmaz. A mint´ab´ol sz´am´ıtott tetsz˝ oleges mintajellemz˝ o (pl. ´atlag, sz´or´as, kvantilisek) szint´en val´ osz´ın˝ us´egi v´altoz´ o. A mintajellemz˝ok eloszl´as´at mintav´eteli eloszl´asnak nevezz¨ uk. 119 / 189
F¨uggetlen, azonos eloszl´as´u (FAE) minta V´eges homog´en sokas´ag eset´en FAE mint´at kapunk, ha minden sokas´agi elemet azonos val´ osz´ın˝ us´eggel kiv´alasztva vesz¨ unk visszatev´eses mint´at. Nagyon nagy sokas´ag eset´en a visszatev´es n´elk¨ uli mintav´etel is k¨ozel FAE mint´at ad. Eloszl´as´aval megadott sokas´ag eset´en a FAE minta f¨ uggetlen, a megadott eloszl´assal b´ır´ o val´ osz´ın˝ us´egi v´altoz´ okb´ ol ´all. y1 , y2 , . . . , yn : FAE minta egy sokas´agb´ ol, melynek v´arhat´o ´ert´eke ´es sz´or´asa rendre µ ´es σ. y = n1 (y1 + . . . + yn ): minta´atlag. 1 1 E(y ) = E(y1 ) + . . . + E(yn ) = µ + . . . + µ = µ, {z } n n | n darab
Var(y ) = σy2 =
1 σ2 1 2 2 Var(y ) + . . . + Var(y ) = σ + . . . + σ 1 n {z } = n. n2 n2 |
√ σy = σ/ n: standard hiba.
n darab
120 / 189
Egyszer˝u v´eletlen (EV) minta Egyszer˝ u v´eletlen mintav´etelt haszn´alunk homog´en, v´eges elemsz´am´ u sokas´ag eset´en, amikor a mint´at visszatev´es n´elk¨ ul v´alasztjuk ki, minden lehets´eges n elem˝ u minta kiv´alaszt´as´anak azonos val´osz´ın˝ us´eget biztos´ıtva. y1 , y2 , . . . , yn : EV minta egy N elem˝ u sokas´agb´ ol, melynek v´arhat´o ´ert´eke ´es sz´or´asa rendre µ ´es σ. σ2 N − n σ2 n Var(y EV ) = E(y EV ) = µ, ≈ 1− . n N −1 n N Szisztematikus kiv´alaszt´as n elem˝ u EV mint´at akarunk venni N elem˝ u sokas´agb´ol. k = N/n: l´ep´esk¨oz. k0 : v´eletlen kiindul´opont (1 ≤ k0 ≤ k). Ciklikusan haladva a k0 -b´ ol kiindulva minden k-adik elemet kiv´alasztunk. Ha a sokas´ag a vizsg´alt ism´erv szerint v´eletlenszer˝ uen van rendezve, akkor EV mint´ahoz jutunk. 121 / 189
R´etegzett (R) minta Heterog´en sokas´ag jellemz˝ oit vizsg´aljuk, pl. a lakoss´ag j¨ovedelmi viszonyait vagy iskol´azotts´ag´at a lakhely jellege szerint (Budapest, megyesz´ekhely, stb). A r´etegzett mintav´etel v´egrehajt´asa u ´gy t¨ ort´enik, hogy el˝osz¨or a sokas´agot t¨obb´e-kev´esb´e homog´en r´etegekbe soroljuk be, u ´gy, hogy a r´etegek ´atfed´esmentesen ´es teljesen lefedj´ek a sokas´agot, majd az egyes r´etegeken bel¨ ul, egym´ast´ ol f¨ uggetlen¨ ul EV (ritk´abban FAE) mintav´etelt hajtunk v´egre. M: r´etegek sz´ama; N1 , N2 , . . . , NM : az egyes r´etegek elemsz´ama,
PM
j=1 Nj
= N;
n1 , n2 , . P . . , mM : az egyes r´etegekb˝ ol kiv´alasztott mint´ak elemsz´ama, M n = n; j=1 j µ1 , µ2 , . . . , µM : az egyes r´etegek v´arhat´ o ´ert´ekei; σ1 , σ2 , . . . , σM : az egyes r´etegek sz´ or´asai. 122 / 189
Mintav´eteli tervek a) Egyenletes eloszt´as Minden r´etegb˝ol azonos elemsz´am´ u mint´at vesz¨ unk: ni = n/M. Egyszer˝ u, az egyes r´etegek jellemz˝ oi k¨ onnyen sz´amolhat´oak. b) Ar´anyos eloszt´as Az egyes r´etegekb˝ol vett mint´ak elemsz´amai u ´gy ar´anylanak egym´ashoz, mint maguknak a r´etegeknek az elemsz´amai: Nj Nj n . nj = n PM N k=1 Nk Egyszer˝ u, a mint´aban ugyanazok a s´ ulyar´anyok, mint a sokas´agban. c) Neyman-f´ele optim´alis eloszt´as A nagyobb sz´or´od´as´ u r´etegekb˝ ol nagyobb mint´akat vesz¨ unk: Nj σj nj = n PM . k=1 Nk σk A f˝o´atlag becsl´es´en´el a mintav´eteli hiba minim´alis. Probl´em´as a megval´os´ıt´as, mert a σj sz´ or´asok ´altal´aban nem ismertek.
123 / 189
Csoportos mint´ak Egyl´epcs˝os (1L) minta Az ¨osszes sokas´agi elem nem ´all rendelkez´es¨ unkre (vagy csak nagyon dr´ag´an), de nagyobb ¨ osszetartoz´ o csoportokr´ol van list´ank. Egyl´epcs˝os (csoportos) mintav´etel eset´en a csoportok halmaz´ab´ol v´alasztunk EV mint´at, majd az ´ıgy kiv´alasztott csoportokat teljes k¨or˝ uen megfigyelj¨ uk. Min´el homog´enebbek az egyes csoportok, ann´al kev´esb´e hat´ekony az elj´ar´as. T¨obbl´epcs˝os (TL) minta Minden egyes l´epcs˝oben a kor´abban kiv´alasztott csoportokb´ol vesz¨ unk u ´jabb mint´at. Pl. a k´etl´epcs˝ os mintav´etel is kevesebb redund´ans mintaelemet tartalmaz, mind az egyl´epcs˝ os. 124 / 189
Becsl˝of¨uggv´eny y1 , y2 , . . . , yn : minta (FAE, ritk´abban EV). Statisztika: a mintaelemek tetsz˝ oleges f¨ uggv´enye. Val´osz´ın˝ us´egi v´altoz´o. A becsl˝of¨ uggv´eny olyan statisztika, ami valamely sokas´agi jellemz˝o mint´ab´ol t¨ort´en˝o k¨ozel´ıt˝ o meghat´aroz´as´ara szolg´al. θ: becs¨ ulni k´ıv´ant sokas´agi jellemz˝ o. Becsl˝ of¨ uggv´enye: ˆ ˆ ˆ θ(y1 , y2 , . . . , yn ) = θ(n) = θ. P´ elda θ = σ 2 , azaz a sokas´agi sz´ or´asn´egyzetet becs¨ ulj¨ uk. n 2 1X θˆ1 = θˆ1 (n) = θˆ1 (y1 , y2 , . . . , yn ) = yi − y = s ∗ 2 , n i=1
n
θˆ2 = θˆ2 (n) = θˆ2 (y1 , y2 , . . . , yn ) =
2 1 X yi − y = s 2 . n−1 i=1
s 2:
korrig´alt tapasztalati (empirikus) sz´ or´asn´egyzet.
126 / 189
A becsl˝of¨uggv´eny tulajdons´agai. Torz´ıtatlans´ag Egy becsl˝of¨ uggv´enyt torz´ıtatlannak nevez¨ unk, ha annak v´arhat´o ´ert´eke megegyezik a becs¨ ulni k´ıv´ant sokas´agi jellemz˝ovel, azaz E θˆ = θ. P´ elda θ = µ, azaz a sokas´agi v´arhat´ o ´ert´eket becs¨ ulj¨ uk. n 1X yi . θˆ1 = µ ˆ1 = y = n i=1 Mind FAE, mind EV minta eset´en: E µ ˆ1 = E y = µ. A minta´atlag a sokas´agi v´arhat´ o ´ert´ek torz´ıtatlan becsl´ese. θˆ2 = µ ˆ2 = y1 + yn /2. Mind FAE, mind EV minta eset´en: E µ ˆ2 = µ (torz´ıtatlan). Torz´ıt´as (bias): Bs θˆ = E θˆ − θ. 127 / 189
P´elda θ = σ 2 , azaz a sokas´agi sz´ or´asn´egyzetet becs¨ ulj¨ uk. n−1 2 σ2 σ = σ2 − 6 σ2. = E s ∗2 = n n Torz´ıt´as: Bs s ∗ 2 =
σ2 −
σ2 n
− σ2 = −
σ2 . n
Korrig´alt empirikus sz´or´asn´egyzet: n
n
i=1
i=1
2 2 n 1X n ∗2 1 X yi − y = · yi − y = s . s = n−1 n−1 n n−1 2
n ∗2 n n−1 2 2 E s =E s = · σ = σ2. n−1 n−1 n A korrig´alt empirikus sz´ or´asn´egyzet a sokas´agi sz´ or´asn´egyzet torz´ıtatlan becsl´ese. 128 / 189
Mintav´eteli sz´or´asn´egyzet ˆ a θ torz´ıtatlan becsl´ese, azaz E θˆ = θ. θ: A becsl˝of¨ uggv´eny sz´or´asn´egyzet´et mintav´eteli sz´ or´asn´egyzetnek, ennek n´egyzetgy¨ok´et pedig a becsl˝ of¨ uggv´eny, illetve a becsl´es standard hib´aj´anak (standard error) nevezz¨ uk. q Se θˆ = Var θˆ . P´ elda θ = µ, azaz a sokas´agi v´arhat´ o ´ert´eket becs¨ ulj¨ uk. FAE minta σ 2 sokas´agi sz´or´asn´egyzettel. n
1X θˆ1 = µ ˆ1 = yi , n
θˆ2 = µ ˆ2 = y1 + yn /2.
i=1
Mindk´et becsl´es torz´ıtatlan. Var θˆ1 = σ 2 /n, √ Se θˆ1 = σ/ n,
Var θˆ2 = σ 2 /2, √ Se θˆ2 = σ/ 2. 129 / 189
A becsl˝of¨uggv´eny tulajdons´agai. Hat´asoss´ag θ egy olyan θˆ0 torz´ıtatlan becsl˝ of¨ uggv´eny´et, melynek sz´or´asn´egyzete θ tetsz˝oleges torz´ıtatlan becsl˝ of¨ uggv´enye sz´ or´asn´egyzet´en´el nem nagyobb, θ minim´alis sz´ or´asn´egyzet˝ u torz´ıtatlan becsl˝of¨ uggv´eny´enek (MVUE, Minimum Variance Unbiased Estimator) nevezz¨ uk. θˆ1 , θˆ2 : a θ torz´ıtatlan becsl˝ of¨ uggv´enyei. A θˆ1 becsl˝of¨ uggv´enynek a θˆ2 -re vonatkoz´o relat´ıv hat´asfoka: Var θˆ1 Efr = . Var θˆ2 Efr > 1: θˆ2 hat´asosabb, mint θˆ1 . Ha l´etezik θˆ0 MVUE, akkor θˆ1 abszol´ ut hat´asfoka: Var θˆ1 Efa = ≥ 1. Var θˆ0 130 / 189
P´elda θ = µ, azaz a sokas´agi v´arhat´ o ´ert´eket becs¨ ulj¨ uk. FAE minta σ 2 sokas´agi sz´or´asn´egyzettel. n
1X yi , θˆ1 = µ ˆ1 = n
θˆ2 = µ ˆ2 = y1 + yn /2.
i=1
Mindk´et becsl´es torz´ıtatlan. Var θˆ1 = σ 2 /n,
Var θˆ2 = σ 2 /2.
Relat´ıv hat´asfok: Var θˆ2 σ 2 /2 n Efr = = 2 = > 1, ˆ /n σ 2 Var θ1
ha n > 2.
131 / 189
MSE krit´erium. Aszimptotikus torz´ıtatlans´ag Ha k´et nem felt´etlen¨ ul torz´ıtatlan becsl´es ¨ osszehasonl´ıt´as´ara az ´atlagos n´egyzetes hiba (MSE, Mean Square Error) szolg´al. 2 Mse θˆ = E θˆ − θ = Var θˆ + Bs2 θˆ . Az a becsl˝of¨ uggv´eny a ,,jobb”, amelyiknek az ´atlagos n´egyzetes hib´aja kisebb. ˆ θˆ = θ(n) aszimptotikusan torz´ıtatlan, ha ˆ = 0. lim Bs θ(n) n→∞
P´ elda
σ2 Bs s ∗ 2 = − → 0, n
ha n → ∞.
s ∗ 2 torz´ıtott, de aszimptotikusan torz´ıtatlan. 132 / 189
A becsl˝of¨uggv´eny tulajdons´agai. Konzisztencia ˆ A θ param´eter θˆ = θ(n) becsl˝ of¨ uggv´enye konzisztens, ha n → ∞ eset´en v´arhat´o ´ert´eke tart a val´ odi param´eter´ert´ekhez, sz´or´asn´egyzete pedig tart null´ahoz, azaz ˆ ˆ lim E θ(n) =θ ´es lim Var θ(n) = 0. n→∞
n→∞
P´ elda θ = µ, FAE minta σ 2 sokas´agi sz´ or´asn´egyzettel. σ2 Var y = → 0, ha n → ∞. n FAE minta eset´en a mint´atlag a sokas´agi v´arhat´ o ´ert´ek konzisztens (´es torz´ıtatlan) becsl´ese. E y = µ,
133 / 189
Becsl´esi m´odszerek. Momentumok m´odszere y1 , y2 , . . . , yn : FAE minta egy θ param´eter˝ u Y val´ osz´ın˝ us´egi v´altoz´ora. A k¨or¨ uli r-edik elm´eleti momentum: Mr (A) = E(Y − A)r . A k¨or¨ uli r-edik empirikus momentum: n
1X (yi − A)r . Mr (A) = n i=1
Ismert t´ıpus´ u eloszl´as eset´en a momentumok az eloszl´as param´etereinek f¨ uggv´enyei. Ezekbe a f¨ uggv´enyekbe behelyettes´ıtve az empirikus momentumokat megkapjuk a param´eterek becsl´eseit. 134 / 189
Exponenci´alis eloszl´as λ > 0 param´eterrel Y ∼ Exp(λ). Y s˝ ur˝ us´egf¨ uggv´enye: ( λe−λy , f (y ) = 0, r! Mr (0) = E Y r = r , λ
ha y > 0; ha y ≤ 0.
azaz M1 (0) = E(Y ) =
1 . λ
y1 , y2 , . . . , yn : FAE minta Y -ra, M1 (0) = y . λ becsl´ese az M1 (0) = M1 (0), azaz az 1/λ = y egyenlet megold´asa: ˆ = 1. λ y
135 / 189
Egyenletes eloszl´as az [a, b] intervallumon Y ∼ U(a, b). Y s˝ ur˝ us´egf¨ uggv´enye: ( 1 , ha y ∈ [a, b]; f (y ) = b−a 0, ha y ∈ 6 [a, b]. a+b (b − a)2 , M2 E(Y ) = Var(Y ) = . 2 12 y1 , y2 , . . . , yn : FAE minta Y -ra. n 1 X (yi − y )2 = s ∗ 2 . M1 (0) = y , M2 (y ) = N i=1 (a, b) becsl´ese (a < b) az M1 (0) = M1 (0), M2 E(Y ) = M2 (y ), azaz az (b − a)2 a+b = y, = s ∗2 2 12 egyenletrendszer megold´asa: p p aˆ = y − 3s ∗ 2 , bˆ = y + 3s ∗ 2 . M1 (0) = E(Y ) =
136 / 189
Norm´alis eloszl´as µ, σ 2 param´eterekkel Y ∼ N µ, σ 2 . Y s˝ ur˝ us´egf¨ uggv´enye: 1 (y − µ)2 f (y ) = √ exp − . 2σ 2 2πσ M1 (0) = E(Y ) = µ, M2 E(Y ) = Var(Y ) = σ 2 . y1 , y2 , . . . , yn : FAE minta Y -ra. n 1 X (yi − y )2 = s ∗ 2 . N i=1 (µ, σ 2 ) becsl´ese az M1 (0) = M1 (0), M2 E(Y ) = M2 (y ), azaz az µ = y, σ2 = s ∗2
M1 (0) = y ,
M2 (y ) =
egyenletrendszer megold´asa: µ ˆ = y,
c2 = s ∗ 2 . σ 137 / 189
Becsl´esi m´odszerek. Maximum likelihood (ML) m´odszer
y1 , y2 , . . . , yn : FAE minta egy θ param´eter˝ u Y val´ osz´ın˝ us´egi v´altoz´ora. A minta L(θ; y1 , . . . , yn ) likelihood f¨ uggv´enye diszkr´et esetben a minta egy¨ uttes eloszl´asa, folytonos esetben a minta egy¨ uttes s˝ ur˝ us´egf¨ uggv´enye. Log-likelihood f¨ uggv´eny: `(θ; y1 , . . . , yn ) = log L(θ; y1 , . . . , yn ). A θ param´eter θˆ ML becsl´ese az L(θ; y1 , . . . , yn ) likelihood (vagy `(θ; y1 , . . . , yn ) log-likelihood) f¨ uggv´eny maximum helye.
138 / 189
Sokas´agi ar´any becsl´ese 20-szor feldobunk egy ´erm´et, yi az i-edik dob´as kimenetele. yi = 1, ha fejet dobunk ´es yi = 0, ha ´ır´ast. A minta realiz´aci´oja: 0, 1, 0, 0, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1. Becs¨ ulend˝o a fej dob´as p val´ osz´ın˝ us´ege. L(p; y1 , . . . , y20 ) = P(y1 = 0, y2 = 1, . . . , y20 = 1 | p) = P(y1 = 0 | p) · P(y2 = 1 | p) · . . . · P(y20 = 1 | p) = (1 − p)p(1 − p)2 p 3 (1 − p)2 p 5 (1 − p)p 3 (1 − p)p = p 13 (1 − p)7, `(p; y1 , . . . , y20 ) = 13 log p + 7 log(1 − p). 13 7 13 ∂` = − = 0, azaz p = . ∂p p 1−p 20 2 ∂ ` 13 7 13 = 2− < 0, azaz p = ∂p 2 p (1 − p)2 20 pˆ = 13/20: a fej dob´asok relat´ıv gyakoris´aga.
maximumhely. 139 / 189
Exponenci´alis eloszl´as λ > 0 param´eterrel Y ∼ Exp(λ). Y s˝ ur˝ us´egf¨ uggv´enye: ( λe−λy , f (y ) = 0,
ha y > 0; ha y ≤ 0.
y1 , y2 , . . . , yn : FAE minta Y -ra. n Pn Y L(λ; y1 , . . . , yn ) = λe−λyi = λn e−λ i=1 yi , i=1
`(λ; y1 , . . . , yn ) = n log λ − λ
n X
yi = n log λ − λny .
i=1
∂` n 1 = − ny = 0, azaz λ = . ∂λ λ y 2 ∂ ` n 1 = − 2 < 0, azaz λ = maximumhely. 2 ∂λ λ y ˆ = 1/y . λ ML becsl´ese λ 140 / 189
Tov´abbi p´eld´ak Norm´ alis eloszl´ as µ, σ 2 param´ eterekkel S˝ ur˝ us´egf¨ uggv´enye: 1 (y − µ)2 f (y ) = √ exp − . 2σ 2 2πσ y1 , y2 , . . . , yn : FAE minta. µ ˆ = y,
c2 = s ∗ 2 . σ
Egyenletes eloszl´ as az [a, b] intervallumon S˝ ur˝ us´egf¨ uggv´enye: ( f (y ) =
1 b−a ,
0,
ha y ∈ [a, b]; ha y ∈ 6 [a, b].
y1 , y2 , . . . , yn : FAE minta. aˆ = min{y1 , y2 , . . . , yn },
bˆ = max{y1 , y2 , . . . , yn }. 141 / 189
Egyenl˝otlens´egek Markov egyenl˝otlens´eg: Legyen Y ≥ 0 egy val´ osz´ın˝ us´egi v´altoz´o, aminek l´etezik E(Y ) v´arhat´ o ´ert´eke. Ekkor b´armely δ > 0 eset´en E(Y ) . P Y ≥δ ≤ δ Csebisev egyenl˝otlens´eg: Legyen Y egy val´ osz´ın˝ us´egi v´altoz´o, aminek l´etezik E(Y ) v´arhat´ o ´ert´eke. Ekkor b´armely > 0 eset´en Var(Y ) P Y − E(Y ) ≥ ε ≤ . ε2 P´ elda H´anyszor kell egy szab´alyos kock´at feldobnunk, hogy a hatos dob´as val´osz´ın˝ us´eg´et az esem´eny relat´ıv gyakoris´aga legal´abb 0.8 val´osz´ın˝ us´eggel 0.1-n´el kisebb hib´aval megk¨ ozel´ıtse? Mi a helyzet, ha nem tudjuk, hogy a kocka szab´alyos-e? 143 / 189
Nagy sz´amok gyenge t¨orv´enye Azt mondjuk, hogy val´ osz´ın˝ us´egi v´altoz´ ok egy Y1 , Y2 , . . . , Yn , . . . sorozata sztochasztikusan konverg´al egy Y val´ osz´ın˝ us´egi v´altoz´ohoz, ha b´armely ε > 0 eset´en lim P |Yn − Y | ≥ ε = 0. n→∞
Ha Y ≡ c (konstans), akkor elegend˝ o: lim E(Yn ) = c,
n→∞
lim Var(Yn ) = 0.
n→∞
Nagy sz´amok gyenge t¨ orv´enye: Legyenek Y1 , Y2 , . . . , Yn , . . . p´aronk´ent f¨ uggetlen, azonos eloszl´as´ u val´ osz´ın˝ us´egi v´altoz´ok, legyen E(Y1 ) = µ ´es Var(Y1 ) < ∞, tov´abb´a legyen Sn = Y1 + . . . + Yn . Ekkor Y = Sn /n sztochasztikusan konverg´al a µ v´arhat´o ´ert´ekhez. Az ´atlag a v´arhat´o ´ert´ek konzisztens becsl´ese. 144 / 189
K¨ozponti hat´areloszl´as t´etel
K¨ozponti hat´areloszl´as t´etel: Legyenek Y1 , Y2 , . . . , Yn , . . . f¨ uggetlen, azonos eloszl´as´ u val´ osz´ın˝ us´egi v´altoz´ ok, E(Y1 ) = µ ´es 2 0 < Var(Y1 ) = σ < ∞, tov´abb´a legyen Sn = Y1 + . . . + Yn . Ekkor E(Sn ) = n · µ, Var(Sn ) = n · σ 2 ´es Z x 1 Sn − n · µ 2 √ √ e−t /2 dt, x ∈ R. < x = Φ(x) = lim P n→∞ n·σ 2π −∞ olegesen norm´alis µ Nagy n eset´en Y = Sn /n eloszl´asa hozz´avet˝ v´arhat´o ´ert´ekkel ´es σ 2 /n sz´ or´asn´egyzettel.
145 / 189
Norm´alisb´ol sz´armaztathat´o eloszl´asok. Khi-n´egyzet eloszl´as X1 , X2 , . . . , Xn : f¨ uggetlen standard norm´alis val´ osz´ın˝ us´egi v´altoz´ok. Y = X12 + X22 + . . . + Xn2 ≥ 0. Y eloszl´asa n szabads´agi fok´ u khi-n´egyzet (chi-square) eloszl´as. 2 Jel¨ol´es: Y ∼ Xn . V´arhat´o ´ert´eke: n; sz´or´asn´egyzete: 2n. p-kvantilis: Xp2 (n). Ha Y ∼ Xn2 , akkor P Y < Xp2 (n) = p. T´abl´azatb´ol kiolvashat´ o. Ha y1 , y2 , . . . , yn FAE minta N (µ, σ 2 ) eloszl´asb´ ol, akkor n
y=
1X yi n
n
´es s 2 =
i=1
1 X (yi − y )2 n−1 i=1
f¨ uggetlenek, valamint y ∼ N µ, σ 2 /n
´es
(n − 1)s 2 2 ∼ Xn−1 . σ2
146 / 189
Norm´alisb´ol sz´armaztathat´o eloszl´asok. t-eloszl´as X0 , X1 , . . . , Xn : f¨ uggetlen standard norm´alis val´ osz´ın˝ us´egi v´altoz´ok. √ nX0 Y =q . X12 + X22 + . . . + Xn2 Y eloszl´asa n szabads´agi fok´ u t-eloszl´as (Student-eloszl´as). Jel¨ol´es: Y ∼ tn . V´arhat´o ´ert´eke: 0, ha n > 1; sz´ or´asn´egyzete: n/(n − 2), ha n > 2. p-kvantilis: tp (n). Ha Y ∼ tn , akkor P Y < tp (n) = p. T´abl´azatb´ol kiolvashat´ o. Ha n → ∞, akkor tn → N (0, 1) (standard norm´alis). n = ∞ eset. Ha n → ∞, akkor tp (n) & zp , ahol zp a standard norm´alis eloszl´as p-kvatilise. Ha y1 , y2 , . . . , yn FAE minta N (µ, σ 2 ) eloszl´asb´ ol, akkor y −µ √ ∼ tn−1 . s/ n
147 / 189
Norm´alisb´ol sz´armaztathat´o eloszl´asok. F-eloszl´as X1 , X2 : f¨ uggetlen khi-n´egyzet eloszl´as´ u val´ osz´ın˝ us´egi v´altoz´ok n ´es m szabads´agi fokkal. X1 /n ≥ 0. Y = X2 /m Y eloszl´asa n ´es m szabads´agi fok´ u F-eloszl´as. Jel¨ol´es: Y ∼ Fn,m . V´arhat´o ´ert´eke: m > 4.
m m−2 ,
ha m > 2; sz´ or´asn´egyzete:
2m(n+m−2) , n(m−2)2 (m−4)
ha
p-kvantilis: Fp (n; m). Ha Y ∼ Fn,m , akkor P Y < Fp (n; m) = p. T´abl´azatb´ol kiolvashat´ o. Ha x1 , x2 , . . . , xn ´es y1 , y2 , . . . , ym FAE mint´ak N (µx , σ 2 ) ´es N (µy , σ 2 ) eloszl´asb´ol valamint n
sx2 =
1 X (xi − x)2 n−1 i=1
m
´es sy2 =
1 X (yj − y )2 , m−1 j=1
akkor sx2 /sy2 ∼ Fn−1,m−1 .
148 / 189
Az intervallumbecsl´es alapjai y1 , y2 , . . . , yn : minta θ: becs¨ ulni k´ıv´ant sokas´agi jellemz˝ o. Intervallumbecsl´es eset´en a minta alapj´an olyan intervallumot hat´arozunk meg, amely el˝ore megadott (nagy) val´ osz´ın˝ us´eggel tartalmazza az ismeretlen jellemz˝ ot. Ezt az intervallumot konfidencia intervallumnak nevezz¨ uk. 0 < α < 1: adott ´ert´ek (jellemz˝ oen α ≤ 0.2). Keres¨ unk olyan θˆa(α) ´es θˆf (α) becsl˝ of¨ uggv´enyeket, melyekre P θˆa(α) < θ < θˆf (α) = 1 − α. θˆa(α) , θˆf (α) : az (1 − α) · 100%-os megb´ızhat´ os´ag´ u konfidencia intervallum als´o ´es fels˝o hat´arai. Pl. α = 0.05: 95%-os megb´ızhat´os´ag´ u konfidencia intervallum. A minta egy konkr´et realiz´aci´ oj´at behelyettes´ıtve a θˆa(α) ´es θˆf (α) becsl˝of¨ uggv´enybe egy ,,konkr´et” intervalumot kapunk. 150 / 189
Norm´alis eloszl´as, ismert sz´or´as y1 , y2 , . . . , yn : FAE minta N (µ, σ 2 ) eloszl´asb´ ol, σ ismert. θ = µ: becs¨ ulni k´ıv´ant sokas´agi jellemz˝ o. 2 y ∼ N µ, σ /n , ez´ert Z=
y −µ √ ∼ N (0, 1). σ/ n
Ha (z1 , z2 ) egy intervallum, ´es Φ(z) a standard norm´alis eloszl´as eloszl´asf¨ uggv´enye, akkor y −µ P z1 < √ < z2 = Φ(z2 ) − Φ(z1 ). σ/ n Olyan intervallumot keres¨ unk, hogy az intervallumon k´ıv¨ ul es´es val´osz´ın˝ us´ege mindk´et oldalon egyenl˝ o (α/2) legyen. ˆ ˆ Z eloszl´asa szimmetrikus, θa(α) ´es θf (α) a minta´atlagra n´ezve szimmetrikusan helyezkednek el. 151 / 189
Norm´alis eloszl´as, ismert sz´or´as Adott z ∈ R eset´en a (−z, z) intervallumba es´es val´osz´ın˝ us´ege: y −µ P −z < √ < z = Φ(z)−Φ(−z) = Φ(z)− 1−Φ(z) = 2Φ(z)−1. σ/ n Adott 0 < α < 1 eset´en keress¨ uk azt a z ´ert´eket, melyre y −µ P −z < √ < z = 2Φ(z) − 1 = 1 − α ⇐⇒ Φ(z) = 1 − α/2. σ/ n Megold´as: z = z1−α/2 , a standard norm´alis eloszl´as p = 1 − α/2 rend˝ u kvantilise. T´abl´azatb´ ol meghat´arozhat´ o. Pl.: α = 0.05, 1 − α/2 = 0.975, z0.975 = 1.9600, α = 0.10, 1 − α/2 = 0.950, z0.950 = 1.6449. σ σ √ √ < µ < y + z1−α/2 P y − z1−α/2 = 1 − α. n n 152 / 189
Norm´alis eloszl´as, ismert sz´or´as osz´ın˝ us´egi v´altoz´o). Als´o hat´ar: θˆa(α) = y − z1−α/2 √σn (val´ Fels˝o hat´ar: θˆf (α) = y + z1−α/2 √σn (val´ osz´ın˝ us´egi v´altoz´o). Hibahat´ar: ∆y = ∆ = z1−α/2 √σn . Ism´etelt mintav´etel eset´en az esetek ´atlagosan (1 − α) · 100 sz´azal´ek´aban igaz, hogy a θˆa(α) , θˆf (α) intervallum lefedi (tartalmazza) a keresett sokas´agi jellemz˝ ot. I
Min´el nagyobb α ´ert´eke, ann´al kisebb a megb´ızhat´os´ag. Kisebb megb´ızhat´os´ag keskenyebb konfidencia intervallumot eredm´enyez.
I
A mintaelemsz´am n¨ ovel´ese cs¨ okkenti a hibahat´art, azaz r¨ovidebb intervallumot eredm´enyez.
A mintav´etelez´es ut´an a sz´amegyenes egy konkr´et intervallum´at kapjuk. Itt m´ar nem besz´elhet¨ unk arr´ ol, hogy ez 1 − α val´osz´ın˝ us´eggel lefedi a keresett sokas´agi jellemz˝ ot. 153 / 189
P´elda Egy teheraut´orakom´annyi f´elliteres u ¨d´ıt˝ oitalb´ ol 10 palackot v´eletlenszer˝ uen kiv´alasztva ´es lem´erve azok u ˝rtartalm´at az al´abbi, milliliterben kifejezett ´ert´ekeket kaptuk: 499, 525, 498, 503, 501, 497, 493, 496, 500, 495. Ismert, hogy a palackokba t¨ olt¨ ott u ¨d´ıt˝ oital mennyis´ege norm´alis eloszl´as´ u 3 ml sz´or´assal. Adjon 95%-os megb´ızhat´ os´ag´ u konfidencia intervallumot az ´atlagos t¨ olt˝ ot¨ omegre. n = 10, σ = 3, α = 0.05, z1−α/2 = z0.975 = 1.96, y = 500.7. A keresett konfidencia intervallum: 3 σ y ± z1−α/2 √ = 500.7 ± 1.96 √ = 500.7 ± 1.8594. n 10 Hat´arok: θˆa = 498.8406, θˆf = 502.5594; hibahat´ar: ∆ = 1.8594. Jel¨ol´es: Int 0.95 (µ) = (498.8406, 502.5594). 154 / 189
P´elda
n = 10, σ = 3, ∆ = 1.8594, Int 0.95 (µ) = (498.8406, 502.5594). Mekkora mintaelemsz´am sz¨ uks´eges egy k´etszer ilyen pontos 95%-os megb´ızhat´os´ag´ u konfidencia intervallum meghat´aroz´as´ahoz? e = ∆/2. ´ hibahat´ar: ∆ Uj ´ mintanagys´ag: ne. Uj σ e = z0.975 √σ = 1.96 √3 = 1.96 √3 = z0.975 √ = ∆/2. ∆ 2 n 2 10 ne ne Megold´as: ne = 4n = 40, azaz n´egyszeres mintanagys´ag sz¨ uks´eges.
155 / 189
P´elda n = 10, σ = 3, ∆ = 1.8594, Int 0.95 (µ) = (498.8406, 502.5594). Mekkora mintaelemsz´am sz¨ uks´eges egy fele ilyen pontos 90%-os megb´ızhat´os´ag´ u konfidencia intervallum meghat´aroz´as´ahoz? e = 2∆. ´ hibahat´ar: ∆ Uj ´ mintanagys´ag: ne. Uj ´ megb´ızhat´os´ag: α Uj e = 0.1, z1−eα/2 = z0.95 = 1.6449. σ e = z0.95 √σ = 1.6449 √3 = 2 · 1.96 √3 = 2 · z0.975 √ ∆ = 2∆. 2 n 10 ne ne √ √ 1.6449 2 · 1.96 1.6449 · 10 √ = √ = 1.3269 ⇐⇒ ne= 1.7608. ⇐⇒ ne= 2 · 1.96 10 ne Megold´as: legal´abb 2 elem˝ u minta sz¨ uks´eges. 156 / 189
Egyoldali konfidencia intervallumok y1 , y2 , . . . , yn : minta θ: becs¨ ulni k´ıv´ant sokas´agi jellemz˝ o. Adott α eset´en keres¨ unk olyan θˆa(α) ´es θˆf (α) becsl˝of¨ uggv´enyeket, melyekre P θ < θˆf (α) = 1 − α (baloldali konfidencia intervallum); P θˆa(α) < θ = 1 − α (jobboldali konfidencia intervallum). Norm´ alis eloszl´ as, ismert sz´ or´ as y1 , y2 , . . . , yn : FAE minta N (µ, σ 2 ) eloszl´asb´ ol, σ ismert. θ = µ: becs¨ ulni k´ıv´ant sokas´agi jellemz˝ o. Baloldali konfidencia intervallum: σ σ −∞, y + z1−α √ . P µ < y + z1−α √ = 1 − α, azaz n n Jobboldali konfidencia intervallum: σ σ P y − z1−α √ < µ = 1 − α, azaz y − z1−α √ , ∞ . n n 157 / 189
Norm´alis eloszl´as, ismeretlen sz´or´as y1 , y2 , . . . , yn : FAE minta N (µ, σ 2 ) eloszl´asb´ ol, σ nem ismert. θ = µ: becs¨ ulni k´ıv´ant sokas´agi jellemz˝ o. P 2 n 1 σ 2 becsl´ese: s 2 = n−1 i=1 yi − y . T =
y −µ √ ∼ tn−1 , s/ n
ez´ert adott α eset´en s s P y − t1−α/2 (n − 1) √ < µ < y + t1−α/2 (n − 1) √ = 1 − α. n n t1−α/2 (n − 1): az n − 1 szabads´agi fok´ u t-eloszl´as p = 1 − α/2 rend˝ u kvantilise. T´abl´azatb´ ol meghat´arozhat´ o. Az (1 − α) · 100%-os megb´ızhat´ os´ag´ u konfidencia intervallum o hat´ara: y +t1−α/2 (n−1) √sn . als´o hat´ara: y −t1−α/2 (n−1) √sn ; fels˝ 158 / 189
P´elda Egy gabonarakt´arban 60 kg-os kiszerel´esben b´ uz´at csomagolnak. A havi min˝os´egellen˝orz´es sor´an lem´ertek t´ız darab v´eletlen¨ ul kiv´alasztott zs´akot. Eredm´eny¨ ul a k¨ ovetkez˝ oket kapt´ak: 60.2, 63.4, 58.8, 63.6, 64.7, 62.5, 66.0, 59.1, 65.1, 62.0. Felt´etelezve, hogy a t¨olt˝ ot¨ omeg norm´alis eloszl´as´ u, adjon 95%-os megb´ızhat´os´ag´ u konfidencia intervallumot a zs´akokba l´ev˝o b´ uzamennyis´eg v´arhat´o ´ert´ek´ere. n = 10, α = 0.05, t1−α/2 (n − 1) = t0.975 (9) = 2.2622, y = 62.54, s 2 = 6.2938, s = 2.5087. A keresett konfidencia intervallum: s 2.5087 y ± t1−α/2 (n − 1) √ = 62.54 ± 2.2622 √ = 62.54 ± 1.7946, n 10 azaz Int 0.95 (µ) = (60.7454, 64.3346) kg. 159 / 189
Sokas´agi variancia becsl´ese y1 , y2 , . . . , yn : FAE minta N (µ, σ 2 ) eloszl´asb´ ol. 2 θ = σ : becs¨ ulni k´ıv´ant sokas´agi jellemz˝ o. 2 1 Pn 2 2 σ becsl´ese: s = n−1 i=1 yi − y . X2 =
(n − 1)s 2 2 ∼ Xn−1 , σ2
ez´ert adott α eset´en (n − 1)s 2 (n − 1)s 2 2 <σ < = 1 − α. P X1−α/2 (n − 1) Xα/2 (n − 1) Xα/2 (n − 1) ´es X1−α/2 (n − 1): az n − 1 szabads´agi fok´ u X 2 -eloszl´as α/2, illetve 1 − α/2 rend˝ u kvantilisei. T´abl´azatb´ol meghat´arozhat´oak. A σ 2 -re adott (1 − α) · 100%-os megb´ızhat´ os´ag´ u konfidencia intervallum als´o hat´ara:
(n−1)s 2 X1−α/2 (n−1) ;
fels˝ o hat´ara:
(n−1)s 2 Xα/2 (n−1) . 160 / 189
P´elda Tekints¨ uk az el˝oz˝o p´elda norm´alis eloszl´as´ unak felt´etelezett mint´aj´at: 60.2, 63.4, 58.8, 63.6, 64.7, 62.5, 66.0, 59.1, 65.1, 62.0. Adjunk 95%-os megb´ızhat´ os´ag´ u konfidencia intervallumot a sz´or´asra. n = 10, α = 0.05, Xα/2 (n − 1) = X0.025 (9) = 2.7004, X1−α/2 (n − 1) = X0.975 (9) = 19.0228, s 2 = 6.2938. A σ 2 -re vett 95%-os megb´ızhat´ os´ag´ u konfidencia intervallum als´o hat´ara
9 · 6.2938 (n − 1)s 2 = = 2.9777, X1−α/2 (n − 1) 19.0228
fels˝o hat´ara
(n − 1)s 2 9 · 6.2938 = = 20.9762. Xα/2 (n − 1) 2.7004
A σ-ra vett 95%-os megb´ızhat´ os´ag´ u konfidencia intervallum: √ √ Int 0.95 (σ) = 2.9777, 20.9762 = (1.7256, 4.5800). 161 / 189
Sokas´agi ar´any becsl´ese Legyen adott egy esem´eny, aminek a val´ osz´ın˝ us´ege P. Pl. feldobunk egy ´erm´et ´es fejet dobunk, egy v´eletlenszer˝ uen kiv´alasztott hallgat´o l´any, stb. n elem˝ u minta: n darab f¨ uggetlen k´ıs´erlet az adott esem´enyre. k ˆ of¨ uggv´enye, k a P = p = n : P torz´ıtatlan ´es konzisztens becsl˝ vizsg´alt esem´eny bek¨ovetkez´eseinek sz´ama. k eloszl´asa binomi´alis n ´es p param´eterekkel, ez´ert P(1 − P) p(1 − p) E(p) = P, Var(p) = σp2 = , becsl´ese sp2 = . n n Ha a mintaelemsz´am nagy, azaz min{np, n(1 − p)} ≥ 10, akkor p−P Z= eloszl´asa k¨ ozel N (0, 1), sp ez´ert adott α eset´en ! r r p(1 − p) p(1 − p) P p − z1−α/2 < P < p + z1−α/2 = 1 − α. n n 162 / 189
Mintanagys´ag Az P ar´anyra vett (1 − α) · 100%-os megb´ızhat´ os´ag´ u konfidencia intervallum q q p(1−p) ; fels˝ o hat´ara: p + z1−α/2 p(1−p) . als´o hat´ara: p − z1−α/2 n n Adott ∆ pontoss´aghoz sz¨ uks´eges mintanagys´ag: n=
2 z1−α/2 · P · (1 − P)
∆2
.
P nem ismert, de P · (1 − P) ≤ 1/4, azaz egy fels˝o becsl´es a mintanagys´agra: 2 z1−α/2 n= . 4 · ∆2
163 / 189
P´elda A Medi´an k¨ozv´elem´enykutat´ o okt´ ober v´egi 1200 f˝ os reprezentat´ıv mint´an alapul´o felm´er´ese alapj´an az ¨ osszes megk´erdezett 40%-a vallotta mag´at biztos szavaz´ onak (HVG, 45. sz´am, 2012. november 10). Adjon 95%-os megb´ızhat´ os´ag´ u konfidenciaintervallumot a biztos szavaz´oknak az ar´any´ara az ¨ osszes v´alaszt´ opolg´ar k¨oz¨ott. n = 1200, p = 0.4, α = 0.05, z1−α/2 = z0.975 = 1.96, sp2 = 0.0002. A keresett konfidencia intervallum: r r p(1 − p) 0.4 · 0.6 p ± z1−α/2 = 0.4 ± 1.96 = 0.4 ± 0.0277, n 1200 azaz Int 0.95 (P) = (0.3723, 0.4277).
164 / 189
P´elda
Az el˝oz˝o p´eld´aban 90%-os megb´ızhat´ os´ag mellett h´any elem˝ u minta kell az 1%-os pontoss´ag el´er´es´ehez? α = 0.1, z1−α/2 = z0.95 = 1.6449, ∆ = 0.01. A sz¨ uks´eges mintaelemsz´am egy fels˝ o becsl´ese: n=
2 z1−α/2
4 · ∆2
=
1.6449 2 · 0.01
2 = 6763.9.
6764 elem˝ u minta m´ar biztosan teljes´ıti a k´ıv´ant felt´eteleket.
165 / 189
´ ek¨osszeg becsl´ese Ert´ Y1 , Y2 , . . . , YN : N elem˝ u sokas´ag. µ = Y : sokas´agi v´arhat´ o ´ert´ek. Y 0 = NY = Nµ: ´ert´ek¨ osszeg. Ha a µ v´arhat´o ´ert´ekre adott egy az y1 , y2 , . . . , yn minta alapj´an k´esz¨ ult konfidencia intervallum, akkor az ´ert´ek¨ osszegre vett konfidencia intervallum ennek az intervallumnak az N-szerese. P´ elda T´ız v´eletlenszer˝ uen kiv´alasztott zs´ak b´ uza t¨ olt˝ ot¨ omege alapj´an az ´atlagos t¨olt˝ot¨omegre vett 95%-os megb´ızhat´ os´ag´ u konfidencia intervallum: Int 0.95 (µ) = (60.7454, 64.3346) kg. Tegy¨ uk fel, hogy a rakt´arban egy h´et alatt 10000 zs´akot t¨oltenek meg. Ekkor az ¨osszes t¨ olt˝ omennyis´egre vett 95%-os megb´ızhat´os´ag´ u konfidencia intervallum: Int 0.95 (Y0 ) = 10000(60.7454, 64.3346) kg = (607.454, 643.346) tonna. 166 / 189
V´arhat´o ´ert´ekek k¨ul¨onbs´eg´enek becsl´ese. Ismert sz´or´as x1 , x2 , . . . , xnX : FAE minta N (µX , σX2 ) eloszl´asb´ ol. 2 y1 , y2 , . . . , ynY : FAE minta N (µY , σY ) eloszl´asb´ ol. A k´et minta f¨ uggetlen ´es a σX2 ´es σY2 varianci´ak ismertek. δ = µY − µX : becs¨ ulend˝ o sokas´agi jellemz˝ o. d = y − x: becsl˝of¨ uggv´eny, norm´alis eloszl´as´ u, E(d) = δ (torz´ıtatlan),
Var(d) = Var(y )+Var(x) = σd2 =
σY2 σX2 + , nY nX
ez´ert adott α eset´en P d − z1−α/2 σd < δ < d + z1−α/2 σd = 1 − α. Az (1 − α) · 100%-os megb´ızhat´ os´ag´ u konfidencia intervallum q 2 σ σ2 als´o hat´ara: y − x − z1−α/2 nYY + nXX ; q 2 σ σ2 fels˝o hat´ara: y − x + z1−α/2 nYY + nXX . 167 / 189
V´arhat´o ´ert´ekek k¨ul¨onbs´eg´enek becsl´ese. Ismeretlen sz´or´as x1 , x2 , . . . , xnX : FAE minta N (µX , σX2 ) eloszl´asb´ ol. y1 , y2 , . . . , ynY : FAE minta N (µY , σY2 ) eloszl´asb´ ol. A k´et minta f¨ uggetlen ´es a σX2 ´es σY2 varianci´ak nem ismertek, de egyenl˝ oek, azaz σX2 = σY2 = σ 2 . δ = µY − µX : becs¨ ulend˝ o sokas´agi jellemz˝ o. P nX (xi − x)2 ; σX2 becsl´ese: sX2 = nX1−1 i=1 P Y σY2 becsl´ese: sY2 = nY1−1 nj=1 (yi − y )2 . σ 2 = σX2 = σY2 kombin´alt becsl´ese: sc2 =
(nX − 1)sX2 + (nY − 1)sY2 . nX + nY − 2
d = y − x becsl˝of¨ uggv´eny standard hib´aja ´es becs¨ ult standard hib´aja s r σX2 σY2 1 1 σd = + , s d = sc + . nY nX nY nX 168 / 189
V´arhat´o ´ert´ekek k¨ul¨onbs´eg´enek becsl´ese. Ismeretlen sz´or´as d = y − x becsl˝of¨ uggv´eny eloszl´asa N (δ, σd2 ), valamint T =
d −δ ∼ tν , sd
ahol ν = nX + nY − 2,
ez´ert adott α eset´en P d − t1−α/2 (ν)s d < δ < d + t1−α/2 (ν)s d = 1 − α. t1−α/2 (ν): a ν = nX + nY − 2 szabads´agi fok´ u t-eloszl´as p = 1 − α/2 rend˝ u kvantilise. T´abl´azatb´ ol meghat´arozhat´o. Az (1 − α) · 100%-os megb´ızhat´ os´ag´ u konfidencia intervallum q als´o hat´ara: y − x − t1−α/2 (nX + nY − 2)sc n1Y + n1X ; q fels˝o hat´ara: y − x + t1−α/2 (nx + nY − 2)sc n1Y + n1X . 169 / 189
P´elda K´etfajta instant k´ av´e old´ od´ asi idej´et tesztelt´ek, melyekb˝ ol minden alkalommal azonos mennyis´eget tettek 1 dl forr´ asban l´ev˝ o v´ızbe. A k´ıs´erletek eredm´enyeit az al´ abbi t´ abl´ azat tartalmazza: K´ av´e Old´ od´ asi id˝ o (m´ asodperc) Mokka Makka (Y ) 8.2 5.0 6.8 6.7 5.8 7.3 6.4 7.8 Koffe In (X ) 5.1 4.3 3.4 3.7 6.1 4.7 Az old´ od´ asi id˝ oket norm´ alisnak, a sz´ or´ asokat pedig egyenl˝ onek t´etelezve fel adjon 95%-os megb´ızhat´ os´ ag´ u konfidencia intervallumot az ´ atlagos old´ od´ asi id˝ ok k¨ ul¨ onbs´eg´ere. nY = 8, nX = 6, ν = 12, α = 0.05, t1−α/2 (ν) = 2.1788, y = 6.75, x = 4.55, sY2 = 1.0857, sX2 = 0.9670. A variancia kombin´ alt becsl´ese: (nX −1)sX2 + (nY −1)sY2 7 · 1.0857 + 5 · 0.9670 2 = = 1.0362, sc = 1.0180. sc = nX + nY − 2 12 A keresett konfidencia intervallum: r r 1 1 1 1 y −x ±t1−α/2 (nX +nY −2)sc + = 6.75−4.55±2.1788·1.0180 + nY nX 8 6 Int 0.95 (δ) = Int 0.95 (µY − µX ) = (1.0022, 3.3978). 170 / 189
P´aros minta
y1 y2 yn Y , ,..., : FAE minta vektorra, di = yi − xi x1 x2 xn X norm´alis eloszl´as´ u (i = 1, 2, . . . , n), E(Y ) = µY , E(X ) = µX . A k´et ism´erv nem f¨ uggetlen! δ = µY − µX : becs¨ ulend˝ o sokas´agi jellemz˝ o. d1 , d2 , . . . , dn : u ´j minta N (δ, σd2 ) eloszl´asb´ ol. Ezzel a mint´aval k´esz´ıt¨ unk konfidencia intervallumot δ-ra. 2 1 Pn σd2 becsl´ese: sd2 = n−1 i=1 di − d . T =
d −δ √ ∼ tn−1 , sd / n
ez´ert adott α eset´en sd sd P d − t1−α/2 (n − 1) √ < δ < d + t1−α/2 (n − 1) √ = 1 − α. n n Az (1 − α) · 100%-os megb´ızhat´ os´ag´ u konfidencia intervallum als´o hat´ara: d −t1−α/2 (n−1) √sdn ; fels˝ o hat´ara: d +t1−α/2 (n−1) √sdn .
171 / 189
P´elda A Mindent Tud´ as Egyeteme m´ asod´eves gazdas´ aginformatikus hallgat´ oi k´et z´ arthelyi dolgozatot ´ırtak statisztik´ ab´ ol. Az al´ abbi t´ abl´ azat t´ız v´eletlenszer˝ uen kiv´ alasztott hallgat´ o eredm´enyeit tartalmazza: Hallgat´ o I. dolgozat (Y ) II. dolgozat (X )
A 57 53
B 63 62
C 67 63
D 82 80
E 45 46
F 65 64
G 53 44
H 32 28
I 51 50
J 27 29
A dolgozateredm´enyek elt´er´es´et norm´ alis eloszl´ as´ unak t´etelezve fel adjon 98%-os megb´ızhat´ os´ ag´ u konfidencia intervallumot az ´ atlagos pontsz´ amok k¨ ul¨ onbs´eg´ere. ´ minta (di = yi − xi ): 4, 1, 4, 2, −1, 1, 9, 4, 1, −2. Uj n = 10, α = 0.02, t1−α/2 (n − 1) = t0.99 (9) = 2.8214, d = 2.3, sd2 = 9.7889, sd = 3.1287. A keresett konfidencia intervallum: sd 3.1287 d ± t1−α/2 (n − 1) √ = 2.3 ± 2.8214 √ = 2.3 ± 2.7915, n 10 azaz Int 0.98 (δ) = Int 0.98 (µY − µX ) = (−0.4915, 5.0915). 172 / 189
H´anyadosbecsl´ es p´ aros minta eset´ en y1 y y , 2 , . . . , n : FAE minta x1 x2 xn
Y X
vektorra.
E(Y ) = µY , E(X ) = µX , Var(Y ) = σY2 , Var(X ) = σX2 . H = µY /µX : becs¨ ulend˝ o sokas´agi jellemz˝ o. h = y /x: becsl˝of¨ uggv´eny, eloszl´asa nem ismert, de nagy minta eset´en k¨ozel norm´alis. E(h) ≈ H +
H 2 VX − r (X , Y )VX VY . n
VX = σX /µX , VY = σY /µY : X ´es Y relat´ıv sz´ or´asa. r (X , Y ): X ´es Y korrel´aci´ oja. Var(h) ≈
H2 2 VX + VY2 − 2r (X , Y )VX VY . n
h a H h´anyados torz´ıtott, de aszimptotikusan torz´ıtatlan ´es konzisztens becsl´ese. 173 / 189
K¨uls˝o inform´aci´os becsl´es K¨ uls˝o inform´aci´o: pl. ismert µX . µY becsl´ese: µ ˆ Y = µX ·
y x
= µX · h.
Var(ˆ µY ) = µ2X Var(h) ≈
1 2 σY + H 2 σX2 − 2Hr (X , Y )σX σY . n
Hagyom´anyos becsl´es varianci´aja: Var(y ) = Var(ˆ µY ) ≤ Var(y ),
ha
σY2 n
.
σY2 1 ≥ σY2 +H 2 σX2 −2Hr (X , Y )σX σY , n n
azaz r (X , Y ) ≥
1 VX · . 2 VY
Ha az X ´es Y korrel´aci´ oja el´eg nagy, a k¨ uls˝ o inform´aci´ot haszn´al´o becsl´es hat´ekonyabb, mint a minta´atlag. 174 / 189
Becsl´es EV mint´ab´ol EV minta: N elem˝ u sokas´agb´ ol v´alasztunk n elemet visszatev´es n´elk¨ ul. K¨ ul¨onbs´egek a FAE mint´ahoz k´epest. I
A minta fontos jellemz˝ oje az alapsokas´ag N nagys´aga.
I
Az egyes mintaelemek nem f¨ uggetlenek.
A mintajellemz˝ok eloszl´as´anak meghat´aroz´asa j´oval bonyolultabb, mint FAE minta eset´en. Nagy mint´ak eset´en a minta´atlag, az ´ert´ek¨osszeg ´es a sokas´agi ar´any k¨ ozel´ıt˝oleg norm´alis eloszl´as´ u. σ2 N − n σ2 n E(y EV ) = µ, Var(y EV ) = ≈ 1− . n N −1 n N
I
EV mint´ab´ol a v´arhat´o ´ert´ek becsl´ese pontosabb, mint ugyanakkora FAE mint´ab´ol. 175 / 189
Sokas´agi ´atlag becsl´ese, nagy minta y1 , y2 , . . . , yn : EV minta egy N elem˝ u sokas´agb´ ol, n ≥ 30. µ = Y : becs¨ ulni k´ıv´ant sokas´agi jellemz˝ o. Ha σ ´ert´eke ismert, adott α eset´en r r σ n σ n P y − z1−α/2 √ 1− < Y < y + z1−α/2 √ 1− = 1−α. N N n n Az (1 − α) · 100%-os megb´ızhat´ os´ag´ u konfidencia intervallum p σ n als´o hat´ara: y −z1−α/2 √n 1 − N ; p fels˝o hat´ara: y +z1−α/2 √σn 1 − Nn . ´ ek¨osszeg becsl´ese: FAE mint´ahoz hasonl´ Ert´ oan Ha σ nem ismert, akkor az s empirikus sz´ or´assal helyettes´ıhetj¨ uk. Adott ∆ pontoss´aghoz sz¨ uks´eges mintaelemsz´am: n=
2 z1−α/2 σ2 2 z1−α/2 σ 2 /N + ∆2
. 176 / 189
Sokas´agi ar´any becsl´ese EV mint´ab´ol Legyen P valamilyen tulajdons´ag´ u elemek ar´anya az N elem˝ u sokas´agban. Minta: n darab visszatev´es n´elk¨ ul kiv´alasztott sokas´agi elem. Pˆ = p = kn : P torz´ıtatlan ´es konzisztens becsl˝ of¨ uggv´enye, k a vizsg´alt tulajdons´ag´ u elemek sz´ama a mint´aban. n p(1−p) n P(1−P) 1− ≈ sp2 = 1− . E(p) = P, Var(p) = n N n N Ha a mintaelemsz´am nagy, akkor Z=
p−P sp
eloszl´asa k¨ ozel N (0, 1),
ez´ert adott α eset´en az (1 − α) · 100%-os megb´ızhat´os´ag´ u konfidencia intervallum q p als´o hat´ara: p−z1−α/2 p(1−p) 1− Nn , n q p fels˝o hat´ara: p+z1−α/2 p(1−p) 1− Nn . n 177 / 189
A hipot´ezisvizsg´alat ´altal´anos k´erd´esei A sokas´agokra vonatkoz´ o k¨ ul¨ onf´ele feltev´eseket hipot´eziseknek, az azok helyess´eg´enek mintav´eteli eredm´enyekre alapozott vizsg´alat´at pedig hipot´ezisvizsg´alatnak nevezz¨ uk. A hipot´ezisek a vizsg´alt sokas´ag(ok) eloszl´as´ara vagy az adott eloszl´aso(ok) egy vagy t¨obb param´eter´ere vonatkozhatnak. A k¨ ul¨ onf´ele hipot´ezisek vizsg´alat´ara szolg´al´o elj´ar´asokat statisztikai pr´ ob´aknak nevezz¨ uk. Eredm´eny¨ ul nem azt kapjuk, hogy egy hipot´ezis igaz-e, vagy sem, hanem hogy az adott k¨ or¨ ulm´enyek k¨ oz¨ ott elfogadjuk-e. P´ elda 1. Tudva, hogy egy u ¨dit˝ oitalt gy´art´ o g´epsorr´ ol leker¨ ul˝o palackokban a folyad´ekmennyis´eg norm´alis eloszl´as´ u 3 ml sz´or´assal, egy 10 elem˝ u minta alapj´an vizsg´aljuk meg, az ´atlagos t¨olt˝omennyis´eg 500 ml-e. 2. Egy 15 elem˝ u minta alapj´an vizsg´aljuk meg, a gy´art´osorr´ol leker¨ ul˝o palackokban a folyad´ekmennyis´eg norm´alis eloszl´as´ u-e. 3. 500 ember haj- illetve szemsz´ın´et megvizsg´alva d¨onts¨ unk, a hajsz´ın f¨ uggetlen-e a szemsz´ınt˝ ol. 179 / 189
Hipot´ezisek megfogalmaz´asa K´et egym´asnak ellentmond´ o feltev´est – hipot´ezist – fogalmazunk meg. Az egyik: nullhipot´ezis, jel¨ ol´ese H0 , err˝ ol hozunk d¨ont´est. A m´asik: alternat´ıv hipot´ezis, vagy ellenhipot´ezis, jel¨ol´ese H1 . P´ elda 1. Jel¨olje µ a palackokba t¨ olt¨ ott folyad´ekmennyis´eg v´arhat´o ´ert´ek´et. H0 : µ = 500 ml; 2. H0 : H1 : 3. H0 : H1 :
a a a a
H1 : µ 6= 500 ml.
folyad´ekmennyis´eg norm´alis eloszl´as´ u; folyad´ekmennyis´eg nem norm´alis eloszl´as´ u. hajsz´ın ´es a szemsz´ın f¨ uggetlenek egym´ast´ol; hajsz´ın ´es a szemsz´ın nem f¨ uggetlenek egym´ast´ol.
Egyszer˝ u nullhipot´ezis: fenn´all´asa eset´en a sokas´ag eloszl´asa egy´ertelm˝ uen meghat´arozott. 180 / 189
A pr´obaf¨uggv´eny meghat´aroz´asa Pr´obaf¨ uggv´eny: az y1 , y2 , . . . , yn minta egy olyan T (y1 , y2 , . . . , yn ) f¨ uggv´enye, melynek eloszl´asa H0 teljes¨ ul´ese eset´en ismert. P´ elda Az u ¨dit˝ oitalt gy´art´ o g´epsorr´ ol leker¨ ul˝ o palackokban a folyad´ekmennyis´eg norm´alis eloszl´as´ u σ = 3 ml sz´ or´assal ´es ha H0 igaz, akkor 500 ml v´arhat´ o ´ert´ekkel. n = 10 eset´en y ∼ N (500, 32 /10), azaz z=
y − 500 y − 500 √ = √ ∼ N (0, 1). σ/ n 3/ 10
A hipot´ezisek vizsg´alat´ara pr´ obaf¨ uggv´enyeket haszn´alunk, amik a becsl˝of¨ uggv´enyekhez hasonl´ oan val´ osz´ın˝ us´egi v´altoz´ok. A pr´obaf¨ uggv´enyt u ´gy kell megv´alasztani, hogy I a sokas´ agra tett bizonyos kik¨ ot´esek teljes¨ ul´ese (pl. norm´alis eloszl´as, ismert sz´ or´as), I a mintav´ etel adott m´ odja ´es a minta adott nagys´aga (pl. FAE minta vagy n ≥ 100), I az ellen˝ orzend˝o H0 helyess´eg´enek felt´etelez´ese mellett annak eloszl´asa pontosan ismert legyen. Ehhez H0 -nak egyszer˝ u hipot´ezisnek kell lennie. 181 / 189
Szignifikanciaszint, kritikus tartom´any A pr´obaf¨ uggv´eny ´ert´ekk´eszlet´et k´et diszjunkt r´eszre bontjuk, egy elfogad´asi (E ) ´es egy kritikus (K ) tartom´anyra. A hat´arok megad´asa: ha H0 teljes¨ ul, akkor a pr´ obaf¨ uggv´eny egy el˝ore megadott nagy 1 − α val´ osz´ın˝ us´eggel az elfogad´asi tartom´anyba esik, ahol α kicsi (pl. 0.1, 0.05, 0.01). Szignifikanciaszint: α · 100% (pl. 10%, 5%, 1%) K - α
Bal oldali kritikus tartom´any.
E
ca : a pr´ obaf¨ uggv´eny eloszl´as´anak
1−α
p = α rend˝ u kvantilise.
ca E - 1−α
ca
E 1−α
Jobb oldali kritikus tartom´any.
α
cf : a pr´ obaf¨ uggv´eny eloszl´as´anak p = 1 − α rend˝ u kvantilise.
cf K - α/2
K
K K´etoldali kritikus tartom´any. - obaf¨ uggv´eny eloszl´as´anak α/2 ca , cf : a pr´ p = α/2 ill. 1−α/2 rend˝ u kvantilise. c f
182 / 189
Egy- ´es k´etoldali kritikus tartom´anyok A val´os´agnak a nullhipot´ezisben r¨ ogz´ıtett ´allapott´ ol val´o meghat´arozott ir´any´ u elt´er´esei egyoldali alternat´ıv hipot´ezisk´ent ´ırhat´ok fel. Ha az egyoldali alternat´ıv hipot´ezis fenn´all´asa eset´en a pr´obaf¨ uggv´eny kisebb ´ert´eket vesz fel, mint H0 fenn´all´asakor, bal oldali, ellenkez˝o esetben pedig jobb oldali alternat´ıv hipot´ezisr˝ol besz´el¨ unk. b A bal oldali alternat´ıv hipot´eziseket ezut´an H1 -vel, a jobb oldaliakat pedig H1j -vel jel¨olj¨ uk. A val´os´agnak a nullhipot´ezisben r¨ ogz´ıtett ´allapott´ ol val´o tetsz˝oleges ir´any´ u elt´er´esei k´etoldali alternat´ıv hipot´ezisk´ent fogalmazhat´ok meg. A k´etoldali alternat´ıv hipot´ezis fenn´all´asa eset´en a pr´obaf¨ uggv´eny ´ert´eke ak´ar kisebb, ak´ar nagyobb lehet, mint H0 fenn´all´asakor. A k´etoldali alternat´ıv hipot´eziseket ezut´an H1 -gyel jel¨olj¨ uk. P´ elda H0 : µ = 500 ml; H1b : µ < 500 ml;
H1j : µ > 500 ml;
H1 : µ 6= 500 ml.
ca , cf : kritikus ´ert´ekek, hozz´atartoznak a kritikus tartom´anyhoz.
183 / 189
P´elda Tudva, hogy egy u ¨dit˝ oitalt gy´ art´ o g´epsorr´ ol leker¨ ul˝ o palackokban a folyad´ekmennyis´eg norm´ alis eloszl´ as´ u 3 ml sz´ or´ assal, egy 10 elem˝ u minta alapj´ an 5%-os vizsg´ aljuk meg, az ´ atlagos t¨ olt˝ omennyis´eg 500 ml-e. ´Irjuk fel az egyoldali ´es a k´etoldali kritikus tartom´ anyokat. Szignifikanciaszint: 5%, azaz α = 0.05. y − 500 √ . Ha H0 teljes¨ ul, eloszl´ asa standard norm´ alis. Pr´ obaf¨ uggv´eny: z = 3/ 10 Kvantilisek: Rend: p Kvantilis: zp
α/2 = 0.025 -1.9600
α = 0.05 -1.6449
H0 : µ = 500 ml;
1 − α = 0.95 1.6449
1 − α/2 = 0.975 1.9600
H1 : µ 6= 500 ml.
Kritikus tartom´ any: z ≤ ca = zα/2 = z0.025 = −1.96 vagy z ≥ cf = z1−α/2 = z0.975 = 1.96, azaz |z| ≥ 1.96. H0 : µ = 500 ml;
H1b : µ < 500 ml.
Kritikus tartom´ any: z ≤ ca = zα = z0.05 = −1.6449. H0 : µ = 500 ml;
H1j : µ > 500 ml.
Kritikus tartom´ any: z ≥ cf = z1−α = z0.95 = 1.6449. 184 / 189
Mintav´etel ´es d¨ont´es A minta adataib´ol kisz´am´ıtjuk a pr´ obaf¨ uggv´eny ´ert´ek´et. Ha az a kritikus tartom´anyba esik, a megadott szinten elvetj¨ uk H0 -t, ellenkez˝o esetben elfogadjuk. P´ elda Egy teheraut´ orakom´ annyi f´elliteres u ¨d´ıt˝ oitalb´ ol 10 palackot v´eletlenszer˝ uen kiv´ alasztva ´es lem´erve azok u ˝rtartalm´ at az al´ abbi, milliliterben kifejezett ´ert´ekeket kaptuk: 499, 525, 498, 503, 501, 497, 493, 496, 500, 495. Ismert, hogy a palackokba t¨ olt¨ ott u ¨d´ıt˝ oital mennyis´ege norm´ alis eloszl´ as´ u 3 ml sz´ or´ assal. 5%-os d¨ ont´esi szintet haszn´ alva vizsg´ alja meg a gy´ art´ o azon ´ all´ıt´ as´ at, hogy a palackokba ´ atlagosan f´el liter u ¨d´ıt˝ oitalt t¨ olt¨ ottek. H0 : µ = 500 ml;
H1 : µ 6= 500 ml
(k´etoldali ellenhipot´ezis).
n = 10, α = 0.05, σ = 3, y = 500.7. Kritikus tartom´ any: |z| ≥ 1.96. 500.7 − 500 √ Pr´ obaf¨ uggv´eny ´ert´eke: z = = 0.7379 < 1.96. 3/ 10 5%-os szinten elfogadjuk H0 -t. 185 / 189
Hib´ak Els˝ofaj´ u hiba: a H0 hipot´ezist elvetj¨ uk, pedig igaz. Val´osz´ın˝ us´ege megegyezik az α szignifikanciaszinttel. M´asodfaj´ u hiba: a H0 hipot´ezist elfogadjuk, pedig nem igaz. Ennek a β val´osz´ın˝ us´eg´et csak akkor sz´amszer˝ us´ıthetj¨ uk, ha pontosan tudjuk, a H0 helyett a val´ os´agban milyen egyszer˝ u alternat´ıva ´all fenn. H0 elvetj¨ uk elfogadjuk
igaz els˝ ofaj´ u hiba (α) helyes d¨ ont´es (1 − α)
nem igaz helyes d¨ ont´es (1 − β) m´asodfaj´ u hiba (β)
Adott mintanagys´ag ´es egyszer˝ u alternat´ıva mellett az els˝ofaj´ u ´es a m´asodfaj´ u hiba elk¨ovet´esi val´ osz´ın˝ us´ege egym´assal ellent´etes ir´anyba mozog.
186 / 189
p-´ert´ek A p-´ert´ek az a legkisebb szignifikanciaszint, amin H0 m´ar ´eppen elvethet˝o H1 -el szemben. A p-´ert´ek a T pr´ obaf¨ uggv´enynek a hipot´ezisvizsg´alathoz haszn´alt mint´ab´ ol nyert ´ert´eke alapj´an hat´arozhat´o meg. Egyoldali alternat´ıv hipot´ezis eset´en a p-´ert´ek u ´gy hat´arozhat´o meg, hogy a pr´obaf¨ uggv´eny mint´ab´ ol nyert ´ert´ek´et H1 ir´any´anak megfelel˝oen als´o vagy fels˝ o kritikus ´ert´eknek tekintj¨ uk, majd meg´allap´ıtjuk, vagy megbecs¨ ulj¨ uk a hozz´a tartoz´ o szignifikanciaszintet. K´etoldali alternat´ıv hipot´ezis eset´en a pr´ obaf¨ uggv´eny mint´ab´ol nyert ´ert´ek´et el˝ojel´et˝ol – egyes esetekben nagys´ag´at´ol – f¨ ugg˝oen als´o vagy fels˝o kritikus ´ert´eknek tekintj¨ uk, majd a hozz´atartoz´o szignifikanciaszint k´etszeres´et vessz¨ uk. Adott α szint eset´en: p ≤ α: elvetj¨ uk H0 -t;
p > α: elfogadjuk H0 -t. 187 / 189
P´elda Minta: 499, 525, 498, 503, 501, 497, 493, 496, 500, 495. Hipot´ezisek: H0 : µ = 500 ml;
H1 : µ 6= 500 ml
(k´etoldali ellenhipot´ezis).
n = 10, σ = 3, y = 500.7. 500.7 − 500 √ = 0.7379 > 0. 3/ 10 Fels˝o kritikus ´ert´ekk´ent kezelj¨ uk: Pr´obaf¨ uggv´eny ´ert´eke: z =
P(Z ≥ 0.7379) = 1 − P(Z ≤ 0.7379) = 1 − Φ(0.7379) = 1 − 0.7697 = 0.2303. p-´ert´ek: 2 · 0.2303 = 0.4606. α ≥ 0.4606: elvetj¨ uk H0 -t;
α < 0.4606: elfogadjuk H0 -t. 188 / 189
¨ Osszetett nullhipot´ezisek P´ elda H0 : µ ≥ 500 ml;
H1 : µ < 500 ml.
Az ¨osszetett nullhipot´ezis helyett az egyoldali alternat´ıv hipot´ezisnek legkev´esb´e ellentmond´ o egyszer˝ u hipot´ezist v´alasztjuk. A p´eld´aban: µ = 500 ml. A H1b vagy H1j egyoldali alternat´ıv hipot´ezisnek legkev´esb´e ellentmond´o egyszer˝ u hipot´ezist technikai nullhipot´ezisnek nevezz¨ uk ´es H0T -vel jel¨olj¨ uk. A p´eld´aban: H0T : µ = 500 ml;
H1 : µ < 500 ml.
Ha H0T elvethet˝o valamely egyoldali alternat´ıv hipot´ezissel szemben, akkor vele egy¨ utt elvethet˝ o az adott egyoldali alternat´ıv hipoT t´ezisnek H0 -n´el jobban ellentmond´ o minden egyszer˝ u hipot´ezis is. Ha H0T nem vethet˝o el valamely egyoldali alternat´ıv hipot´ezissel szemben, akkor csak annyi ´all´ıthat´ o, hogy a vizsg´alt alternat´ıv hipot´ezissel szemben legal´abb egy egyszer˝ u hipot´ezis nem utas´ıthat´o vissza.
189 / 189