Adatok statisztikai feldolgozása Kaszaki József Ph.D Szegedi Tudományegyetem Sebészeti Műtéttani Intézet Szeged
A mérési adatok kiértékelése, statisztikai analízis A mért adatok konvertálása adatbázis kezelőbe (Excel) Az adatbázis elkészítése; Ábra készítés; Statisztikai analízis
Az adatok eloszlás típusa, eloszlás vizsgálata Elemszám, átlag/medián, adatok szórása; Konfidencia intervallum; Szignifikancia szint; P érték;
5. A mérési adatok kiértékelése, statisztikai analízis 1. A mért adatok konvertálása adatbázis kezelőbe (Excel) 2. Az adatbázis elkészítése; 3. Ábra készítés; 4. Statisztikai analízis Van kis hazugság
Van nagy hazugság és a
STATISZTIKA
5. Statisztikai analízis Az adatok jellemzői: eloszlás, átlag v. medián, szórás; Konfidencia (megbízhatósági) intervallum: amely (általában) nagy valószínűséggel tartalmazza a becsült paraméter valódi értékét; Szignifikancia szint → P érték: a statisztikai valószínűség értéke; Statisztikailag szignifikáns különbségről beszélünk, (P = <0.05), ha az átlag értékek különbsége a vizsgált csoportok között nagyobb, mint amit a véletlen idézhetne elő; Eloszlás vizsgálat: A/ Szórás azonosság fennáll: Paraméteres eloszlás (Gausz görbe) Paraméteres statisztikai próbák
B/ Nincs szórás azonosság: Nem-paraméteres eloszlás (torz Gausz görbe) Nem-Paraméteres statisztikai próbák
Az adatok eloszlása Eloszlás vizsgálat
Normális eloszlás Gaus görbe Szórás azonosság Átlag ±SD
-SD
Paraméteres statisztikai próbák
Átlag
+SD
Nem normális eloszlás Torzult Gaus görbe Nincs szórás azonosság Medián (25%; 75%)
25%
Nem-Paraméteres statisztikai próbák
Medián átlag
75%
Eloszlás vizsgálat módszere: A szórás azonosság vizsgálata, F próba Eloszlás vizsgálat eredménye: A/ Szórás azonosság fennáll: Paraméteres eloszlás (Gausz görbe) Paraméteres statisztikai próbák B/ Nincs szórás azonosság: Nem-paraméteres eloszlás (torz Gausz görbe) Nem-Paraméteres statisztikai próbák
A közép és a szóródás jellemzőinek „párosítása” Közép
Szóródás
Közlés cikkekben
Átlag
Standard deviáció, Standard error
Átlag (SD) Átlag ± SD Átlag ± SE Átlag ± SEM Med (min, max) Med (25.p,75.p)
Medián Min, max 5%-os, 95%-os percentilis 25 % , 75% (Kvartilisek)
SD vagy SE? • 55.2 ± 15.7 (SD)
• 55.2±1.57 (SE, n=100) Probability Density Function y=normal(x;52.2;1.57) 1.0 0.26 0.24 0.8
0.22 0.20 0.18
0.6
0.16 0.14 0.12
0.4
0.10 0.08 0.06
0.2
0.04 0.02 0.00 20
23.8
86.6
Ebben az intervallumban van az adatok 95.44%-a 1. Leíró statisztika
0.0 40
52.2
60
80
55.34
Ebben az intervallumban van az igazi átlag 95%-os valószínűséggel
Standard deviáció vagy standard error?? • Standard deviáció, SD: a minta szórása, a mintaadatok szóródása az átlag körül. Normális eloszlás esetén az átlag ±2SD-n belül van az adatok kb. 95%-a • Standard error (SE=SD/√n): az átlag megbízhatósága, a mintaátlag szóródása az (ismeretlen) populáció átlag körül. Normális eloszlás esetén az átlag ± 2SE-n belül van az igazi átlag kb. 95%-os valószínűséggel.
ADATOK ÁBRÁZOLÁSA Box-plot
Szívindex
ml/perc/kg
Pont-vonal
200
Átlag+SD Medián+25%,75%
180 160 140 120 100 80 60
Műtét 0
1
Műtét 2
Idő (óra)
3
0
1
2
Idő (óra)
3
4
Ábrázolás: Medián érték 25.-75. percentilissel CVP (Hgmm) 10
Kolloid Krisztalloid
*
x
*x
*x *x
8
x 6
4
2
50
0 -15
0
50
15
100
30
100
45
Idő (perc)
150
60
150
75
90
105
Ábrázolás: Átlag érték SD-val Szívindex (ml/perc/m2) 5,0
*X
Kolloid Krisztalloid
4,5
*
*
*
* *
*
4,0
3,5
3,0 50
-15
0
50
15
100
30
100
45
Idő (perc)
150
60
150
75
90
105
A KONTROL I. Mit tekintünk kontrollnak? Mit viszonyítunk mihez? A kontrollnak azt az állapotot kell tükröznie, amelyhez képest egy beavatkozás következtében fellépő változás mértéke meghatározható Kontroll érték (baseline) → normál körülmények között, a tervezett beavatkozás előtt mért érték → ön-kontrollos kísérlet 0
Baseline.
60
Hemorrhagic shock 60 min
90
150
240 min
Resuscitation
Az ön-kontroll nem mindig adekvált. Hosszabb időtartamú vizsgálatok esetében számos tényező (pl. altatás) befolyásolhat. Ezért beavatkozás nélküli, önálló kontroll csoportra van szükség → ál-műtött (ál-kezelt) csoport.
A KONTROL II. Ha egy kórállapotot befolyásoló farmakológiai kezelés hatékonyságát vizsgáljuk
A kezelés hatását egy negatív és egy pozitív kontroll csoport adataihoz hasonlítjuk Negatív kontroll → olyan állapot, amelyben a vizsgált paraméterek változása minimális → nincs intervenció; Pozitív kontroll → olyan állapot, amely során a vizsgált paraméterek maximális mértékű változását hozzuk létre →maximal intervenció;
Pl.: Ha kísérletes pleuritis hatását vizsgáljuk a thorakális leukocyta szám változására: Negatív kontroll = ál-műtét, kórállapot okozása nélkül (NINCS pleuritis); Pozitív kontroll: Kísérletesen indukált pleuritis (carrageenan injekció). Leukocytes/ml
X
8000
6000
#
#
4000
2000
0
Control
Pleuritis
Pleuritis +ASA
Pleuritis +PE food
A kísérleti CSOPORTOK Kontroll: pozitív, negatív, ál-műtött; Előkezelt (pl. gyógyszeresen); Kezelt (a már indukált folyamat közben); Kísérleti beavatkozásnak (pl. sebészi) kitett; etc.
A kísérleti PROTOKOL A kísérlet periódusainak egymást szigorú időrendben követő sorozata, amely általában a kontroll, az intervenció és a megfigyelés periódusaiból áll. Szigorú, előre meghatározott mintavételezések sorozata.
időrendben
elvégzett
• Kontroll / baseline • A kísérletes intervenció sebészi; pathofiziológiai; farmakológiai (előkezelés/ kezelés hatása) • A megfigyelési periódus
mérések,
A kísérleti PROTOKOL típusai I. I/A
Before and After
Két mérés ugyanazon az egyeden; Beavatkozás ELŐTT és UTÁNNA. A statisztika szempontjából → egymástól függő mérések;
I/B
Két csoport összehasonlítása
Csak egy-egy mérés/mintavétel mindkét vizsgált csoportban; A két csoport 1-1 (azonos) időpillanatbeli eltérésének összehasonlítása; Kontroll – Kezelt csoportok esete; A statisztika szempontjából → egymástól független mérések;
I/A
Egy-egy mérés ugyanazon az egyeden; a beavatkozás ELŐTT és UTÁNA
Szívindex
ml/perc/kg 200
Átlag+SD Medián+25%,75%
180 160 140 120 100 80 60
Műtét 0
1
Műtét 2
Idő (óra)
3
0
1
2
Idő (óra)
3
4
I/B
Egy-egy mérés a mindkét vizsgálati csoportban, ugyanazon időpontban Kontroll – Kezelt csoportok esete; Miafrancáz Aktivitás mU/mg protein/perc 100
75
50
25
0
Kontroll csoport
Kezelt csoport
Folytonos eloszlás 2 minta (mérés) esetén Normális eloszlás Paraméteres próbák
Független Kétmintás t-próba Unpaired t-test Két beteg csoporton 1-1 mérés
Függő Önkontroll
Nem Normális eloszlás Nem Paraméteres próbák
Független
Függő Önkontroll
Egymintás t-próba Mann-Whitney teszt Wilcoxon teszt Paired t-test Kétmintás próba Egymintás próba Egy beteg csoporton 2 mérés
Két beteg csoporton 1-1 mérés
Egy beteg csoporton 2 mérés
Kettőnél több csoport összehasonlítása Mintavétel EGY időpontban Negativ kontroll, Pozítiv kontroll, Kezelt A, Kezelt B csoportok összehasonlítása; Speciális eset: mintavétel ugyanazon az egyed kezelt és nem kezelt végtagjából
3.6. A kísérleti PROTOKOL típusai II. Kettőnél több csoport összehasonlítása mU/mg protein/min 80
60
*
Sham I/R+Saline I/R+GEL I/R+HES
X
*X
40
20
0
Ischemic limb
Control limb
*
P<0.05 vs control limb
Negatív kontroll (álműtött), Pozitív kontroll (I/R), Kezelt I. (I/R+GEL), Kezelt II. (I/R+HES) összehasonlítása; Statisztika szempontjából → Független mérések
Kettő csoport összehasonlítása DE mintavétel a beavatkozás előtt és után is történik KÉT csoport → 2-2 mérés
DEGRANUL ÁLT H ÍZÓSEJTEK DEGRANULÁLT HÍZÓSEJTEK AR ÁNYA ARÁNYA
V ÉKONYBÉL XANTHIN VÉKONYBÉL XANTHIN OXID ÁZ OXIDÁZ ENZIMAKTIVIT ÁS ENZIMAKTIVITÁS
pmol/perc-1/mg protein-1
Degranulált hízósejt / Összes hízósejt (%)
18 80
SBTX SBTX+IPC
SBTX
16
*
SBTX+IPC
14
*
60
*#
*
12
#
10 8
40
6 4
20
2 IPC
IPC
Hideg ischaemia
Hideg ischaemia
0
0 -180
-120
-60
0
180
Idő (perc)
240
-180
-120
-60
0
180
Idő (perc)
240
A kísérleti PROTOKOL típusai III. Ismételt (kettőnél több) mérések esete egy csoportban Kettőnél több mérést/mintavételt végzünk ugyanazon az egyeden, meghatározott időrend A vizsgált paraméter változását a szerint. kiindulási kontroll (baseline) értékhez hasonlítjuk; 0
Baseline.
60
Hemorrhagic shock 60 min
90
150
240 min
Resuscitation
Statisztika szempontjából → Egymástól függő mérések
Kettő csoport összehasonlítása, ismételt, 2-nél TÖBB mintavételezéssel KÉT csoport → n - n mérés n>2
MESENTERIC MESENTERIC BLOOD BLOOD FLOW FLOW
CARDIAC CARDIAC OUTPUT OUTPUT
CObw (ml/min/kg)
SMA blood flow (ml/min/kg)
200
SBTX
175
25
#
150
# *
125
*
#
SBTX+IPC
20
#
15
100 75
SBTX
50
SBTX+IPC
*
*
*
*
*
10
*
*
*
*
120
180
240
5
25 IPC
Cold Ischemia
0 -180
-120
-60
0
IPC
0
60
Time (min)
120
180
240
-180
-120
Cold Ischemia -60
0
60
Time (min)
Ismételt mérések: Mérések a Kontroll periódus (baseline), a Beavatkozás (sebészi, farmakológiai) és a Megfigyelési periódus alatt, meghatározott időrendben; Több csoportban - 2-nél TÖBB mérés
A kísérleti PROTOKOL típusai IV. Ismételt mérések kettőnél több csoportban 1. Vérzéses shock + zselatin (max. 50 ml/kg) (n=5) 0 Kontroll.
MAP 45 Hgmm 60 perc
60
90
150
240 perc
2. Vérzéses shock + hidroxietil-keményítő (max. 50 ml/kg) (n=5) 0 Kontroll
60
MAP 45 Hgmm 60 perc
90
150
240 perc
3. Vérzéses shock + dextrán (max. 50 ml/kg) (n=5) 0 Kontroll
MAP 45 Hgmm 60 perc
60
90
150
240 perc
Statisztika szempontjából: Egymástól függő mérések → csoporton belül; Egymástól független mérések → csoportok között;
Plasma Endothelin Level
fmol/mL
*
12 Gelatine HES Dextran
10
#
8
* **
6
*
* *
4 2 Hemorrhagic shock
0
0
*
30
60
Volume resuscitation
90 120 150 180 210 Time (min) P<0.05 vs baseline value (0 min) # P<0.05 vs HES group
240
Szignifikancia • Szignifikáns a különbség – ha azt mondjuk, hogy van hatás, az esetleges hibanagysága kicsi (maximum α). Ez az ún. első fajta hiba. • Nem szignifikáns a különbség – ilyenkor csak annyit tudunk mondani, hogy nincs elegendő információ a különbség kimutatására. Lehet, hogy – – – – –
Valóban nincs is különbség Van különbség, csak kevés volt az elemszám Nagy volt a szórás Rossz volt a vizsgálati módszer …
• A statisztikai szignifikanciát mindig át kell gondolni, vajon biológiai szempontból jelentős-e (előfordul, hogy túl sok elemszám esetén nagyon kis különbségek is szignifikánsak staisztikailag)
A hipotézisvizsgálat menete • Hipotézisek felállítása – Nullhipotézis: semmi nem történt – Alternatív hipotézis: valami változás van
• A döntés megbízhatósága (vagy a hiba) rögzítése: α=0.05 • Döntési szabály felállítása (függ: a kísérleti elrendezéstől, α-tól, az elemszámtól) • Döntés • A nullhipotézist elfogadjuk (nincs szignifikáns különbség α szinten, nincs elegendő információ a különbség (hatás) kimutatására) • A nullhipotézist elvetjük, a különbség szignifikáns α%-os szinten. A tapasztalt különbség nem csupán a véletlen műve, valami más hatás (kezelés??) is közbejátszott.
Paraméteres statisztikai próbák Előnyei: Jól megalapozott, „sarkos” matematikára épül; Az átlag és a szórás ismerete elegendő a statisztikai próbák, elvégzéséhez, tehát nem a teljes adathalmazzal kell dolgozni; A paraméteres próbák erősebbek, ha a feltételek teljesülnek A próbák robusztusak- feltételeik kisebb megsértése esetén még érvényesek maradnak
„Hátrány”: Ábrázolás esetén a feltüntetett szórás (± SD) mindig nagyobb, mint a nem-paraméteres eloszlásnál használt 2575 percentilis
Rangszámok készítése • 1241 • Sorba állítjuk az adatokat: 1 1 2 4 • A legkisebb kapja az 1-es rangszámot, a legnagyobb az n-et: 1 2 3 4 • Korrekció (kapcsolt rangok): az egyenlő elemek rangszámait korrigáljuk a megfelelő rangok átlagával: 1.5 1.5 3 4
A próbastatisztika általában valamilyen rangszámösszeg • Önkontrollos kísérlet: a különbségeket rangsoroljuk előjeltől függetlenül (a 0-kat kihagyjuk), majd az egyenlő előjelűeket összeadjuk • Független minták: a minták adatait egyesítjük, így készítjük el a rangssort, majd összeadjuk külön az egyik, külön a másik mintűhoz tartoó rangszámokat. • Ha igaz a nullhipotézis, a rangszámösszegek kb. megegyeznek
Nem-paraméteres statisztikai próbák Előnyei: A szórás ábrázolása esetén (25-75 percentilis) általában kisebb szórást mutat, mint a ±SD;
Hátrányai: Az átlag és a szórás ismerete NEM elegendő a statisztikai próbák elvégzéséhez, mindig a teljes adathalmazzal kell dolgozni; Kevésbé kidolgozott a matematikája, különösen a több szempontos, ismételt mérések esetére
Nem paraméteres próbák • Akkor alkalmazzuk, ha – – – –
A paraméteres próbák feltételei nem teljesülnek Nem tudjuk ellenőrizni (kis elemszám) Nem akarjuk ellenőrizni Ordinális változók (mennyire örülök a tavasznak??? Kicsitközepesen-nagyon)
• NEM HASZNÁLHATOK ÁTLAGOT ÉS SZÓRÁST!! • A fiziológiai paraméterek gyakrabban mutatnak nem normális eloszlást;
Folytonos eloszlás Kettőnél több minta (mérés) esetén
Normális eloszlás Paraméteres próbák Független
Függő
Kettőnél több Önkontroll + Csoport összeIsmételt mérések Hasonlítása Egy v. több szem- Variancia analízis pontos Variancia analízis Az adatok szignifikanciája esetén: Páronkénti összehasonlítás: Dunnett, LSD, Tukey, Scheffé 3 v. több beteg csoporton 1-1 mérés
Egy beteg csoporton 3, v. több ismételt mérés
Nem Normális eloszlás Nem Paraméteres próbák Független Kettőnél több Csoport összeHasonlítása Kruskal-Wallis próba
Függő Önkontroll + Ismételt mérések Friedmann próba
Az adatok szignifikanciája esetén: Páronkénti összehasonlítás: Dunn; Dunnett; 3 v. több beteg csoporton 1-1 mérés
Egy beteg csoporton 3, v. több ismételt mérés