Testiranje hipoteza o populacionim prosečnim vrednosima i proporcijama

… i malo o naučnom metodu.

Dr Nikola Grubor

2024-11-06

Tri cilja statistike

  • Opis podataka
  • Objašnjenje (uzroka) podataka
    • Odlučivanje
  • Predviđanje

Statističko testiranje nultih hipoteza

  • Bitno za razumevanje naučnih radova
  • Neintuitivno je \(\rightarrow\) neshvaćeno
  • Korisno u kontekstu

Načinite svoje teorije složenim

“Ukoliko naučna tvrdnja govori o realnosti, onda mora biti opovrgljiva: a ukoliko nije opovrgljiva, ona onda ne govori o stvarnosti.

― Karl R. Popper, Logika naučnog otkrića (1934)

Karl Popper

Kako naučnici razmisljaju?

\(H\): Da li su više vrednosti serumske glukoze povezane sa brojem akni?

  1. Izmerimo glukozu i prebrojimo akne.
  2. Da li su akne češće (verovatnije) sa višim vrednostima glukoze i ostalim infomacijma koje posedujemo?

…a statističari?

Međutim, zbog istorijskih razloga…

  1. Izvrnemo našu hipotezu: Više vrednosti serumske glukoze nisu povezane sa brojem akni.
  2. Pretpostavimo da je izvrnuta hipoteza (1) istinita.
  3. Procenimo koliko su podaci koje smo dobili verovatni ako je (2) tačno.
  4. Ako su podaci malo verovatni, zaključimo da je (2) pogrešno; ali ako su podaci verovatni, zadržimo (2).

Recept za testiranje nulte hipoteze

  1. Formiranje hipoteze koja predstavlja naše mišljenje (pre nego što smo videli podatke)
  2. Određivanje nulte i alternativne hipoteze
  3. Prikupljanje podataka relevantnih za našu hipotezu
  4. Napraviti model koji predstavlja podatke i izračunati test statistiku
  5. Izračunati verovatnoću da naši podaci daju dobijenu test statistiku ako je nulta hipoteza tačna
  6. Proceniti “statističku značajnost”

Da li je BMI povezan sa fizičkom aktivnošću?

tinytable_f0kah1oe2cctlvwp4lmv
Pol Starost Masa Visina BMI Aktivan
male 34 87.4 164.7 32.22 No
male 34 87.4 164.7 32.22 No
male 34 87.4 164.7 32.22 No
female 49 86.7 168.4 30.57 No
female 45 75.7 166.7 27.24 Yes
female 45 75.7 166.7 27.24 Yes

\[ BMI = \frac{masa(kg)}{visina(m)^2} \]

Korak 1: Formulisanje hipoteze

Pretpostavljamo da je \(BMI\) veći kod ljudi koji se ne bave fizičkom aktivnošću, u poređenju sa onima koji to rade.

Korak 2: Definisanje nulte i alternativne hipoteze

Kako očekujemo da će izgledati podaci ako nema nikakvog efekta.

\[ H_0: BMI_{aktivni} = BMI_{neaktivni} \]

Odgovarajuća alternativna hipoteza je onda:

\[ H_1: BMI_{aktivni} \not = BMI_{neaktivni} \]

Korak 3: Prikupiti podatke

tinytable_gnabkrdrkibqmh17l834
Aktivan N Aritmetička sredina sd
No 3631 29.43 7.27
Yes 4619 27.10 6.18

Korak 4: Opisati podatke modelom i izračunati test-statistiku

Određivanje da li imamo dovoljno dokaza za \(H1\) kada poredimo aritmetičke sredine se radi uz pomoć Studentovog t-testa.

\[ t = \frac{\bar x_1 - \bar x_2}{ SE(\bar x_1 - \bar x_2) } \] gde je: \(x\) aritmetička sredina; \(SE\), standardna greška razlike arit. sredine.

William Sealy Gosset (1876-1937)

Korak 5: Odrediti verovatnoću opserviranih podataka ako je nulta tačna

t.test(BMI ~ Aktivan, data = nhanes)

    Welch Two Sample t-test

data:  BMI by Aktivan
t = 15.427, df = 7121.5, p-value < 2.2e-16
alternative hypothesis: true difference in means between group No and group Yes is not equal to 0
95 percent confidence interval:
 2.035247 2.627778
sample estimates:
 mean in group No mean in group Yes 
         29.43069          27.09918 

Studentova t-distribucija

Korak 6: Proceniti “statističku značajnost”

Koliko dokaza nam treba da budemo ubeđeni da razlika postoji?

  • Poslednji korak
  • Kontroverzan
  • Nema “tačan” odgovor

Konvencionalna vrednost od \(p<0.05\) je istorijski artefakt koji garantuje da ćemo pogrešno zaključiti u 5% slučajeva.

Testiranje hipoteza kao odlučivanje: Neyman-Pearsonov pristup

tinytable_3o5fme1o7mmemucg1t8u
Odluka $H_0$ istina $H_0$ neistina
Odbacivanje \(H_0\) Greška prvog tipa ($\alpha$) Ispravan zakljucak ($1-\alpha =$ nivo poverenja)
Neodbacivanje \(H_0\) Ispravan zakljucak ($1-\beta =$ snaga testa) Greska drugog tipa ($\beta$)

Snaga testa (\(1-\beta\))

Šta znači dobiti \(p = 0.01\)?

Da li to znači da je verovatnoća da je \(H_0\) tačna 0.01?

Ne. P-vrednost je verovatnoća podataka ako pretpostavimo da je nulta hipoteza tačna (\(P(podaci|H_0)\)). Nema nikakve veze sa obrnutom tvrdjom tačnosti nulte ako opserviramo podatke (\(P(H_0|podaci)\)).

Da li je to verovatnoća da ćemo napraviti grešku u zaključivanju od 0.01 (1%)?

Ne. To je opet \(P(H_0|podaci)\), p-vrednosti se odnose na verovatnoću podataka, ne na verovatnoće hipoteza.

Da li to znači da ako ponovimo studiju šansa da dobijmo isti rezultat je 99%?

Ne. P-vrednost je tvrdnja verovatnosti trenutnih podataka ako uzmemo da je nulta hipoteza tačna. Ne dozvoljava nam da pravimo tvrdnje o budućim replikacijama.

Da li niska p-vrednost znači da smo našli klinički bitan efekat?

Ne. To što je nešto statistički značajno nam ne govori ništa o jačini efekta. Sa dovoljno velikim uzorkom lako je otkriti statistički značajne, ali sitne efekte.

Formalan prikaz odnosa grešaka

Šta utiče na snagu?

Snaga zavisi od:

  • Odabranog nivoa značajnosti (α nivo)
  • Veličine uzorka
  • Formulacije \(H_1\) kao dvosmerne ili jednosmerne
  • Stvarne razlike ispitivane pojave (effect size)

Uslovi primene t-testa

  1. Slučajno biran uzorak
  2. Numerički podaci
  3. Normalna raspodela u populaciji

Izbor statističkog testa (1)

Statistički testovi su:

  • Kao roboti
  • Moćni
  • Nisu mudri
  • Opasni
  • Uske kontekstualne primene

Izbor statističkog testa (2)

Izbor statističkog testa zavisi od:

  • Tipa podataka
  • Dizajna studije
    • Nezavisni ili zavisni
  • Broja uzoraka
  • Raspodele podataka
    • Parametarski (neparametarski)

Verzije Studentovog t-testa

  1. Studentov t-test za jedan uzorak
  2. Studentov t-test za dva nezavisna uzorka
  3. Studentov t-test za dva zavisna uzorka

Vežba: Studentov t-test za jedan uzorak

Na osnovu prethodnih istraživanja očekivana

aritmetička sredina iznosi 145 mmHg.

Da li populacija iz koje potiče uzorak u

bazi Sistolna TA.xlsx ima

aritmetičku sredinu jednaku očekivanoj?

Testirati na nivou značajnosti od 0.05.

Vežba: Studentov t-test za dva nezavisna uzorka

Da li se ukupan holesterol u bazi DZ.xlsx

razlikuje kod pušača i nepušača? Testirati na

nivou značajnosti od 0.01.

Nameštanje p-vrednosti

  • Institucionalni problem
  • Manjak edukacije
  • Problem višestrukog testiranja
  • “Vidi da li ima značajne razlike…”
  • “Smislićemo hipotezu kad vidimo kakva je baza…”

Možemo da pročitamo rad

Struktura kursa

tinytable_y0334h4dzqbyrd5hjz3i
Nedelja Tema
1 Uvod u medicinsku statistiku
2 Sređivanje podataka
3 Statističko opisivanje podataka
4 Verovatnoća i raspodele verovatnoća
5 Populacija i uzorak
6 Testiranje hipoteza o populacionim prosečnim vrednostima i proporcijama
7 Testiranje hipoteza o učestalostima
8 Testiranje hipoteza o rangovima
9 Korelacija
10 Regresija / Kolokvijum
11 Podaci, informacije i znanje
12 Zdravstveni informacioni sistem
13 Mere dijagnostičke tačnosti
14 Medicinsko odlučivanje
15 Bioinformatika