Sređivanje podataka

Komunikacija brojeva, mnogo brojeva…

Dr Nikola Grubor

2024-10-12

Grupisanje je proces organizovanja podataka.

Apsolutni i relativni brojevi

Formalna definicija

\(f_{abs} = \frac{\#n}{\text{interval}}\)

\(f_{rel} = \frac{f_{abs}}{\text{Ukupan broj podataka}} \%\)

Tabelarno prikazivanje aps. i rel. podataka

Varijabla N = 100
Navika
Nepusac 51 (51%)
Pusač 49 (49%)
1 n (%)

Apsolutni jeleni i relativne ajkule

  • Relativni brojevi mogu prenaglasiti rizik (bitnost) neke pojave
  • Dobri za plašenje drugih, publikacije
  • Loši za javno zdravlje, naučni progres
  • Ali potrebni za kauzalno tumačenje

Apsolutni jelen

Relativna ajkula

Opasnost zavisi od izloženosti

Komunikacija rizika

Mnogi ljudi mešaju relativni i apsolutni rizik.

  • 1 od 10,000 žena ima trombozu
  • 3 od 10,000 žena na kontraceptivnim pilulama ima trombozu

\(RR = \frac{3/10,000}{1/10,000} = 3.00\)

  • \(\uparrow\) 200% u trombozama!
  • Promena verovatnoće je samo 0.0002 (2 žene u 10,000)
  • Trudnoća povećava verovatnoću tromboze mnogo više (1-2 od 1000 ima DVT)

Relatini efekat statina

Redukcija LDL-a u odnosu na vrstu statina.

Različiti efekti u studijama

Efikasnost (50-65 god):

  • Mortalitet (\(RR = 0.86; ARR = 0.40\%; NNT = 250\))
  • CVD (\(RR = 0.69; ARR = 0.43\%; NNT = 233\))
  • CVI (\(RR = 0.71; ARR = 0.38\%; NNT = 263\))
  • MI (\(RR = 0.64; ARR = 0.81\%; NNT = 123\))

Dodatak: definicija relativnog rizka

Rizik
Je proporcija.

\[ R = \frac{\text{broj infarkta}}{\text{ukupan broj pacijenata}} \]

Relativni rizik
Je odnos proporcija.

\[ RR = \frac{\text{rizik sa statinom}}{\text{rizik bez statina}} \]

Ako je RR \(\lt1\) rizik je manji kod grupe koja je uzimala statin. Relativni rizik meri koje su šanse da se dogadjaj desi u grupi koja je uzimala lek u odnosu na onu koja nije.

Dodatak: definicija apsolutnog rizika

Apsolutna redukcija rizika (ARR)
Razlika (ne odnos proporcija) između broja događaja kod pacijenata koji su pili statin i onih koji nisu.

\[ ARR = \text{rizik bez statina} - \text{rizik sa statinom} \]

Broj potreban za lečenje (NNT)
Broj pacijenata koji moramo da lečimo (engl. NNT, number needed to treat) da bi sprečili jedan neželjen događaj.

\[ NNT = 1/ARR \]

Grafički prikaz relativne redukcije rizika

Kako smanjenje 1 mmHg pritiska utiče na kardiovaskularni rizik?

Greška osnovne stope

Apsolutni antibiotik, relativni statin

  • Apsolutni rizik je informativniji (koliko loših događaja sprečeno?)
  • Relativni rizik je bitan kada umemo da procenimo osnovni rizik (ko će imati najveću korist od terapije?)
  • Vakcinacija (100% velike boginje)
  • Antibiotici

Dobri i loši grafikoni

Vizualizacije su bitne u komunikaciji

Šta nije u redu sa ovim srcem?

Definisanje podataka za prikupljanje

Dete
Čovek sa \(\lt16\) godina života.
Velika (otvorena) hirurgija
Zaustavljanje srca + kardiopulmonalni bajpas.
Mortalitet
Smrt koja se desila \(\le30\) dana od operacije.

Zašto ovako definisan mortalitet nije dobra mera kvaliteta hirurgije?

Tabelarno prikazivanje podataka

tinytable_ifw90t8rfq3k4nfvggsx
Bolnica Operacije Prezivelo Umrlo Preživljavanje Smrtnost
Newcastle Freeman Hospital 511 497 14 97.3% 2.7%
Leicester Glenfield Hospital 578 572 6 99% 1%
Bristol Royal Hospital For Children 710 697 13 98.2% 1.8%
Southampton Wessex Cardiothoracic Centre 720 708 12 98.3% 1.7%
Dublin Our Lady's Children's Hospital 963 935 28 97.1% 2.9%
Liverpool Alder Hey Hospital 974 955 19 98.1% 1.9%
Leeds General Infirmary 920 904 16 98.3% 1.7%
London Royal Brompton Hospital 661 653 8 98.8% 1.2%
London Evelina London Children's Hospital 932 913 19 98% 2%
Birmingham Children's Hospital 1141 1118 23 98% 2%
London Great Ormond Street Hospital for Children 1476 1469 7 99.5% 0.5%

Hirurški mortalitet kod transpozicije

Grafikon PISA testiranja

Stubičasti dijagram

Kružni dijagram

Kružni dijagram najzastupljenijih religija u SAD

Stubičasti dijagram najzastupljenijih religija u SAD

Kružni dijagram udela bolnica u operacijama transpozicije

Stubičasti dijagram udela bolnica u operacijama transpozicije

Prikazivanje nominalnih podataka

Grupišu se po kategorijama

  • Odrediti apsolutne i relativne učestalosti za pol i pušenje
  • Grafički prikaz
    • stubičasti dijagram (bar chart)
    • kružni dijagram (pie chart)
    • sačuvati grafikon

Savet

Statistical analysis \(\rightarrow\) Discrete variables \(\rightarrow\) Frequency distributions

Prikazivanje ordinalnih podataka

Grupišu se po kategorijama

  • Odrediti apsolutne i relativne učestalosti za zadovoljstvo_zz
  • Grafički prikaz
    • stubičasti dijagram (bar chart)
    • kružni dijagram (pie chart)
    • sačuvati grafikon

Prikazivanje diskontinuiranih podataka

Grupišu se po diskretnim vrednostima ili klasnim intervalima

  • Apsolutne i relativne učestalosti za hr_bronhitis
  • Grafički prikaz
    • stubičasti dijagram (bar chart)
    • kružni dijagram (pie chart)
    • sačuvati grafikon

Diskretne vrednosti bronhitisa

tinytable_30ttofnaj2szlja7k1c5
Broj resp. infekcija n %
0 4 13
1 8 27
2 8 27
3 4 13
4 2 7
5 4 13

Stubičasti dijagram bronhitisa

Kako prikazati numeričke podatke?

Široki intervali nisu korisni

Uski intervali nisu korisni

Broj intervala je proizvoljan

Histogram

Informacije sažete distribucijom

Prikazivanje kontinuiranih podataka

Grupišu se po klasnim intervalima

  • Odrediti apsolutne i relativne učestalosti za starost
  • Grafički prikaz
    • histogram
    • poligon frekvencija

Poligon frekvencija

Ponekad možemo prekršiti pravila

Vežbanje

Iz baze baza DZ.xlsx tabelarno i grafički prikazati:

  • hipertenziju
  • uhranjenost
  • starost

Zaključak

  • Relativni rizici deluju bitnije nego što jesu; apsolutni rizici pojašnjavaju
  • Očekivane frekvencije (1 od 100) su jasnije za interpretaciju
  • Grafikoni se moraju pažljivo praviti i tumačiti
  • Način prikazivanja podataka zavisi od njihovog tipa*

Struktura kursa

tinytable_57vzdfmw9o7h8669nmpw
Nedelja Tema
1 Uvod u medicinsku statistiku
2 Sređivanje podataka
3 Statističko opisivanje podataka
4 Verovatnoća i raspodele verovatnoća
5 Populacija i uzorak
6 Testiranje hipoteza o populacionim prosečnim vrednostima i proporcijama
7 Testiranje hipoteza o učestalostima
8 Testiranje hipoteza o rangovima
9 Korelacija
10 Regresija / Kolokvijum
11 Podaci, informacije i znanje
12 Zdravstveni informacioni sistem
13 Mere dijagnostičke tačnosti
14 Medicinsko odlučivanje
15 Bioinformatika