Statistika

Editovat
Note

Popisná statistika, střední hodnota, medián, rozptyl, korelace. Odhady statistik a jejich spolehlivost. Distribuční funkce, rozdělení náhodných veličin a jejich příklady.

MB103/MB203

Popisná statika

Popisuje charakteristiky dané množiny dat.

Note
Matematická statistika je aplikací teorie pravděpodobnosti, matalýzy, lingebry, atd. na statistiku.
Statistický soubor

Zkoumaná množina objektů.

Statistická jednotka

Prvek statistického souboru.

Statistický znak

Vlastnost statistických jednotek.

Soubor hodnot

(Uspořádaná) množina možných hodnot statistického znaku.

Měřítko

Porovnává hodnoty.

  • nominální — mezi hodnotami není žádný vztah (např. politické strany).

  • ordinální měřítko — mezi hodnotami není žádný vztah, ale lze je uspořádat (např. A, B, C, D).

  • intervalové měřítko — porovnání velikostí, ale ne absolutní hodnota (např. teplota, kde poloha nuly není relevantní).

  • poměrové měřítko — pevně stanované měřítko i nula (např. délka v cm).

Míry polohy

Hodnoty kolem, kterých se výsledky měření zhromažďují. Mají smysl u znaků s poměrovým nebo intervalovým měřítkem.

Střední hodnota (mean / expected value) E(X)

Aritmetický průměr souboru hodnot vážený jejich pravděpodobností (resp. ) je

Pokud se všech hodnot vyskytuje se stejnou pravděpodobností (či ve stejném počtu), pak

-kvantil

Dělí statický soubor na stejně velké části.

Medián

Prostřední prvek uspořádaného statistického souboru. Kvantil .

Percentil

Výběrový kvantil (-tý kvantil, kde ) .

Modus

Hodnota s největší četností.

Míry variability

Jak moc se od sebe prvky liší (nezávisle na konstantním posunutí)?
Rozptyl

Střední hodnota kvadrátů odchylek od střední hodnoty.

Nebo jinými slovy:

  1. Pro každý prvek spočti odchylku — o kolik se liší od střední hodnoty.

  2. Všechny odchylky dej na druhou.

  3. Spočítej průměr odchylek na druhou.

Směrodatná odchylka
Kovariance veličin a

Měří určitou podobnost mezi a .

Ze vzorce výše plyne

Korelace

Míra podobnosti náhodných veličin a . Pokud , pak . Pokud jsou a nezávislé, pak .

Rozdělení pravděpodobnosti

Rozdělení pravděpodobnosti diskrétní náhodné veličiny je funkce resp. , která každé hodnotě popisované touto veličinou přidělí pravděpodobnost.

Hustota pravděpodobnosti spojité náhodné veličiny je funkce resp. , která každé hodnotě popisované touto veličinou přidělí pravděpodobnost.

Note

Náhodná veličina je zobrazení . Rozdělení pravděpodobnosti je zobrazení .

Dejme tomu, že u šestistěnky jsou jednotlivé stěny kostky prvky . Náhodnou veličinou stěn kostky může být třeba počet hran, barva nebo číslo, co je na ní napsané. V případě čísla je , takže , přičemž u férové kostky platí , pro .

Distribuční funkce

Jaké je pravděpodobnost, že to bude nejvýše tahle hodnota?

U diskrétní veličiny je to funkce

kde .

U spojité veličiny je to funkce

Platí a .

Distribuční funkci lze použít k výpočtu pravděpodobnosti .

U diskrétních veličin

Degenerované rozdělení

Pro veličinu , která nabývá jen konstantní hodnoty .

Alternativní rozdělení

Pro veličinu , jejíž výsledek může být jen zdar (1) nebo nezdar (0) s pravděpodobností a .

Binomické rozdělení

Pro veličinu měřící počet zdarů nezávislých pokusů s alternativním rozdělením .

Pro velké konverguje k normálnímu .

Poissonovo rozdělení

Pro veličinu vyjadřující počet výskytů jevů v určitém intervalu (času, délce, …​) parametrizovaném , když jevy nastávají nezávisle na sobě.

U spojitých veličin

Rovnoměrné rozdělení

Pro veličiny s konstantní pravděpodobností na intervalu .

Exponenciální rozdělení

Normální rozdělení

Pro veličiny jejichž hustota pravděpodobnosti vypadá jako Gaussova křivka parametrizovaná střední hodnotou a rozptylem .

Standardní normální rozdělení

Odhady

Hodnota (bodový odhad) nebo interval hodnot (intervalový odhad), do kterého veličina s určitou pravděpodobností spadá.

Interval spolehlivosti

Intervalový odhad pro veličinu se spolehlivostí , kde , je dvojice . Platí

.

Hodnotě se říká hladina spolehlivosti. Střed intervalu nazveme bodovým odhadem.