Statistika
Editovat
Note
|
Popisná statistika, střední hodnota, medián, rozptyl, korelace. Odhady statistik a jejich spolehlivost. Distribuční funkce, rozdělení náhodných veličin a jejich příklady. MB103/MB203 |
Popisná statika
Popisuje charakteristiky dané množiny dat.
Note
|
Matematická statistika je aplikací teorie pravděpodobnosti, matalýzy, lingebry, atd. na statistiku. |
- Statistický soubor
-
Zkoumaná množina objektů.
- Statistická jednotka
-
Prvek statistického souboru.
- Statistický znak
-
Vlastnost statistických jednotek.
- Soubor hodnot
-
(Uspořádaná) množina možných hodnot statistického znaku.
- Měřítko
-
Porovnává hodnoty.
-
nominální — mezi hodnotami není žádný vztah (např. politické strany).
-
ordinální měřítko — mezi hodnotami není žádný vztah, ale lze je uspořádat (např. A, B, C, D).
-
intervalové měřítko — porovnání velikostí, ale ne absolutní hodnota (např. teplota, kde poloha nuly není relevantní).
-
poměrové měřítko — pevně stanované měřítko i nula (např. délka v cm).
-
Míry polohy
Hodnoty kolem, kterých se výsledky měření zhromažďují. Mají smysl u znaků s poměrovým nebo intervalovým měřítkem.
- Střední hodnota (mean / expected value) E(X)
-
Aritmetický průměr souboru hodnot vážený jejich pravděpodobností (resp. ) je
Pokud se všech hodnot vyskytuje se stejnou pravděpodobností (či ve stejném počtu), pak
- -kvantil
-
Dělí statický soubor na stejně velké části.
- Medián
-
Prostřední prvek uspořádaného statistického souboru. Kvantil .
- Percentil
-
Výběrový kvantil (-tý kvantil, kde ) .
- Modus
-
Hodnota s největší četností.
Míry variability
Jak moc se od sebe prvky liší (nezávisle na konstantním posunutí)?
- Rozptyl
-
Střední hodnota kvadrátů odchylek od střední hodnoty.
Nebo jinými slovy:
-
Pro každý prvek spočti odchylku — o kolik se liší od střední hodnoty.
-
Všechny odchylky dej na druhou.
-
Spočítej průměr odchylek na druhou.
-
- Směrodatná odchylka
-
- Kovariance veličin a
-
Měří určitou podobnost mezi a .
Ze vzorce výše plyne
- Korelace
-
Míra podobnosti náhodných veličin a . Pokud , pak . Pokud jsou a nezávislé, pak .
Rozdělení pravděpodobnosti
Rozdělení pravděpodobnosti diskrétní náhodné veličiny je funkce resp. , která každé hodnotě popisované touto veličinou přidělí pravděpodobnost.
Hustota pravděpodobnosti spojité náhodné veličiny je funkce resp. , která každé hodnotě popisované touto veličinou přidělí pravděpodobnost.
Note
|
Náhodná veličina je zobrazení . Rozdělení pravděpodobnosti je zobrazení . Dejme tomu, že u šestistěnky jsou jednotlivé stěny kostky prvky . Náhodnou veličinou stěn kostky může být třeba počet hran, barva nebo číslo, co je na ní napsané. V případě čísla je , takže , přičemž u férové kostky platí , pro . |
Distribuční funkce
Jaké je pravděpodobnost, že to bude nejvýše tahle hodnota?
U diskrétní veličiny je to funkce
kde .
U spojité veličiny je to funkce
Platí a .
Distribuční funkci lze použít k výpočtu pravděpodobnosti .
U diskrétních veličin
- Degenerované rozdělení
-
Pro veličinu , která nabývá jen konstantní hodnoty .
- Alternativní rozdělení
-
Pro veličinu , jejíž výsledek může být jen zdar (1) nebo nezdar (0) s pravděpodobností a .
- Binomické rozdělení
-
Pro veličinu měřící počet zdarů nezávislých pokusů s alternativním rozdělením .
Pro velké konverguje k normálnímu .
- Poissonovo rozdělení
-
Pro veličinu vyjadřující počet výskytů jevů v určitém intervalu (času, délce, …) parametrizovaném , když jevy nastávají nezávisle na sobě.
U spojitých veličin
- Rovnoměrné rozdělení
-
Pro veličiny s konstantní pravděpodobností na intervalu .
- Exponenciální rozdělení
-
- Normální rozdělení
-
Pro veličiny jejichž hustota pravděpodobnosti vypadá jako Gaussova křivka parametrizovaná střední hodnotou a rozptylem .
- Standardní normální rozdělení
-
Odhady
Hodnota (bodový odhad) nebo interval hodnot (intervalový odhad), do kterého veličina s určitou pravděpodobností spadá.
- Interval spolehlivosti
-
Intervalový odhad pro veličinu se spolehlivostí , kde , je dvojice . Platí
.
Hodnotě se říká hladina spolehlivosti. Střed intervalu nazveme bodovým odhadem.