Biostatistika a plánování ekologických pokusů
 

Semestr: zimní
SIS: MB120P147
Celkový rozsah: 2/1
Další přednášející: Zdeněk Janovský (vedení praktik)
Co je potřeba znát před přednáškou: podmínkou z zápisu je mít absolvovanou přednášku Biostatistika, již přednáší Karel Zvára. Je třeba vědět, že informace o světě kolem se získávají sběrem dat a že tato data je třeba umět sebrat a zpracovat.

Přednáška chce poskytnout přehled běžných statistických technik pro zpracování ekologických dat pro uživatele. Snaží se intuitivně vysvětlit smysl, povahu a možnosti používaných metod a ilustrovat je příklady.

Součástí přednášky jsou několik dvouhodinových praktik na zpracování dat. Účast na praktikách není povinná - chápu ji jako rozšiřující možnost naučit se předmět, nikoli jako podmínku ke zkoušce. Praktika probíhají v jazyce R - možná to pro start bude náročnější, ale získáte (i) úvod do programu/jazyka, který se dnes stává standardem ve statistickém zpracování dat, (ii) má ohromné možnosti v množství existujících knihoven, a (iii) je zcela zdarma (GNU licence).

Účast na přednáškách samozřejmě taky není povinná (i když přednášejícího potěší) - tu chápu jako možnost poslechnout si můj pokus vysvětlit taje statistického uvažování a technik, nikoliv jako způsob jak se poznámkami domoci vlastní malé učebnice statistiky (čím víc člověk píše, tím méně poslouchá...) . Ze stejného důvodu k přednášce nejsou připraveny žádné presentační materiály; v literatuře i na internetu existuje k předmětu dostatek informací. Rozsah přednášky (také zkoušky) je dán syllabem níže - ten prosím konsultujte, chcete-li vědět, co a v jakém rozsahu budu přednášet.

 

Časový rozvrh přednášek
Časový rozvrh praktik
Podmínky ke zkoušce
Termíny a výsledky zkoušek 

 

Časový rozvrh v roce 2014/2015

V tomto školním roce přednáška poběží v pondělí v 12,25 (prosím přesně) v Benátské 2, 2. mezipatro. Přednáška končí ca. ve 13,45.

 
6.10.

Úvod, typy statistických problémů , typy biologických veličin, exploratorní analýza dat s jednou proměnnou, opakování pojmů z teorie pravděpodobnosti.

13.10. Zásady statistické inference. Odhad parametrů jako předpoklad pro statistické testování, vlastnosti odhadu, střední chyba odhadu, interval spolehlivosti.  
20.10. Zásady statistického modelování. Odhad parametrů modelu, testování modelu, residuály.
27.10. přednáška se nekoná
3.11. Zásady statistického rozhodování: formulace a testování hypotéz, testové kritérium, chyba I a II druhu, hladina signifikance.
10.11. Regrese a korelace. Regresní analýza kvantitativních dat: Mnohonásobná regrese. Výběr nejvhodnějšího modelu.
17.11.

přednáška se koná ve státní svátek

Parciální regrese. Nelineární data v regresi, nelineární regrese. Regresní diagnostika.

24.11. Analýza variance: úvod, jednocestná ANOVA, mnohonásobná porovnávání, dvoucestná ANOVA, interakce.
1.12. Další situace řešené analýzou variance (hierarchická ANOVA, split-plot designs, opakovaná měření, pevné a náhodné efekty).
8.12. Neparametrické testy. Analýza frekvencí: kontingenční tabulky.
15.12. Analýza frekvencí: logistická regrese. Zobecnělé lineární modely.
5.1. Přehled testů na různé typy ekologických problémů. Přehled běžného softwaru. Obecné zásady pro zpracování dat v ekologii
bude domluveno Základy plánování ekologických pokusů. Metodologické zásady sběru dat.
letos nepřednáším Úvod do mnohorozměrných technik: analýza hlavních komponent, korespondenční analýza, kanonické techniky. Úvod do analýzy dat v čase a prostoru.
datum bude stanoveno Konzultační přednáška. Přijďte a připravte si otázky. (Sám nic nebudu říkat.)
 

Termíny praktik (vede Zdeněk Janovský):
 
  Základy zacházení s R; Grafické zobrazení a popis jedné proměnné
  Základy zacházení s R – pokračování; Grafické zobrazení vztahů více proměnných – základy explorační analysy dat
  Explorační analysa dat – pokračování; Korelace
  Lineární regrese - základy
  Opakování, první průběžný test
  Mnohonásobná regrese s postupným výběrem proměnných, analysa variance
  Interakce nezávislých proměnných, post hoc testy mnohonásobných porovnávání v analyse variance
  Analysy variance se složitějším designem – split-plot ANOVA, analysy s náhodnými faktory
  Opakování, druhý průběžný test
  Analysa frekvenčních dat – klasické testy, logistická regrese
  Analysa positivně šikmých celočíselných proměnných; analysa vícecestných kontingenčních tabulek
  Analysa nadměrně rozptýlených dat za pomoci zobecněných lineárních modelů
  Opakování, třetí průběžný test

 

Data jsou na Moodlu.

 


 
(1) Úvod, typy statistických problémů , typy biologických veličin, exploratorní analýza dat s jednou proměnnou, opakování pojmů z teorie pravděpodobnosti
Zpět na syllabus
Zpět na rozvrh

(2) Zásady statistické inference. Odhad parametrů jako předpoklad pro statistické testování, vlastnosti odhadu, střední chyba odhadu, interval spolehlivosti  

Zpět na syllabus
Zpět na rozvrh
 

(3) Zásady statistického rozhodování: formulace a testování hypotéz, testové kritérium, chyba I a II druhu, hladina signifikance

Zpět na syllabus
Zpět na rozvrh

(4) Zásady statistického modelování. Odhad parametrů modelu, testování modelu, residuály. Regrese a korelace.

Zpět na syllabus
Zpět na rozvrh

(5a) Regresní analýza kvantitativních dat: Mnohonásobná regrese. Výběr nejvhodnějšího modelu.

Zpět na syllabus
Zpět na rozvrh

 

(5b) Regresní analýza kvantitativních dat: pokračování. Parciální regrese. Nelineární data v regresi, nelineární regrese. Lokální regrese. Regresní diagnostika.

Zpět na syllabus
Zpět na rozvrh

 

(6) Analýza variance: úvod, jednocestná ANOVA, mnohonásobná porovnávání, dvoucestná ANOVA, interakce.

Zpět na syllabus
Zpět na rozvrh

(6) Analýza variance: Další situace řešené analýzou variance

Zpět na syllabus
Zpět na rozvrh

(7) Neparametrické testy

 

(8) Analýza frekvencí: kontingenční tabulky, logistická regrese

Zpět na syllabus
Zpět na rozvrh

(9) Zobecnělé lineární modely.

Model Rozdělení Závislost rozptylu na Ey Povolené hodnoty Ey Obvyklá link function Typická data
Logistická regrese binomické unimodální, s maximem v intervalu (0,1) <0,1>, spojité

logit

počet "úspěchů", včetně nulových hodnot, z předem známého počtu pozorování. Maximální počet je omezen počtem pozorování. (např. počet rostlin v pokusu, které vykvetly)
Poissonovská regrese Poissonovo lineárně rostoucí <0,+inf), celočíselné log počty, včetně nulových hodnot, ale bez omezení seshora (např. počet potomků na jedince)
Gamma regrese Gamma kvadraticky rostoucí (0,+inf), spojité 1/x spojitá sešikmená data, bez nulových hodnot (např. biomasy, velikostní rozměry ap., zejména pokud rozsah hodnot je velký - přes více řádů)
Obecný lineární model normální (Gaussovo) konstantní (-inf,+inf), spojité identita spojitá symetricky rozložená data (např. biomasy nebo velikostní rozměry, pokud rozsah hodnot je malý)

(10) Přehled testů na různé typy ekologických problémů. Přehled běžného softwaru.

Struktura nezávislých proměnných
Závislá proměnná
  Kvantitativní, nepříliš sešikmená (Dvoustavová) kategoriální Obecná proměnná (typicky sešikmené proměnné, příp. s nulami, vzdorující transformaci)
  Normální rozdělení Binomické rozdělení Obecné rozdělení
jedna kvantitativní jednoduchá regrese (lineární nebo ne) logistická regrese Zobecněný lineární model s příslušným rozdělením chyb
více kvantitativních mnohonásobná regrese, parciální regrese, postupná regrese (postupná) logistická regrese
jedna kategoriální dvoustavová analýza variance, t-test chi2 test nebo LR test v kontingenční tabulce, Fisherův exaktní test
jedna kategoriální vícestavová analýza variance, testy mnohonásobných porovnávání chi2 test nebo LR test v kontingenční tabulce
více kategoriálních analýza variance, testy interakce loglineární model, logistická regrese
jedna nebo více kategoriálních, opakované záznamy v čase analýza variance s opakovanými měřeními
zobecněné lineární modely nejsou příliš vhodné pro data s hierarchickou strukturou
jedna nebo více kategoriálních, hierarchická struktura dat hierarchická (nested) analýza variance
kvantitativní i kvalitativní analýza kovariance (postupná) logistická regrese Zobecněný lineární model s příslušným rozdělením chyb

 

Zpět na syllabus
Zpět na rozvrh

(11) Základy plánování ekologických pokusů.

Několik metodologických zásad sběru dat

Zpět na syllabus
Zpět na rozvrh

 

(12) Úvod do mnohorozměrných technik: analýza hlavních komponent, korespondenční analýza, kanonické techniky

(jen informativní přednáška - ke zkoušce není požadováno)

Pro zájemce: mnohorozměrným technikám je věnována speciální přednáška. Zde je její syllabus.

Zpět na syllabus
Zpět na rozvrh

 

(13) Analýza dat v čase a prostoru

(jen informativní přednáška - ke zkoušce není požadováno)

Zpět na syllabus
Zpět na rozvrh

 

Obecné zásady pro zpracování dat v ekologii

 

 


Doporučená základní literatura:

Doporučená rozšiřující literatura :

Literatura k disposici v elektronické formě:

učebnice/příručky

 


Zkouška

je písemná a sestává z doplňovacího test s 12 otázkami. 

 

Praktický návod pro zájemce o statistické zpracování dat

Praktický návod pro zájemce o porozumění práci s počítačem

O skriptech a prezentačních materiálech

 

 

Termíny a výsledky zkoušky v roce 2014/2015
 

Termíny zkoušek:

Termín si vyhrazuji právo zrušit, pokud přihlášených bude méně než čtyři (neučiním tak pro poslední termín ve školním roce, obvykle zářijový). Zápis je třeba učinit prostřednictvím SIS (ale přijdete-li nepřihlášeni, asi Vás nevyhodíme - jen možná budete muset čekat déle).  Výsledky zkoušek bývají známy obvykle do týdne až deseti dnů. Do klasifikovaných testů je samozřejmě možné po domluvě nahlédnout.

Zkoušku hodnotím pomocí skóre z testu (Skóre je podíl dosažených bodů k maximálnímu počtu bodů). Podmínka pro absolvování zkoušky je skóre vyšší než 0.5 z testu. Překladač skóre na známky: 1-0.83: jednička, 0.83- 0.67: dvojka, 0.67-0.50: trojka.

Výsledky zkoušek jsou zde.

Poslední aktualisace 17.11.2014

Domovská stránka