Praktikum k přednášce Molekulární ekologie
Populační struktura, FST,Structure, Genalex, Genetix
Pro studium populační struktury lze využít široké spektrum volně dostupných programů, např:
Genepop
http://genepop.curtin.edu.au/
Structure
https://web.stanford.edu/group/pritchardlab/structure.html
Genalex
http://biology.anu.edu.au/GenAlEx/Welcome.html
Genetix
http://www.genetix.univ-montp2.fr/genetix/genetix.htm
Novější alternativy ke Structure:
ADMIXTURE
(jen pro Linux a Mac)
http://www.genetics.ucla.edu/software/admixture/index.html
Structurama
(jen Mac)
http://cteg.berkeley.edu/~structurama/index.html
Další možnosti jsou i na stránce Structure
S výsledky ze Structure je třeba dále pracovat. Potřebné odkazy lze najít zde:
Structure
https://web.stanford.edu/group/pritchardlab/structure.html
(zde jsou odkazy i na programy na další práci s výstupy ze Structure)
K zjištění "optimálního"
K, tedy počtu skupin lze použít Structure Harvester http://taylor0.biology.ucla.edu/structureHarvester/
Mějte však na paměti, že populační struktura může být
hierarchická. Má tedy cenu uvažovat o výsledcích pro různá K.
Zajímavý je i CorrSieve http://www.arch.cam.ac.uk/research/laboratories/glyn-daniel/corrsieve
Úloha*:
Jsou mé lokusy dostatečné pro detekci populační struktury?
Lze využít simulace v programu Powsim:
Powsim (alternativně jen program)
data
Úloha*:
Proveďte explorační analýzu dat v programu Genetix pomocí faktoriální korespondenční analýzy. Menu je sice ve francouzštině, ale pokusem a omylem to jistě zvládnete :)
Program je ke stažení zde:
http://www.genetix.univ-montp2.fr/genetix/genetix.htm
data
Data musíme importovat, analýzu najdeme v menu pod AFC.
Úloha*:
Výpočtěte párová FST pro vámi studované populace
Postup: Pustím online versi programu Genepop http://genepop.curtin.edu.au/ Zvolím možnost 6. Fst & other correlations Zadám F statistics - For all population pairs Do rámečku vložím svá data ve formátu "Genepop". Nutno zadat i prvni radek s nazvem projektu (zde "Pokusna smyslena data"). Tvolím, že chci výsledek jako HTML a talčítkem Submit data spustím výpočet.
data
Průkaznost rozdílů populací zjišťuji pomocí možnosti 3. Population Differentiation z hlavního menu.
Úloha*:
Proveďte explorační analýzu dat v programu Genalex pomocí PCA založené na genetických distancích. Vypočtěte jednoduchou AMOVA ke zjištění průkaznosti rozdílů populací. Zjistěte výskyt privátních alel (alel vyskytujících se jen v jedné populaci).
Genalex http://biology.anu.edu.au/GenAlEx/Welcome.html
Program pracuje v Excelu. Spustíme ho kliknutím na stažený instalační soubor, povolíme makra. V menu Excelu se nám objeví Genalex.
Úloha*:
V programu Structure zařaďte jedince dle jejich genotypů do předem určeného počtu (K) skupin.
Postup:
Nainstaluji si program Structure (ke stažení z https://web.stanford.edu/group/pritchardlab/structure.html )
Připravím si data ve vhodném formátu
data
Po spuštění programu vytvořím nový projekt (hlavní menu - File - New Project).
Nadefinuji si parametry analýzy (hlavní menu - File - Parametr Set - New).
Zde zvolím nejen počet kroků, ale také předpokládaný model (Admixture nebo Non-Admixture).
Příkazem Run spustím běh programu. Musím však zadat předpokládaný počet skupin (K).
Vyzkoušejte různá K a různé modely.
S výsledky ze Structure je třeba dále pracovat. Potřebné odkazy lze najít zde:
Structure
https://web.stanford.edu/group/pritchardlab/structure.html
(zde jsou odkazy i na programy na další práci s výstupy ze Structure)
K zjištění "optimálního"
K, tedy počtu skupin lze použít Structure Harvester http://taylor0.biology.ucla.edu/structureHarvester/
Mějte však na paměti, že populační struktura může být
hierarchická. Má tedy cenu uvažovat o výsledcích pro různá K.
Zazipovaná data jsou zde
Ke vhodné grafické vizualizaci výsledků je
optimální CLUMPAK
http://clumpak.tau.ac.il/
ukázka zpracovaného výsledku
ze Structure
Na výsledky je ale třeba si déle počkat a
pro finální úpravu dat budeme potřebovat otevřít
zazipované soubory a nějaký program pro úpravu souborů s koncovkou .ps,
minimálně program typu PostScript viewer.
Zajímavý je i
CorrSieve
http://www.arch.cam.ac.uk/research/laboratories/glyn-daniel/corrsieve
Tento program navíc zvládá i metodu delta FST.
Úloha*:
V programu Geneland zjistěte optimální K a zařaďte jedince dle jejich genotypů do skupin.
Zkuste i prostorový model.
Geneland pracuje v prostředí R. Nejprve spustíme R a musíme nalézt a nainstalovat balík (Package) Geneland. Stáhneme ho odtud:
http://www2.imm.dtu.dk/~gigu/Geneland/distrib/
Podrobný návod a literatura je zde
http://www2.imm.dtu.dk/~gigu/Geneland/
Geneland spustíme příkazy:
library(Geneland)
Geneland.GUI()
Otevře se příjemné grafické prostředí, ve kterém je již analýza poměrně snadná.
Šikovné je zadat Thinning. Určuje, kolik kroků analýzy bude zaznamenáno. Např. když zadáme 100, bude zaznamenán každý stý krok, což je většinou dostačující.
genotypy
souřadnice
Úloha*:
V programu BAPS zjistěte optimální K a zařaďte jedince dle jejich genotypů do skupin.
Použijte Admixture i Non-Admixture model.
Zkuste i prostorový model ("Tesselation").
Postup:
Nainstaluji si program BAPS (ke stažení z http://www.helsinki.fi/bsg/software/).
Obvykle je třeba nejprve nainstalovat i Matlab runtime component. Vše je však popsáno na stránce programu.
Připravím si data ve vhodném formátu
genotypy
souřadnice
názvy populací
začátky populací
Pozor program dlouho nabíhá! Mějte trpělivost :)
Mixture analysis odpovídá modelu Non-Admixture. Tento výpočet pak využijeme jako vstup pro analýzu v modelu Admixture.
Nejprve tedy využijeme možnost "Clustering of individuals". Kromě vstupních souborů zadáme i maximální možné K. Je možné (a výhodné) zadat najednou více hodnot oddělených mezerou. Po výpočtu pokračujeme možností "Admixture based on mixture clustering".