Praktikum k přednášce Molekulární ekologie

Populační struktura, FST,Structure, Genalex, Genetix

Pro studium populační struktury lze využít široké spektrum volně dostupných programů, např:


Genepop http://genepop.curtin.edu.au/
Structure https://web.stanford.edu/group/pritchardlab/structure.html
Genalex   http://biology.anu.edu.au/GenAlEx/Welcome.html
Genetix
http://www.genetix.univ-montp2.fr/genetix/genetix.htm
 

Novější alternativy ke Structure:

ADMIXTURE (jen pro Linux a Mac) http://www.genetics.ucla.edu/software/admixture/index.html
Structurama (jen Mac) http://cteg.berkeley.edu/~structurama/index.html

Další možnosti jsou i na stránce Structure


S výsledky ze Structure je třeba dále pracovat. Potřebné odkazy lze najít zde: 

Structure https://web.stanford.edu/group/pritchardlab/structure.html   (zde jsou odkazy i na programy na další práci s výstupy ze Structure)

K zjištění "optimálního" K, tedy počtu skupin lze použít Structure Harvester http://taylor0.biology.ucla.edu/structureHarvester/
Mějte však na paměti, že populační struktura může být hierarchická. Má tedy cenu uvažovat o výsledcích pro různá K.

Zajímavý je i  CorrSieve http://www.arch.cam.ac.uk/research/laboratories/glyn-daniel/corrsieve


Úloha*:

Jsou mé lokusy dostatečné pro detekci populační struktury?

Lze využít simulace v programu Powsim:

Powsim  (alternativně jen program)

data

 
Úloha*:
Proveďte explorační analýzu dat v programu Genetix pomocí faktoriální korespondenční analýzy. Menu je sice ve francouzštině, ale pokusem a omylem to jistě zvládnete :)
Program je ke stažení zde:
http://www.genetix.univ-montp2.fr/genetix/genetix.htm
data
Data musíme importovat, analýzu najdeme v menu pod AFC.

Úloha*:
Výpočtěte párová FST pro vámi studované populace
Postup:
Pustím online versi programu Genepop http://genepop.curtin.edu.au/
Zvolím možnost 6. Fst & other correlations
Zadám F statistics - For all population pairs
Do rámečku vložím svá data ve formátu "Genepop". Nutno zadat i prvni radek s nazvem projektu (zde "Pokusna smyslena data").
Tvolím, že chci výsledek jako HTML a talčítkem Submit data spustím výpočet.
data
Průkaznost rozdílů populací zjišťuji pomocí možnosti 3. Population Differentiation z hlavního menu.
 
 

Úloha*:
Proveďte explorační analýzu dat v programu Genalex pomocí PCA založené na genetických distancích. Vypočtěte jednoduchou AMOVA ke zjištění průkaznosti rozdílů populací. 
Zjistěte výskyt privátních alel (alel vyskytujících se jen v jedné populaci).
Genalex  http://biology.anu.edu.au/GenAlEx/Welcome.html

Program pracuje v Excelu. Spustíme ho kliknutím na stažený instalační soubor, povolíme makra. V menu Excelu se nám objeví Genalex.

data


 
Úloha*:
 
V programu Structure zařaďte jedince dle jejich genotypů do předem určeného počtu (K) skupin.
 
Postup:
Nainstaluji si program Structure (ke stažení z https://web.stanford.edu/group/pritchardlab/structure.html )
Připravím si data ve vhodném formátu
data

Po spuštění programu vytvořím nový projekt (hlavní menu - File - New Project).
Nadefinuji si parametry analýzy (hlavní menu - File - Parametr Set - New).
Zde zvolím nejen počet kroků, ale také předpokládaný model (Admixture nebo Non-Admixture).
Příkazem Run spustím běh programu. Musím však zadat předpokládaný počet skupin (K).
Vyzkoušejte různá K a různé modely.

S výsledky ze Structure je třeba dále pracovat. Potřebné odkazy lze najít zde: 

Structure https://web.stanford.edu/group/pritchardlab/structure.html  (zde jsou odkazy i na programy na další práci s výstupy ze Structure)

K zjištění "optimálního" K, tedy počtu skupin lze použít Structure Harvester http://taylor0.biology.ucla.edu/structureHarvester/
Mějte však na paměti, že populační struktura může být hierarchická. Má tedy cenu uvažovat o výsledcích pro různá K.

Zazipovaná data jsou zde

Ke vhodné grafické vizualizaci výsledků je optimální CLUMPAK http://clumpak.tau.ac.il/ 
ukázka zpracovaného výsledku ze Structure

Na výsledky je ale třeba si déle počkat a pro finální úpravu dat budeme potřebovat otevřít zazipované soubory a nějaký program pro úpravu souborů s koncovkou .ps, minimálně program typu PostScript viewer.

 

Zajímavý je i  CorrSieve http://www.arch.cam.ac.uk/research/laboratories/glyn-daniel/corrsieve
Tento program navíc zvládá i metodu delta FST.


 
Úloha*:
V programu Geneland zjistěte optimální K a zařaďte jedince dle jejich genotypů do skupin. 
Zkuste i prostorový model.
Geneland pracuje v prostředí R. Nejprve spustíme R a musíme nalézt a nainstalovat balík (Package) Geneland. Stáhneme ho odtud:
 
http://www2.imm.dtu.dk/~gigu/Geneland/distrib/

Podrobný návod a literatura je zde
 
http://www2.imm.dtu.dk/~gigu/Geneland/
 
Geneland spustíme příkazy:
library(Geneland)
Geneland.GUI()
Otevře se příjemné grafické prostředí, ve kterém je již analýza poměrně snadná. 
Šikovné je zadat Thinning. Určuje, kolik kroků analýzy bude zaznamenáno. 
Např. když zadáme 100, bude zaznamenán každý stý krok, což je většinou dostačující.
genotypy
souřadnice
 

 
 
Úloha*:
 
V programu BAPS zjistěte optimální K a zařaďte jedince dle jejich genotypů do skupin. 
Použijte Admixture i Non-Admixture model.
Zkuste i prostorový model ("Tesselation").
 
Postup:
Nainstaluji si program BAPS (ke stažení z http://www.helsinki.fi/bsg/software/).
Obvykle je třeba nejprve nainstalovat i Matlab runtime component. Vše je však popsáno na stránce programu.
 
Připravím si data ve vhodném formátu
genotypy
souřadnice
názvy populací
začátky populací
Pozor program dlouho nabíhá! Mějte trpělivost :)
Mixture analysis odpovídá modelu Non-Admixture. Tento výpočet pak využijeme jako vstup pro analýzu v modelu Admixture.
Nejprve tedy využijeme možnost "Clustering of individuals". 
Kromě vstupních souborů zadáme i maximální možné K. Je možné (a výhodné) zadat najednou více hodnot oddělených mezerou.

Po výpočtu pokračujeme možností "Admixture based on mixture clustering".