Praktikum 2010-5 Populace

Praktikum k přednášce Molekulární ekologie

Populační struktura, F_ST,Structure, Genalex, Genetix

Pro studium populační struktury lze využít široké spektrum volně dostupných programů, např:

Genepop http://genepop.curtin.edu.au/
Structure https://web.stanford.edu/group/pritchardlab/structure.html
Genalex http://biology.anu.edu.au/GenAlEx/Welcome.html
Genetix http://www.genetix.univ-montp2.fr/genetix/genetix.htm

Novější alternativy ke Structure:

ADMIXTURE (jen pro Linux a Mac) http://www.genetics.ucla.edu/software/admixture/index.html
Structurama (jen Mac) http://cteg.berkeley.edu/~structurama/index.html

Další možnosti jsou i na stránce Structure

S výsledky ze Structure je třeba dále pracovat. Potřebné odkazy lze najít zde:

Structure https://web.stanford.edu/group/pritchardlab/structure.html (zde jsou odkazy i na programy na další práci s výstupy ze Structure)

K zjištění "optimálního" K, tedy počtu skupin lze použít Structure Harvester http://taylor0.biology.ucla.edu/structureHarvester/
Mějte však na paměti, že populační struktura může být hierarchická. Má tedy cenu uvažovat o výsledcích pro různá K.

Zajímavý je i CorrSieve http://www.arch.cam.ac.uk/research/laboratories/glyn-daniel/corrsieve

Úloha*:

Jsou mé lokusy dostatečné pro detekci populační struktury?

Lze využít simulace v programu Powsim:

Powsim (alternativně jen program)

data

Úloha*:

Proveďte explorační analýzu dat v programu Genetix pomocí faktoriální korespondenční analýzy. Menu je sice ve francouzštině, ale pokusem a omylem to jistě zvládnete :)

Program je ke stažení zde:

http://www.genetix.univ-montp2.fr/genetix/genetix.htm

data

Data musíme importovat, analýzu najdeme v menu pod AFC.

Úloha*:

Výpočtěte párová F_ST pro vámi studované populace

Postup:
Pustím online versi programu Genepop http://genepop.curtin.edu.au/
Zvolím možnost 6. Fst & other correlations
Zadám F statistics - For all population pairs
Do rámečku vložím svá data ve formátu "Genepop". Nutno zadat i prvni radek s nazvem projektu (zde "Pokusna smyslena data").
Tvolím, že chci výsledek jako HTML a talčítkem Submit data spustím výpočet.

data

Průkaznost rozdílů populací zjišťuji pomocí možnosti 3. Population Differentiation z hlavního menu.

Úloha*:

Proveďte explorační analýzu dat v programu Genalex pomocí PCA založené na genetických distancích. Vypočtěte jednoduchou AMOVA ke zjištění průkaznosti rozdílů populací. 
Zjistěte výskyt privátních alel (alel vyskytujících se jen v jedné populaci).

Genalex  http://biology.anu.edu.au/GenAlEx/Welcome.html

Program pracuje v Excelu. Spustíme ho kliknutím na stažený instalační soubor, povolíme makra. V menu Excelu se nám objeví Genalex.

data

Úloha*:

V programu Structure zařaďte jedince dle jejich genotypů do předem určeného počtu (K) skupin.

Postup:
Nainstaluji si program Structure (ke stažení z https://web.stanford.edu/group/pritchardlab/structure.html )

Připravím si data ve vhodném formátu

data

Po spuštění programu vytvořím nový projekt (hlavní menu - File - New Project).
Nadefinuji si parametry analýzy (hlavní menu - File - Parametr Set - New).
Zde zvolím nejen počet kroků, ale také předpokládaný model (Admixture nebo Non-Admixture).
Příkazem Run spustím běh programu. Musím však zadat předpokládaný počet skupin (K).

Vyzkoušejte různá K a různé modely.

S výsledky ze Structure je třeba dále pracovat. Potřebné odkazy lze najít zde:

Structure https://web.stanford.edu/group/pritchardlab/structure.html (zde jsou odkazy i na programy na další práci s výstupy ze Structure)

Zazipovaná data jsou zde

Ke vhodné grafické vizualizaci výsledků je optimální CLUMPAK http://clumpak.tau.ac.il/
ukázka zpracovaného výsledku ze Structure
Na výsledky je ale třeba si déle počkat a pro finální úpravu dat budeme potřebovat otevřít zazipované soubory a nějaký program pro úpravu souborů s koncovkou .ps, minimálně program typu PostScript viewer.

Zajímavý je i CorrSieve http://www.arch.cam.ac.uk/research/laboratories/glyn-daniel/corrsieve
Tento program navíc zvládá i metodu delta F_ST.

Úloha*:

V programu Geneland zjistěte optimální K a zařaďte jedince dle jejich genotypů do skupin.

Zkuste i prostorový model.

Geneland pracuje v prostředí R. Nejprve spustíme R a musíme nalézt a nainstalovat balík (Package) Geneland. Stáhneme ho odtud:

http://www2.imm.dtu.dk/~gigu/Geneland/distrib/


Podrobný návod a literatura je zde

http://www2.imm.dtu.dk/~gigu/Geneland/

Geneland spustíme příkazy:

library(Geneland)

Geneland.GUI()

Otevře se příjemné grafické prostředí, ve kterém je již analýza poměrně snadná.

Šikovné je zadat Thinning. Určuje, kolik kroků analýzy bude zaznamenáno. 
Např. když zadáme 100, bude zaznamenán každý stý krok, což je většinou dostačující.

genotypy

souřadnice

Úloha*:

V programu BAPS zjistěte optimální K a zařaďte jedince dle jejich genotypů do skupin.

Použijte Admixture i Non-Admixture model.

Zkuste i prostorový model ("Tesselation").

Postup:
Nainstaluji si program BAPS (ke stažení z http://www.helsinki.fi/bsg/software/).
Obvykle je třeba nejprve nainstalovat i Matlab runtime component. Vše je však popsáno na stránce programu.

Připravím si data ve vhodném formátu

genotypy

souřadnice

názvy populací

začátky populací

Pozor program dlouho nabíhá! Mějte trpělivost :)

Mixture analysis odpovídá modelu Non-Admixture. Tento výpočet pak využijeme jako vstup pro analýzu v modelu Admixture.

Nejprve tedy využijeme možnost "Clustering of individuals". 
Kromě vstupních souborů zadáme i maximální možné K. Je možné (a výhodné) zadat najednou více hodnot oddělených mezerou.

Po výpočtu pokračujeme možností "Admixture based on mixture clustering".