Nová stránka 1

Praktikum k přednášce Molekulární ekologie

Populační struktura a sekvence DNA
Rozdělení sekvencí do haplotypů, haplotypová síť, FaBox, TCS

Úloha*:

V programu Geneland zjistěte optimální K a zařaďte jedince dle jejich genotypů do skupin.

Zkuste i prostorový model.

Geneland pracuje v prostředí R. Nejprve spustíme R a musíme nalézt a nainstalovat balík (Package) Geneland. Stáhneme ho odtud:

https://i-pri.org/special/Biostatistics/Software/Geneland/

Geneland spustíme příkazy:

library(Geneland)

Geneland.GUI()

Otevře se příjemné grafické prostředí, ve kterém je již analýza poměrně snadná.

Šikovné je zadat Thinning. Určuje, kolik kroků analýzy bude zaznamenáno. 
Např. když zadáme 100, bude zaznamenán každý stý krok, což je většinou dostačující.

genotypy

souřadnice

Úloha*:

Alignment sekvencí "ořízněte" na délku nejkratší sekvence.
Sekvence rozdělte do haplotypů. Zjistěte zastoupení jednotlivých haplotypů. alignment

Postup:
Můžeme použít programový balík FaBox http://users-birc.au.dk/palle/php/fabox/
Funguje online a hodí se na spoustu šikovných úprav souborů ve FASTA formátu.

My využijeme možnost Alignment cropper (pro oříznutí sekvencí) 
a DNA to haplotype collapser and converter (pro rozdělení do haplotypů).

Doporučené další možnosti:

V programu FaBox vyzkoušejte editaci názvů sekvencí a práci s alignmenty. 
Při práci se sekvenci vám znalost těchto možností ušetří spoustu času a chyb.

Haplotypovou síť můžeme vytvořit v programu TCS 
Vstupní soubor vytvoříme lehce z "ořezaného" alignmentu opět ve FaBoxu (možnost Create TCS input file).

Jsou ale i šikovnější možnosti:

Úloha*:

Sestrojte síť haplotypů v programu Network http://www.fluxus-engineering.com/sharenet.htm
Vstupní soubor můžete použít stejný jako pro TCS. 
POZOR! Vstupní soubor poněkud nelogicky zadejte přes možnost "Calculate network" hlavního menu!

Úloha*:

Sestrojte síť haplotypů v programu PopArt

Pozor! Jiný formát vstupního souboru (Nexus)

http://popart.otago.ac.nz/downloads.shtml

soubor

Populační struktura a sekvence DNA
Mismatch distribution

Úloha*:

Vypočtěte "number of segregating sites", "haplotype diversity" a "nucleotide diversity"

Postup:
Můžeme vhodně použít program Arlequin, který si stáhneme ze stránky: http://cmpg.unibe.ch/software/arlequin35/Arl35Downloads.html

Data (soubor skupiny a populace) importujeme do programu (karta "Import data").

haplotypy

vzorová populace

Úloha*:

Odhadněte demografickou historii jedné populace pomocí  "Mismatch distribution"

Postup:
Opět můžeme použít Arlequin.

Data z předešlé úlohy:

haplotypy

vzorová populace

AMOVA (program Arlequin)

Úloha*:

Vypočtěte hierarchickou analýzu molekulární variance (AMOVA). 
Jedinci jsou zařazeni do populací. Populace tvoří skupiny ("Groups").
Kolik procent variability nám vysvětlí rozdělení na "Groups", kolik vysvětlí rozdělení na populace v rámci groups?
Kolik procent variability nám pak zbyde na rozdíly v rámci jednotlivých populací?

Postup:
Opět můžeme použít Arlequin.

Vstupní data:

haplotypy

Zde máme všechny haplotypy, které se vyskytují v našich populacích. Soubor je vhodné uložit do stejného adresáře jako vstupní soubor:

skupiny a populace

Zde je popsáno, v jakých populacích se vyskytují konkrétní haplotypy a v jakém počtu.
Na konci souboru je pak napsáno, jak populace rozčlenit do "Groups".

Na kartě "Settings" pak zadáme možnost AMOVA.

Isolation with migration

Úloha*:

Odhadněte míru izolace, směr toku genů, dobu divergence a efektivní populační velkosti dvou částečně izolovaných populací.

Využijeme program IMa ze stránky:

https://bio.cst.temple.edu/~hey/software#im-div

Vstupní soubor zde

Příklad programového řádku pro spuštění programu:

ima -i inputPavel.txt -o output.txt -q1 10 -m1 10 -m2 10 -t 10 -b 1000000 -L100000 -p 45    (jeden řetězec)

ima -i inputPavel.txt -o output1.txt -q1 10 -q2 200 -m1 1 -m2 1 -t 10 -b 1000000 -L100000 -p 45 -n 10 -f g -g1  (více řetězců)

Výstupní soubor zde

IM2

Příklad programového řádku:

IMa2 -i mtInput.txt -o trialrun.out -q 80 -m 8 -t 5 -b 100000 -l 50000 -hfg -hn 20 -ha 0.96 -hb 0.9 -d 20

Vzor vstupního souboru pro sekvence a pro mikrosatelity