Praktikum k přednášce Molekulární ekologie

Populační struktura, GenAlEx

 

Genalex je program určený primárně pro výuku. Má bezvadný rozsáhlý Help. Nijak bych se však nebál v něm vypočítat i něco do článku.
Je to přívětivý a šikovný nástroj.

My si zde ukážeme nalezení privátních alel (alel, co jsou jen v jedné populaci), výpočet párových Fst a výpočet AMOVA.

Genalex pracuje jako makro v Excelu. To je prima, protože v Excelu máme často naše data. Program si stáhneme zde (někde v downloads bude odkaz).
https://biology-assets.anu.edu.au/GenAlEx/Welcome.html

Program pracuje přímo v Excelu. Musíme ho však do Excelu nějak dostat. Postup je otevření Excelu a pak:

Soubor ->  Možnosti  ->  Doplňky   ->  Spravovat doplňky aplikace Excel - Přejít...   -> Procházet...  -> najít instalační soubor a otevřít

(Starší verze se spouštěly jednoduše kliknutím na stažený instalační soubor a povolením maker.)

Nahoře přímo v menu Excelu se nám vpravo objeví GenAlEx.

Pak budeme potřebovat excelový soubor s daty. Ten je tu. Uložte a otevřete v Excelu, kde je už předem otevřený GenAlEx.

data

Samozřejmě povolte úpravy.

Na listu Excelu máme data ve formátu, který GenAlEx (snad) "sežere".

Na prvním řádku máme:
Počet lokusů, počet jedinců, počet populací, postupně počty jedinců ve čtyřech populacích

Druhý řádek je jen na nás. Vidíte, že se jedná o oblíbené bobry.

Další řádky snadno rozluštíme. Máme zde označení jedince, populaci a genotypy na pěti mikrosatelitových lokusech.

Začneme s privátními alelami a jejich frekvencí. Pojďme do menu a koukneme na Frequency based. Zadáme první možnost frekvency. vyskočí okno, kde si jen zkontrolujeme, zda je vše OK (například, zda je zadáno, zda jsou data kodominantní, což mikrosatelity jsou). Na dalším okně zatrhneme Private Alleles List (protože právě ty privátní alely nás zajímají). Klidně ale nechte zatrhnuté i další frekvence alel (Frequency by pop). Chcete-li spoustu grafů (a celkem k ničemu), zatrhněte i další možnosti.

Lze tu počítat i Fst, ale bez průkaznosti. My se proto k Fst radši ještě dostaneme později jinak.

V Excelu se nám objeví další listy. Na AFP budpu frekvence všech alel v populacích.

Na PAS a PAL budou privátní alely. Vidíme, v jaké populaci, na jakém lokusu, v jaké frekvenci (PAS) a dokonce i u kterého jedince (PAL) jsou privátní alely.

Vraťme se na list s genotypy (jinak to nebude fungovat!). Vypočítáme Fst a AMOVA (analýzu molekulárního rozptylu). V Menu tedy Distance based - AMOVA. Na první a druhé kartě by vše mělo být defaultně OK, zkontrolujte. Na třetí kartě zadáme, že chceme Pie Graph (protože je ilustrativní a pěkný) a dále Output labeled Pairwise Fst Matrix (protože chceme vypočítat párové Fst a chceme se v tom vyznat). Výpočet chvíli trvá tak se neděsíme :)

Opět se nám zjeví nové listy. Koukneme na Fst:
Hned v grafu vidíme, že rozdělení na (sub)populace nám vysvětlí velmi pěkných 54 procent celkové variability (rozptylu) našich dat. Tato hodnota se průkazně liší od nuly - Pod grafem, F-Statistics, Fst 0.536, tu je celkové Fst, tedy rozdělení na všechny ty subpopulace,  P je krásných 0.001). Rozdělení na (sub)populace tedy dává zatraceně dobrý smysl. Pozor na to, že příklad je extrémní. Obvykle vychází Fst menší. Důležitý je průkazný rozdíl od nuly.

Nás však zajímají i rozdíly (Fst) mezi konkrétními páry populací. Ty najdeme na FstL. Tu je matice, každý s každým. V horní polovině matice je průkaznost, v dolní hodnoty Fst. Mně vyšlo například, že populace 1 s populací 2 mají párové Fst 0.235 a to je průkazně (P = 0.001) odlišné od nuly. Vysoká párová Fst vidíme u dvojic s populací 3. To nepřekvapí, pokud jste si už udělali explorační analýzu v programu Genetix (tam najdete i vysvětlení).

Závěr. Krásně nám vyšlo, že existuje jasná průkazná populační struktura. Nejvíce izolovaná je populace 3. Hodnoty párových Fst i hodnota celkového Fst je nebývale vysoká.

Explorační analýzu můžeme provést i zde. Nejprve však musíme vypočítat genetické distance (vzdálenosti, viz Kapitola 4 v doporučené knížce Freeland et al.). GenAlEx používá méně obvyklou (ale prima) modifikovanou metodu, nejde tedy o klasické Nei GD (podrobnosti viz manuál GenAlExu). V Menu Distance based - Distance - genetic. Přepneme na list GD a v menu dáme Distance based - PCoA -analysis. Zobrazí se nám výsledky klasické PCA na genetických datech.

Skvělé jsou možnosti importu a exportu. To se může velmi hodit.