Praktikum k přednášce Molekulární ekologie

 

Rekonstrukce celých rodin - program Colony

 

K rekonstrukci celých rodin se skvěle hodí program Colony (http://www.zsl.org/users/jinliang-wang). Program vytváří nejpravděpodobnější skupiny blízce příbuzných jedinců (například mláďat s oběma společnými rodiči). Program funguje i bez zadání genotypů rodičů. I bez znalosti dospělých jedinců z populace tedy můžeme odhadnout, zda třeba mláďata v hnízdě mají společného otce. Výhodou je, pokud v jednom hnízdě (snůšce) bývá obvykle více mláďat. Pokud však známe genotypy dospělců, můžeme k nim přiřazovat mláďata. Program je uživatelsky příjemný a skvěle funguje. Pozor ale na to, že standardní běh programu trvá docela dlouho (třeba i hodiny). Program má skvělý manuál (pdf soubor ve staženém adresáři). Pokud něco budete počítat, tak je dobré si ho přečíst.

 Zajímá nás, zda je námi zkoumaný druh monogamní. O možných otcích víme celkem málo. Přes Cervus by to tedy šlo špatně. Colony to zvládne. Zkusíme vytvořit skupiny příbuzných mláďat a určit jejich matky a otce. Data jsou z koroptví. Hnízda se normálně skoro nedají najít. Zde se nalezla díky tomu, že se samicím daly vyšílačky. Kuři mají obecně často dost mláďat. Na analýzu v Colony jsou tedy ideální. S odchytem samců to bylo horší, ale to nám nevadí. Colony to přeci umí spočítat klidně i bez rodičů. Pokud ale nějaké dospělce máme, s radostí je tam zadáme. Analýze to pomůže.

Postup:

Program Colony si stáhneme ze stránky:

 http://www.zsl.org/users/jinliang-wang

Budeme potřebovat několik vstupních souborů:

Charakteristika lokusů soubor
Obsahuje jména lokusů, typ lokusů (kodominantní značeny 0, dominantní 1), frekvence chyb typu "drop out" nebo nulové alely, frekvence dalších (třeba našich genotypizačních) chyb, pro každý lokus jeden sloupec

Genotypy mláďat soubor
Zde pozor na pořadí a počet lokusů. Musí odpovídat předchozímu souboru. V našem souboru je 177 mláďat.

Genotypy možných otců soubor

Genotypy možných matek soubor

Soubory si uložíme a prohlédneme si jejich strukturu v textovém prohlížeči. Zjistíme, kolik je možných matek, otců a kolik máme mláďat (177).

V programu nastavíme možnost nový projekt (z menu File nebo rovnou přes ikonu listu papíru vlevo). Název je libovolný. Necháme možnost empirického počítání. Pak postupujeme logicky po kartách a dle instrukcí.

Na první kartě (Parameters) si pro praktikum zkraťte délku analýzy (Length of Run) na Short. Když budete počítat něco se svými daty, tak samozřejmě zvolte delší běh programu. Nic dalšího nebudeme měnit. Případně pozor na to, že monogamie je tu pojata dost specificky. Podívejte se do manuálu.

Přejdeme na druhou kartu (Markers). Tu zadáme počet lokusů (7). Koukněte v textovém editoru na soubor lokusy. Pod názvy je tu informace o typu markerů, frekvence nulových alel (tu umíme spočítat hned dvěma způsoby jinde, Cervus a ML-Relate) a odhad frekvence našich chyb (zde třeba podle toho, jak si každý věří nebo nějak lépe z pilotních pokusů). Detaily jsou opět v manuálu. Před "čudl" load nahrajeme tento soubor do Colony. Frekvenci alel nezadáme (necháme unknown) a necháme program, ať si to pěkně spočte sám. Zkontrolujeme, zda je vše OK (čudl Check Data). Když ano, jdeme dále na kartu Offspring Genotypes.

Na kartě Offspring Genotypes zadáme počet mláďat (177). Soubor potomci (ve sloupcích je ID a pak alely na sedmi lokusech, pro každý lokus dva sloupce) si nejprve prohlédneme a pak ho nahrajemé do Colony. Po zadání Check Data se dozvíme, že někteří jedinci mají shodné genotypy. To by se ale u mláďat z jednoho hnízda či vrhu klidně mohlo stát. (Na svých datech to ale vždy pečlivě zkontrolujte, taky to může být stejný jedinec, co je chybně dvakrát v souboru.)

Na kartě Male Genotypes zadáme počet zgenotypovaných samců, tedy možných otců. Počet zjistíme nahlédnutím do souboru otci (neprozradím, pěkně si to spočtěte). Soubor pak nahrajeme do Colony. Dále zadáme pravděpodobnost, že otec bude v tomto souboru. Samců se moc chytit nepovedlo, odhadem jen polovina. Zadejte tedy 0.5. Pozor na desetinnou tečku, nikoliv čárku!!! Check Data a jedeme dál.

Na kartě Female Genotypes zadáme počet zgenotypovaných samic. Zase neprozradím, abyste museli nahlédnout do vstupního souboru matky. Máme je docela dobře ovzorkované, takže pravděpodobnost tu bude větší, řekněme 0.8. Pozor zas na tečku.

Na všech dalších kartách zadáme nulu. Colony nám tu nabízí docela fajn možnosti, jak analýzu vylepšit naší apriorní znalostí situace. Někdy se to fakt hodí! Pro detaily případně nahlédněte do manulálu.

Na poslední kartě uložíme data.

Pokud se vše povedlo, můžeme spustit analýzu. Jdeme do hlavního menu na Run a pustíme to. Počet threads (využitých jader procesoru vašeho počítače) nechte na jedna. Jiné možnosti (aspoň mě) zlobí, ale klidně vyzkoušejte.

Objeví se změť čísel, což je v pořádku. Na průběh analýzy se ale můžeme podívat přes Run v hlavním menu. Zkuste poslední možnost (show assignments plots a zde možnost sibships). Je vyloženě vtipná a zábavná. Body v grafu označují dvojice full-sibs, tedy mláďat se stejnými oběma rodiči. Koukněte i na paternity a maternity. Pokud jste to nestihli, pusťte si to znova (ale zadejte, že nechcete from the last break, protože analýza už skončila a vy chcete novou).

Až se nabažíte, koukněte na výsledky (pokud to tedy již doběhlo) přes View Results z hlavního menu. Možností je zde mnoho. Většinou nám však stačí první možnost, Best ML (Maximum Likelihood) configuration. Jak to tedy nejpravděpodobněji celé je. Mláďata jsou rozhozena do klastrů. První sloupec je ID mláděte. Číslo označující klastr je úplně vpravo, stejné číslo - stejný klastr, tedy mláďata jednoho vrhu či snůšky se stejnými oběma rodiči. Druhý sloupec je ID otce. Někdy je tu ale * a číslo. To označuje otce, kterého jsme neměli zgenotypovaného. No paráda, víme jaká mláďata měli i samci, co jsme nechytili nebo třeba vůbec neviděli! Ve třetím sloupci jsou matky. Nezgenotypované matky začínají křížkem. Koukněte, zda mláďata se stejnou matkou mají stejné otce. Jde tedy o geneticky monogamní druh?

Standardní postup je pustit Colony několikrát a podívat se, zda výsledky konvergují (zda to vychází stejně).

Zajímavá je i poslední možnost v menu View Results - Ne from sibship assignment, tedy výpočet efektivní velikosti populace. Pro výpočet jsou použity tři metody. Třetí tu má strašně široký konfidenční interval (CI), takže moc neřekne. Koukněte ale na první dvě. Odhad je někde mezi 19 a 49. No to je strašně málo. Odpovídá to ale skutečnosti. Koroptve jsou fakt na vymření a přežívají u nás v maličkých izolovaných populacích.

 

Doplňující informace:

 

Odhady Ne

Pro odhady Ne existuje samozřejmě spousta dalších možností. Můžete vyzkoušet například

 

NEEstimator http://www.molecularfisherieslaboratory.com.au/neestimator-software/

vstupní soubor

 

GESP http://www.zoologi.su.se/research/GESP/