Praktikum k přednášce Molekulární ekologie

 

Odhady příbuznosti

 

ML-Relate

ML-Relate je jednoduchý ale docela šikovný program pro odhad R (příbuzenského koeficientu dvojice jedinců). Jistě si vzpomenete, že R = 1 mají vzorky ze stejného jedince, případně jednovaječná dvojčata. R = 0,5 nalezneme u sourozenců, kteří mají shodné oba rodiče (pozor na to, že toto platí pro diploidní organismy, u haplodiploidie to bude jinak). Nepříbuzní jedinci mají R = 0. Počítáme odhad R z genetických dat. Nemusí nám to tedy vyjít zcela přesně na teoretické hodnoty. Výpočet je celkem jednoduchý.

Důležité pojmy a zkratky (pro pochopení toho, co se počítá): 

FS, full siblings, někdy full-sibs - sourozenci s oběma stejnými rodiči

HS, half siblings, half-sibs - sourozenci jen s jedním stejným rodičem

U, unrelated - nepříbuzní jedinci

 

Stáhněte si program a rozbalte ho (pozor, do stejného adresáře umístěte oba soubory s koncovkou .exe i .dll). Stáhněte si vstupní soubor. 

 http://www.montana.edu/kalinowski/software/ml-relate/index.html

vstupní soubor

Soubor si nejprve otevřete v textovém prohlížeči (třeba notepad). Vidíte, že jde o standardní soubor ve formátu Genepop, to už jsme tu měli. Na prvním řádku může být cokoliv, je jen pro vaši potřebu. Pak následují názvy lokusů. Důležité je slovíčko POP, které uvádí populaci. Dále máme ID (jména, názvy) jedinců a za čárkou jejich genotypy. Například jedinec F02 má na prvním lokusu CCR4 alely 130 a 140. Soubor ve formátu Genepop zíkáme snadno třeba exportem z programu (makra v Excelu) GenAlEx, se kterým se ještě seznámíme v některém z dalších praktik.

Soubor už známe, tak si otevřeme v ML-Relate, zcela standardně přes hlavní menu: File-Open.

Vyzkoušíme možnosti Summary z hlavního menu. Zde můžeme vypočítat frekvence jednotlivých alel nebo očekávané heterozygotnosti. To by se třeba někdy mohlo hodit. Dále máme v hlavním menu možnost Nulls pro výpočet nulových alel. Umíme to sice už přes Cervus, ale klidně vyzkoušejte. Jen musíte zadat počet pro randomizaci (něco rozumného jako třeba 1000 či více). Nulové alely dále můžete zohlednit při výpočtu nebo si s vědomím jejich existence přepočítat frekvence alel.

Nás ovšem nejvíce zajímají odhady R. V menu tedy zavítáme do Relateness. Dle svých preferencí zadejte, zda chcete výsledek jako matici nebo seznam všech dvojic (kosmetická věc, co nijak nemění výsledek). Na výsledek si chvilku počkáme. A vida, hned máme odhad R pro každou dvojici jedinců. Všimněte si, že jedinec sám se sebou má R = 1. Dále jsou zde i hodnoty blízké nule nebo třeba 0,5. S interpretací však opatrně. Například R = 0,5 mají nejen sourozenci typu FS ale také třeba rodič a potomek.

Užitečná je poslední možnost Relationship. První možnost (Estimate relationship) nám zde učiní odhad, o jaký vztah mezi jedinci se s největší pravděpodobností (ve smyslu likelihood) jedná. Mně vyšlo, že jedinec F02 má zřejmě shodné oba rodiče s F12 (FS, R = 0,26) a také F14 (FS, R = 0,5). Toto je nejpravděpodobnější řešení. Někdy ale potřebuji specificky ukázat, že konkrétní dvojice je průkazně příbuzná (třeba bratr se sestrou) a třeba i jak. Na to nám tyto výsledky nestačí. Je to sice nejpravděpodobnější řešení, ale jiné řešení může mít pravděpodobnost třeba jen o maličko nižší a jejich rozdíl tedy nebude průkazný. Musím využít poslední možnost Relationship-Specific hypothesis test. Zde budeme proti sobě testovat alternativní hypotézy pro konkrétní jedince, třeba sourozenci s oběma stejnými rodiči (FS) versus zcela nepříbuzní (Unrelated) nebo sourozenci jen s jedním stejným rodičem (HS). Zkusme si otestovat, zda dvojice F02 a F12 a dále dvojice F02 a F14 jsou průkazně FS. Jako alternativu zkuste HS a zadejte nějaké pěkné množství simulací, třeba 10000. U které dvojice vyjde průkazně, že má shodné OBA rodiče?