Praktikum k přednášce Molekulární ekologie


Rozdělení sekvencí do haplotypů, FaBox


Při práci se sekvencemi na úrovni populací se často stane, že někteří jedinci budou mít identickou sekvenci námi sledovaného úseku DNA.
Je tedy užitečné sekvence rozdělit do unikátních haplotypů, tedy do skupin se stejnou sekvencí.
Pro porovnání sekvencí je nutné nejprve vytvořit alignment a ten dále seříznout na stejnou délku.
Pokud by se sekvence lišily délkou, nelze je rozhodit do haplotypů!

Postup:
Můžeme použít programový balík FaBox http://users-birc.au.dk/palle/php/fabox/
Funguje online a hodí se na spoustu šikovných úprav souborů ve FASTA formátu.
data (alignment sekvencí) jsou tu:
alignment
Soubor stáhněte a prohlédněte si ho. Použít můžete třeba jednoduchý BioEdit
Vidíme, že již byl proveden alignment (to bychom koneckonců uměli také udělat, viz první praktikum).
Sekvence jsou však různě dlouhé. S tím si poradíme přes FaBox.
Otevřte si FaBox a najděte možnost Alignment trimmer. Zde si nahrajte soubor s alignmentem a klikněte na Trim alignment.
Na stránce dole se zobrazí, jak byl alignment zastřižen. Upravený alignment si uložte přes ikonu Save to disk.
Dále využijeme možnost DNA to haplotype collapser and converter. Nahrajeme zastřižený alignment (nikoliv původní soubor).
Zadáme Collapse sequences.
Program rozřadí sekvence do skupin, které odpovídájí unikátním haplotypům. Haplotypů je 17. V alignmetu je tedy 17 různých sekvencí.
První haplotyp (označený 1) je v alignmentu jen jednou a má ho sekvence po1.
Třeba třináctý haplotyp je v alignmentu naopak dvanáctkrát. Mají to třeba jedinci označení 5, 62, K55...
Zkuste se v stránce zorientovat a vše toto zde najít.
 
FaBox je skvělý pro další jednoduché manipulace se sekvencemi. 
Můžete zde hromadně přejmenovávat sekvence nebo třeba vybírat sekvence podle názvů. 
Snadno zde také můžete spojovat alignmenty podle různých kriterií.
Při práci se sekvenci vám znalost těchto možností ušetří spoustu času a chyb. Určitě si tedy vyzkoušejte různé možnosti programu.