BLOK 2: TVORBA
ALIGNMENTU
Programy: Clustal
W, Clustal X (stejné jako Clustal W s rozhraním pro Windows) - ftp://ftp-igbmc.u-strasbg.fr/pub/ClustalX/
jsou klasikou tvorby alignmentu. Nejsou nejlepší, ale jsou poměrně rychlé a
většinou dostačují. V našem kurzu budeme používat algoritmus Clustal integrovaný
v editoru BioEdit (http://www.mbio.ncsu.edu/BioEdit/bioedit.html). Sofistikovanější
programy pro tvorbu alignmentu jsou například tyto:
Dialign - http://bibiserv.techfak.uni-bielefeld.de/bibi/Tools_Alignments.html
T-coffee - http://www.igs.cnrs-mrs.fr/Tcoffee/tcoffee_cgi/index.cgi
Macaw - http:/iubio.bio.indiana.edu:7780/archive/00000057/
Na začátku se
vyplatí nechat parametry nastavené jak byly, případně spíše zvyšovat penaltu
za otevření gapu a snižovat penaltu za prodlužování gapu (u algoritmu Clustal).
Pokud se jedná o proteinový gen, je lepší utvořit alignment na základě sekvence
aminokyselin. Při překladu z DNA na aminokyseliny pozor na čtecí rámec a odlišné
genetické kódy (nálevníci atd. ). Lze najít v GenBanku v informacích o sekvenci
(codon start=2, translation table=6).
Alignment založený na sekundární struktuře RNA
Lze stáhnout
z internetu (http://www.psb.ugent.be/rRNA/).
Tento alignment je možné použít jako matrici a přialignovat k němu vlastní
sekvence v programu ClustalX volbou alignment →
realign selected sequences.
Rady pro tvorbu alignmentu v programu BioEdit:
- Vstupní formát sekvencí
a alignmentů – FASTA, GenBank, Phylip, Clustal, Nexus a další.
- Pokud chcete se sekvencí
něco dělat musíte ji označit poklepnutím na název (zčerná), Edit →
Select all sekvences (CTRL+A) vybere všechny.
- Dvojitým poklepáním
na název otevřete dialog o sekvenci. Červenou šipkou vpravo dole otevřete
a zavřete podrobné informace o sekvenci.
- Vybrané sekvence
zalignujete volbou Accessory applications → Clustal W multiple
alignment. V Clustalovém dialogu zrušte volbu Bootstrap NJ tree.
Parametry nechte pro začátek nevyplněné (default). Klikněte na tlačítko Run
ClustalW. Alignment se otevře v novém okně.
- Vybrané sekvence
lze trvale translatovat nebo reverzně translatovat volbou Sequence →
Translate or reverse translate (permanent). Informace o sekvenci nukleotidů
bude v tomto případě po translaci ztracena. Volba Sequence →
Toggle translation (CTRL+G) umožňuje provést translaci sekvence “nanečisto”
s možností návratu zpět opakovanou volbou Toggle translation (i
po alignování sekvencí). “Nanečisto” translatované sekvence se při uložení
souboru vrátí do původního stavu.
- Čtecí rámec sekvence
lze snadno měnit přidáváním gapu “.” na začátek sekvence. Reverse complement
sekvence DNA získáme volbou Sequence → Nucleic Acid →
Reverse complement (SHIFT+CTRL+R). Volba Sequence →
Nucleic Acid → Gap beginning to minimize stop codons in reading
frame 1. Umožní rychle odhadnout čtecí rámec sekvence.
- Správnost translace
je dobré ověřit pomocí blastp proti databázi GenBank. Accessory
applications → BLAST → NCBI BLAST over the internet.
V dialogovém okně zvolte Program:blastp a Database:nr.
Klikněte na tlačítko Search dole uprostřed. Výsledek se zobrazí
v internetové prohlížeči.
Po vytvoření
alignmentu programem je potřeba alignment prohlédnout a upravit.
- Zarovnat začátek
a konec.
- Smazat místa, u kterých
není jistota, že byla správně zalignována (mnoho gapů a velmi rozdílné sekvence).
- Smazat pozice s gapy
(někdo doporučuje, někdo ne).
Existují programy,
které ořežou alignment za Vás: Gblocks (http://molevol.ibmb.csic.es/Gblocks/Gblocks.html),
SOAP (http://evol-linux1.ulb.ac.be/ueg/SOAP/main.html).
Kontrola okem je však i pak nutná!
Rady pro úpravu
alignmentu v programu BioEdit¨
- Nukleotidy/aminokyseliny
vyberete poklepnutím nebo tažením myši. Celý sloupec vyberete klepnutím nebo
tažením v oblasti pravítka nad první sekvencí. Ve volbě Edit naleznete
dole funkce na hromadný výběr Select all residues of selected sequences,
Select to beginning, Select to end.
- Rozbalovací menu
Mode: vlevo nahoře nabízí volby:
1. Select/slide – umožňuje posouvat vybraná rezidua
2. Edit – umožňuje v sekvenci psát a mazat klávesami Delete a
Backspace
3. Grab&Drag – umožňuje tlačit rezidua před sebou.
- Gap označený takto
„-“ je uzamčený a chová se jako reziduum, tj. nepřejedete přes něj při
posouvání. Gap označený takto ”~” je otevřený. Přepnout mezi otevřenými a
uzavřeným gapy lze tlačítkem s visacím zámkem pod volbou Mode.
- Tlačítka vedle visacího
zámku slouží k vkládání a mazání otevřených gapů. Tlačítka dále vpravo
umožňují přepínat mezi různými druhy zobrazení
Samostatná úloha 2
Ze stažených sekvencí primátích genů pro cytochrom B
utvořte alignment na základě proteinových sekvencí. Alignment uložte
jednak ve formě DNA jednak ve formě aminokyselin. Oba alignmenty upravte.