Реконструкция филогении по нуклеотидным последовательностям. Паралоги. |
||||||||||||
|
Реконструкция филогении по нуклеотидным последовательностямДля заданных бактерий (см. предыдущий практикум) с сайта базы полных геномов NCBI были взяты последовательности 16S рРНК. Последовательности брались для случайных штаммов каждого вида. Затем с помощью онлайн-сервиса Jalview было получено выравнивание этих последовательностей программой maft со стандартными параметрами. По полученному выравниванию было реконструировано дерево в программе MEGA методом Neighbor-Joining using % identity. Полученное дерево показано на рис.1. Рис.1. Изображение дерева. Это дерево содержит в себе следующие ошибки по сравнению с эталонным: В эталонном дереве нет ветви (GEOKA,LISMO,ENTFA) против (CLOTE,FINM2,LACDA,LACAC,LACLM) В эталонном дереве нет ветви (LACDA,LACAC,LACLM) против (CLOTE,FINM2,GEOKA,LISMO,ENTFA) В эталонном дереве нет ветви (LISMO,ENTFA) против (CLOTE,FINM2,GEOKA,LACDA,LACAC,LACLM) В эталонном дереве есть ветвь (ENTFA,LACLM) против (GEOKA,LISMO,CLOTE,FINM2,LACDA,LACAC) В эталонном дереве есть ветвь (ENTFA,LACLM,LACDA,LACAC) против (GEOKA,LISMO,CLOTE,FINM2) Таким образом, в построенном дереве неверно определно положение организма ENTFA (если переставить тривиальную ветвь с ENTFA, дерево станет идентичным эталонному). От дерева, построенного тем же методом по последовательности Шаперонина (см. предыдущий практикум), данное дерево отличается также положением организма ENTFA (вместо ветви (LISMO,ENTFA) против (CLOTE,FINM2,GEOKA,LACDA,LACAC,LACLM) у белков есть ветвь (LISMO,GEOKA) против (CLOTE,FINM2,ENTFA,LACDA,LACAC,LACLM), остальные идентичны). Построение и анализ дерева, содержащего паралогиЧтобы найти гомологов в заданных организмах, использовались файламы, содержащие скачанные из Uniprot полные протеомы бактерий, перечисленных в таблице предыдущего практикума. Был проведен поиск программой blastp гомологов (с порогом на E-value 0,001) по протеомам отобранных бактерий. Геномы нужных бактерий были слиты в один файл - all.fasta, была создана база типа prot и проведен бласт:
blastp -query CLPX_BACSU.fasta -db all.fasta -evalue 0.001 -outfmt 7 -word_size 3 -out homologus
Из полученной таблицы были взяты ID найденных гомологов, с помощью команды seqret были полученны последовательности этих белков. Выравнивание производилось с помощью сервиса Jalview методом muscle. На рис.2. показано дерево, полученное методом Neighbor-Joining using % identity в программе MEGA. Рис.2. Изображение дерева. На полученном дереве найдены примеры ортологов (разделение путей эволюции белков в результате видообразования) и парологов (дупликация гена с последующей эволюцией). Парологи показаны на рис.3,4. Ортологи показаны на рис.5,6. Рис.3. Парологи: Q899V4 и Q898C7; BOS3X9 и BOS3JO Рис.4. Парологи: Q891B9 и Q899H3 Рис.5. Группа ортологов Рис.6. Группа ортологов |
|||||||||||
© Маслова Валентина, 2014 Последнее изменение: 24.09.2014 |