include ("../../inc/apss.inc"); ?>
Множественное выравнивание последовательностей
Ознакомление с программой Muscle
Для выравнивания получил последовательности вирусных белков, называемых "дельта-антигенами", при помощи SRS, запросом:
([swissprot-Taxonomy:Deltavirus*] & [swissprot-Description:delta*]).Нашлось 34 последовательности, которые сохранил в fasta формате (delta.fasta). Получил выравнивание посредством программы muscle (delta_aligned.fasta). Далее, я импортировал в GeneDoc последовательности до и после выравнивания и сравнил две картинки.
до после
После выравнивания можно увидеть на картинке много наглядных консервативных участков.Выравнивание набора гомологов белка CLPB_ECOLI
Получил 7 гомологов(myprotein.list) при помощи BLASTP на сервере NCBI и их последовательности в fasta формате(myprotein.fasta) при помощи программы seqret на сервере kodomo-count.
В данном множественном выравнивании(картинка) можно выделить участки с повышенной долей консервативных позиций:
координаты по столбцам выравнивания:
alignment1 189-409;
alignment2 567-757;
alignment3 795-807;
alignment4 851-866.по остаткам белка СLPB_ECOLI:
alignment1 175-397;
alignment2 531-721;
alignment3 751-763;
alignment4 807-822.
Также можно выделить участки, где выравнивание недостоверно, т.е. скорее всего не имеет биологического смысла.
координаты по столбцам выравнивания:
761-850
495-520
879-937
120-166
50-75по остаткам белка СLPB_ECOLI:
725-807
467-530
835-857
115-143
45-74На этих участках нет совпадений на каком-нибудь бы уровне(не всех строчках, а бывает только на некоторых).
Другие программы множественного выравнивания
При помощи программы mafft и edialign получил два множественных выравнивания(картинка_mafft,_edialign; fasta: aligned_mafft,_edialigh). Ничего осбенного я не нашел в этих программах - они также примерно указали на те фрагменты, которые я написал во 2 задании. Есть мелкие различия, которые как раз-таки, наверно, и показывают точечные различия, не имеющие биологического смыла. Также, заметил, что edialign очень любит ставить длинные гэпы.
Программы обработки множественных выравниваний
- Consambig - создает последовательность в fasta формате из фрагментов совпавших во множественном выравнивании.(файл)
- Distmat - создает матрицу дистанции из множественного выравнивания.(файл distmat) Эта программа высчитывает эволюционные дистанции, т.е. степень родства, между парами выравниваний из множественного.
- Plotcon - наносит на карту консервативные участки из выравненных последовательностей.(файл ps) После конвертации из ps в pdf и затем в gif. Выяснилось, что Plotcon построил зависмость длины последовательности от схожести во множественном выравнивании.