Практикум 12
Задание 1
Запустил Psi-Blast. Условия поиска. Провел 6 итераций, пока количество находок не перестало меняться. E-value худшей "правильной" находкой равна 2e-04, а "лучшей" неправильной - 0.024. На мой взгляд это недостаточно большая разница и, вероятно, найденные белки не представляют одно семейство, хоть и все они рибосомальные. Правда, можно выделить две группы: tRNA(Ile2) agmatidine synthetases и ribosomal proteins. Но об этом сложно судить, так как мой белок гипотетический.
Итерация |
Кол-во находок выше порога |
Появились ли новые находки |
Находка |
ID |
Score |
E-value |
1 |
22 |
- |
Лучшая |
A8MA77.1 |
291 |
1e-92 |
Худшая |
Q18FU7.1 |
74,3 |
3e-13 |
|||
2 |
25 |
да |
Лучшая |
A8MA77.1 |
291 |
1e-92 |
Худшая |
Q8TVD7.1 |
39,7 |
0.004 |
|||
3 |
50 |
да |
Лучшая |
C5A5L9.2 |
465 |
3e-160 |
Худшая |
Q97BH4.1 |
40,8 |
0.002 |
|||
4 |
75 |
да |
Лучшая |
C6A3Q6.1 |
466 |
1e-160 |
Худшая |
P0CG87.1 |
41,2 |
0.004 |
|||
5 |
89 |
да |
Лучшая |
C5A5L9.2 |
460 |
5e-158 |
Худшая |
Q9HNL5.1 |
39,6 |
0.004 |
|||
6 |
89 |
нет |
Лучшая |
Q8TK89.2 |
461 |
2e-158 |
Худшая |
Q9HNL5.1 |
43,1 |
2e-04 |
Задание 3
Построил множественное выравнивание с помощью muscle. Команда: muscle -in seqdump.fasta -out align_muscle.fasta.
Рис 1. Множественное выравнивание.
Задание 4
Чтобы выбрать seed я использовал Remove redundancy - 70%. В итоге осталось 16 последовательностей. Провел выравнивание с помощью muscle.
Рис 2. Множественное выравнивание seed`a с помощью muscle
Задание 5
С помощью mafft построил еще одно выравнивание.
Рис 3. Множественное выравнивание seed`a с помощью mafft
Задание 6
С помощью программы muscle я построил выравнивание двух выравниваний. Абсолютно схожих столбцов не нашлось. В основном из-за того, что последовательность >gi|3024932|sp|Q58331.1|Y921_METJA в этих выравниваниях по разному выравнена относительно остальных. Наиболее похожие столбцы я отметил буквой S.
Рис 4. Выравнивание выравниваний.