С помощью таблицы доменов Pfam был выбран белковый домен PF00166. Его характеристики представлены ниже:
AC: PF00166
ID: Cpn10
Name: Chaperonin 10 Kd subunit
Seed: 37
Full: 13521
Domain Architectures: 58
3D structures: 39
Function: Это семейство содержит GroES и Gp31-подобные шаперонины. Gp31 представляет собой функциональный ко-шаперонин, который необходим для сворачивания и сборки Gp23, основного капсидного белка, во время фагового морфогенеза.
Domain architectures: 138
Representative structure:
Таксономическая распространенность: Всего в разделе Taxonomy представлено 48000 таксонов. 32378 видов представлены в круговой диаграмме(Рис.2). Среди них 27743 видов бактерий, всего 3874 видов эукариот и, что, на мой взгляд странно, всего 577 видов вирусов. Интересно, что 6 белков было найдено в человеке, 26 в подвиде японского риса и 16 в виде кресс-салата Arabidopsis thaliala.
При окрашивании выравнивания через параметр Above identity threshold были получены следующие результаты:
Таблица 1
Порог идентичноcти: | консервативные позиции: |
---|---|
100 | нет |
90 | нет |
80 | 4, 27, 49, 53, 74, 85 |
70 | еще 13 позиций |
50 | 37 позиций |
Таблица 2
Выравнивание seed | 37 |
---|---|
Максимальный достоверный блок, включающие ВСЕ последовательности | нет |
100% консервативные колонки | таблица 1 |
Максимальный достоверный блок, включающий НЕ ВСЕ последовательности. |
9-11(все одним цветом, полностью совпадают 13/37); 28-30(полностью совпадают 8/37, 3 группы по 3 последовательности, 2 группы по 2); 48-52(полностью совпадают 12/37, 5/37, 2/37); 77-79(полностью совпадают 2 группы по 5 последовательностей, 2 группы по 4, 2 группы по 3, 3 группы по 2); 116-119(15/37, 2 группы по 3, 3 группы по 2) |
100% консервативные колонки | 27:[G](33/37); 30:[L, I](18+16/37); 47[G, A](28+8/37); 95[G, A](30+5/37); 119[A, G](25+10) |
Участок выравнивания, в котором нет никаких достоверных подблоков, и потому маловероятно, что выравнивание на этом участке отражает ход эволюции. | 12-20, 56-66 и 83-94 |
Таким образом, сложно судить о ходе эволюции белков, так как достоверных блоков очень мало, нет ни одной на 100% консервативной позиции, большие промежутки с гэпами и неокрашенные колонки даже при очень низком проценте идентичности (15%).
Для белков с первой доменной структурой в итоговом выравнивании нет ни одной полностью консервативной колонки, в то время как для белков со второй можно выделить несколько консервативных блоков, например 7-8, 10-13, 26-27, 65-66 и колонки 30, 43, 45, 47, 49, 55, 68 и т.д.
Так как общих консервативных колонок для белков с разными доммеными архитектурами в выравнивании нет, то можно сделать вывод, что доменные архитектуры образовались из уже разошедшихся в эволюции доменов.
Для выполнения данного задания были выбраны белки, домены которых представлены в предыдущем задании. При указанном в запросе E-value 0.05 была получена следующая карта сходтва:
Найденное E-value: 3e-07
Persentage identity: 34.52%
Из рисиунка видно, что локальное выравнивание покрывает начало одного и конец другого белка. Разрывов на рисунке не много, однако говорить о высокой схожести последовательности нельзя. Выравнивание приведено на рисунке .
При повышении в запросе поиска E-value до 1 карта локального сходства не изменилась. При увеличении до 10 на рисунке видны короткие прерывистые участки локального сходства концов двух последовательностей и небольшой участок в их серединах.