1-2. Описание семейства доменов
Был выбран домен из семейства секретинов с полным названием Cystine-knot domain. Характеристика представлена в таблице:
| AC pfam | ID pfam | #SEED | #All | #SW | #architectures | #3D | Taxonomy | #eukaryota | #archaea | #bacteria |
|---|---|---|---|---|---|---|---|---|---|---|
| PF00007 | Cys_knot | 24 | 12000 | 139 | 85 | 30 | 12210 | 0 | 1 |
Цистиновый узел - это структурный мотив белка, стабилизирующий его структуру. Цистиновый узел примечателен тем, что содержит три дисудьфидных мостика, между двумя из них участок полипептида образует петлю, через которую проходит третья дисульфидная связь.
К данному семейству относятся гликопротеиновые гормоны, а также C-концевой домен различных внеклеточных белков.
К Eukaryota относятся все последовательности, кроме одной, относящейся к Bacteria.
3. Выравниванеи белковых доменов (seed)
Максимальный блок достоверного выравнивания, включающий участки всех последовательностей, в выравнивании seed находится от 85 (функционально консервативной) до 90 (полностью консервативной) колонки.
Для второго задания необходимо было описать какой-нибудь блок, включающий фрагменты не из всех последовательностей (хотя в таблице ниже ему соответствует строка "МДБ-notAll"), - был выбран блок, не пересекающийся с предыдущим: колонки 57-72; последовательности 1-22 (согласно заданию, последовательности, входящие в блок, были сдвинут наверх в проекте Jalview). В целом, для данных последовательностей блок можно расширить до 90-й колонки (тогда вес увеличится, добавятся консервативные колонки: 85[AI]; 88:C; 90:C).
В третьем задании был выбран участок, затрагивающий колонки 48-67, неконсервативные колонки которого были собраны в группу - проверка показала, что все группы состоят из одной последовательности. Таким образом, на этом участке нет ни одной пары сходных последовательностей, поэтому вероятно, что выравнивание на этом участке не отражает ход эволюции.
| Критерий | Информация |
|---|---|
| Выравнивание seed | 112 колонок; 24 последовательности |
| МДБ-all | колонки 85-90 |
| 100% консервативные колонки в МДБ-all | 85[AI]; 88:C; 90:C |
| МДБ-notAll | последователности 1-22; колонки 57-72 |
| 100% консервативные колонки в МДБ-notAll | 57:C; 72:C |
| Участок выравнивания, в котором нет никаких достоверных подблоков, и потому маловероятно, что выравнивание на этом участке отражает ход эволюции | 48-67 |
4. Карта локального сходства двух белков
С помощью NCBI BLASTp (Align two or more sequences; E-value: 0.05; word size: 3) была построена точечная диаграмма (Рис. 1).
Белок P01230 имеет один домен PF00007 в своей структуре, а у белка G9KBW1 дополнительно в структуре есть второй домен С8.
Данный график показывает локальное различие внутри участка последовательности, соответствующего общему домену PF00007 и показанного отрезками на диагонали.
Смещение диагоналей означает, что непрерывное выравнивание нарушено из-за изменения длины одного из белков. Разрыв диагонали соответствует участку инсерции или делиции.
У белков совпадает домен PF00007, что соответствует представлению домена как эволюционной единицы, сохраняющей структуру и функцию независимо от окружающих его доменов (последовательностей).
Рис. 1. Точечная диаграмма (dotplot) для последовательностей G9KBW1 и P01230
Информация о доменной архитектуре выбранных белков:
| Доменная архитектура 1 | PF00007 |
| Белок с архитектурой 1 | P01230 |
| Доменная архитектура 2 | PF08742 - PF00007 |
| Белок с архитектурой 2 | G9KBW1 |