Практикум 11

Выбор и описание семейства доменов

С помощью таблицы доменов Pfam был выбран белковый домен PF00166. Его характеристики представлены ниже:

AC: PF00166
ID: Cpn10
Name: Chaperonin 10 Kd subunit
Seed: 37
Full: 13521
Domain Architectures: 58
3D structures: 39
Function: Это семейство содержит GroES и Gp31-подобные шаперонины. Gp31 представляет собой функциональный ко-шаперонин, который необходим для сворачивания и сборки Gp23, основного капсидного белка, во время фагового морфогенеза.
Domain architectures: 138
Representative structure:

Рис.1 Репрезентативная 3D структура домена.

Таксономическая распространенность: Всего в разделе Taxonomy представлено 48000 таксонов. 32378 видов представлены в круговой диаграмме(Рис.2). Среди них 27743 видов бактерий, всего 3874 видов эукариот и, что, на мой взгляд странно, всего 577 видов вирусов. Интересно, что 6 белков было найдено в человеке, 26 в подвиде японского риса и 16 в виде кресс-салата Arabidopsis thaliala.

Рис.2. Таксономическая структура, диаграмма.
Рис.3. Таксономическая структура, линии.

Выравнивание seed.

При окрашивании выравнивания через параметр Above identity threshold были получены следующие результаты:

Таблица 1

Порог идентичноcти: консервативные позиции:
100 нет
90 нет
80 4, 27, 49, 53, 74, 85
70 еще 13 позиций
50 37 позиций

  • Ссылка на проект Jalview.
  • Рис.4. Выравнивание seed, группы.
    Рис.5. Выравнивание seed, достоверные блоки.

    Таблица 2

    Выравнивание seed 37
    Максимальный достоверный блок, включающие ВСЕ последовательности нет
    100% консервативные колонки таблица 1
    Максимальный достоверный блок, включающий НЕ ВСЕ последовательности.
    9-11(все одним цветом, полностью совпадают 13/37);
    28-30(полностью совпадают 8/37, 3 группы по 3 последовательности, 2 группы по 2);
    48-52(полностью совпадают 12/37, 5/37, 2/37);
    77-79(полностью совпадают 2 группы по 5 последовательностей, 2 группы по 4, 2 группы по 3, 3 группы по 2);
    116-119(15/37,  2 группы по 3, 3 группы по 2)
    100% консервативные колонки 27:[G](33/37); 30:[L, I](18+16/37); 47[G, A](28+8/37); 95[G, A](30+5/37); 119[A, G](25+10)
    Участок выравнивания, в котором нет никаких достоверных подблоков, и потому маловероятно, что выравнивание на этом участке отражает ход эволюции. 12-20, 56-66 и 83-94

    Таким образом, сложно судить о ходе эволюции белков, так как достоверных блоков очень мало, нет ни одной на 100% консервативной позиции, большие промежутки с гэпами и неокрашенные колонки даже при очень низком проценте идентичности (15%).

    Сравнение доменных архитектур.

    Для сравнения были выбраны домены PF00166 - PF00118 (21 белок) и PF00069 - PF00166 (18 белков).
    Рис.5. Доменные архитектуры.

    Для белков с первой доменной структурой в итоговом выравнивании нет ни одной полностью консервативной колонки, в то время как для белков со второй можно выделить несколько консервативных блоков, например 7-8, 10-13, 26-27, 65-66 и колонки 30, 43, 45, 47, 49, 55, 68 и т.д.

    Так как общих консервативных колонок для белков с разными доммеными архитектурами в выравнивании нет, то можно сделать вывод, что доменные архитектуры образовались из уже разошедшихся в эволюции доменов.

    Рис.5. Выравнивание доменов, Clustal.
    Рис.6. Выравнивание доменов, Clustal, с группами.
  • Ссылка на проект Jalview, последовательности с первой доменной архитектурой раскрашены Clustal, со второй - Percentage Identity.
  • Карта локального сходства последовательностей с разной доменной архитектурой.

    Для выполнения данного задания были выбраны белки, домены которых представлены в предыдущем задании. При указанном в запросе E-value 0.05 была получена следующая карта сходтва:

    Рис.12.Карта локального сходства белков L2FPT и A0A0G0LIA9, поиск по E-value 0,05.

    Найденное E-value: 3e-07
    Persentage identity: 34.52%
    Из рисиунка видно, что локальное выравнивание покрывает начало одного и конец другого белка. Разрывов на рисунке не много, однако говорить о высокой схожести последовательности нельзя. Выравнивание приведено на рисунке .

    Рис.13.Результат выравнивания BLAST

    При повышении в запросе поиска E-value до 1 карта локального сходства не изменилась. При увеличении до 10 на рисунке видны короткие прерывистые участки локального сходства концов двух последовательностей и небольшой участок в их серединах.

    Рис.9.Карта локального сходства белков L2FPT и A0A0G0LIA9, поиск по E-value 10 .
    Рис.10.Результат выравнивания BLAST.