Задание 1. Различия во множественных выравниваниях, построенных разными программами
Для выполнения этого задания были выбраны белки из прошлого практикума. Ниже вы можете видеть таблицу с некоторыми данными из прошлого практикума.
Таблица 1. Результаты поиска BLAST |
Номер |
ID/AC |
Название белка |
Coverage % |
Identity % |
E-value |
Гомологичность белку |
1 (1) | Q58649.1 | UPF0254 protein MJ1251 | 100 | 100.000 | 7.77e-120 | + |
2 (3) | Q6LYQ3.1 | UPF0254 protein MMP0935 | 99 | 55.422 | 3.63e-61 | + |
3 (6) | Q50521.1 | UPF0254 protein MTH1148 homolog | 93 | 36.076 | 3.03e-28 | + |
4 (7) | A2SU98.1 | UPF0254 protein Mlab_1743 | 97 | 32.927 | 5.30e-25 | + |
Различные программы для множественных выравниваний:
[1]
Clustal Omega - новый инструмент для множественного выравнивания, который использует направляющие деревья и HMM профиль-профиль техники. Подходит для средних и больших выравниваний.
Kalign - очень быстрый инструмент, концентрирующийся на локальных участках. Подходит для крупных выравниваний.
MAFFT - программа, которая использует быстрое преобразование Фурье. Подходит для средних и больших выравниваний.
MUSCLE - точный инструмент, особенно для белков. Подходит для средних выравниваний.
T-Coffee - инструмент, основанный на совместимости, пытается обойти ошибки передовых выравнивающих программ. Подходит для небольших выравниваний.
Выравнивания были выполнены в нескольких программах для сравнения, однако здесь описаны выравнивания построенные следующими программами:
Ниже вы можете видеть изображение, иллюстрирующее выравнивания, построенные этими программами.
Ссылка на проект JalView.
| |
Рис. 1. Фрагменты начала и конца двух выравниваний, построенных программами Muscle и Tcoffee соответственно
|
Некоторые отличия в выравниваниях, построенных разными программами:
- в первом выравнивании гэпы в двух последних последовательностях на позициях 28-30, а во втором гэп занимает только 29 позицию;
- в первом случае в 35 позиции во второй последовательности находится тирозин, во втором - гэп, а тирозин в 38;
- в первом случае в позиции 163 находятся два фенилаланина и два гэпа, а во втором - вместо гэпов два изолейцина, которые muscle поставил в
столбец с функционально консервативными позициями (лейцин и изолейцин).
Задание 2. Описание трех доменных архитектур, содержащих один и тот же домен
Доменная архитектура белка Q58649
Для выполнения данного задания был взят белок с идентификатором Q58649 (HcgF from Methanocaldococcus jannaschii), описанный мною ранее.
С помощью Pham
[2] была найдена доменная
архитектура этого белка. Ниже вы можете видеть изображение, иллюстрирующее доменную архитектуру.
|
Рис. 2. Архитектура белка |
|
Рис. 3. 3D-структура белка (домен окрашен зеленым) |
Как видно из рисунка 3, исследуемый белок содержит только один домен -
UPF0254[3]
(неохарактеризованное семейство белков). С такой доменной архитектурой на сайте Pham находится 21 структура, причем белки, содержащие этот домен, как и в случае с кластерами
Uniprot (UniRef50) для этого белка, являются метаногенными организмами (выделяют
метан как побочный продукт метаболизма), из чего можно сделать предположение, что данный домен специфичен метаногенным организма, хотя его функция еще
не ясна. (Однако, там также находится и белок F0S2C1_DESTD из организма Desulfurobacterium thermolithotrophum, последовательность которого является
предсказанной, возможно, это можно объяснить тем, что места обитания всех этих организмов связаны с глубоководными гидротермальными жерлами, и
свойства домена каким-то образом с этим связаны).
Доменные архитектуры белков, содержащие домен HTH_16
Для выполнения этого задания был выбран домен
Helix-Turn-Helix, он же мотив «спираль-поворот-спираль».
Спираль-поворот-спираль
(от англ. Helix-Turn-Helix, HTH-мотив) — мотив в белках, способный взаимодействовать с ДНК. Он состоит из двух -спиралей, соединенных
короткой цепью аминокислот и входит в состав многих белков, регулирующих экспрессию генов. Мотив спираль-поворот-спираль связывает ДНК.
|
Рис. 4. λ - репрессор бактериофага лямбда использует мотив «Спираль-поворот-спираль» (зелёный)
для связывания с ДНК |
Узнавание и связывание обеспечивается двумя альфа-спиралями, одна из которых располагается в N-конце мотива, другая — в C-конце. В
большинстве случаев, как, например, в репрессоре Cro, вторая спираль участвует в узнавании ДНК и часто называется «узнающая спираль».
Она связывается с большой бороздкой ДНК через серию водородных связей и различных Ван-дер-ваальсово взаимодействие с экпонированными
основаниями. Другая -спираль стабилизирует взаимодействие между белком и ДНК, но не играют особенно важную роль в её узнавании. Обе
спирали всегда имеют одинаковую ориентацию друг относительно друга.
[4]
Ниже вы можете видеть изображения доменных архитектур, содержащих этот домен.
W7YJJ2_9BACL Uncharacterized protein из организма Paenibacillus pini JCM 16418.
- HTH_16; координаты: 6-62;
|
Рис. 6. Архитектура белка W7YJJ2_9BACL |
C0R0S1_BRAHW [Brachyspira hyodysenteriae (strain ATCC 49526 / WA1)] RpoE, DNA-directed RNA polymerase specialized sigma subunit, sigma24
- HTH_16 (зеленый); координаты: 18-76;
- Sigma70_r4_2 (красный); координаты: 131-184;
Области 4 Сигма-70, такие как Сигма-факторы, участвуют в связывании до -35 элемента промотора через мотив спираль-поворот-спираль.
|
Рис. 7. Архитектура белка C0R0S1_BRAHW |
U2JQJ2_9FIRM [Peptostreptococcaceae bacterium oral taxon 113 str. W5053] Sigma-70, region 4.
В данном случае произошла транслокация доменов (перестановка), а также делеция в начале и конце домена Sigma70_r4_2.
- Sigma70_r4_2 (красный) - фрагмент; координаты: 80-128;
- HTH_16 (зеленый); координаты: 159-223;
|
Рис. 8. Архитектура белка U2JQJ2_9FIRM |
Источники:
[1]: EMBL-EBI;
[2], [3]: Pham;
[4]: Википедия. Мотив «спираль-поворот-спираль».