Учебный сайт Титовой Анастасии
ГЛАВНАЯ СТРАНИЦА
СЕМЕСТРЫ
ОБО МНЕ
КОНТАКТЫ
САЙТ ФББ
Алгоритмы множественного выравнивания.Pfam

Задание 1. Различия во множественных выравниваниях, построенных разными программами

Для выполнения этого задания были выбраны белки из прошлого практикума. Ниже вы можете видеть таблицу с некоторыми данными из прошлого практикума.
Таблица 1. Результаты поиска BLAST
Номер ID/AC Название белка Coverage % Identity % E-value Гомологичность белку
1 (1) Q58649.1 UPF0254 protein MJ1251 100 100.000 7.77e-120 +
2 (3) Q6LYQ3.1 UPF0254 protein MMP0935 99 55.422 3.63e-61 +
3 (6) Q50521.1 UPF0254 protein MTH1148 homolog 93 36.076 3.03e-28 +
4 (7) A2SU98.1 UPF0254 protein Mlab_1743 97 32.927 5.30e-25 +
Различные программы для множественных выравниваний:[1]
    Clustal Omega - новый инструмент для множественного выравнивания, который использует направляющие деревья и HMM профиль-профиль техники. Подходит для средних и больших выравниваний.
    Kalign - очень быстрый инструмент, концентрирующийся на локальных участках. Подходит для крупных выравниваний.
    MAFFT - программа, которая использует быстрое преобразование Фурье. Подходит для средних и больших выравниваний.
    MUSCLE - точный инструмент, особенно для белков. Подходит для средних выравниваний.
    T-Coffee - инструмент, основанный на совместимости, пытается обойти ошибки передовых выравнивающих программ. Подходит для небольших выравниваний.
Выравнивания были выполнены в нескольких программах для сравнения, однако здесь описаны выравнивания построенные следующими программами:
  • Muscle;
  • Tcoffee;
Ниже вы можете видеть изображение, иллюстрирующее выравнивания, построенные этими программами. Ссылка на проект JalView.
Рис. 1. Фрагменты начала и конца двух выравниваний, построенных программами Muscle и Tcoffee соответственно
Некоторые отличия в выравниваниях, построенных разными программами:
    - в первом выравнивании гэпы в двух последних последовательностях на позициях 28-30, а во втором гэп занимает только 29 позицию;
    - в первом случае в 35 позиции во второй последовательности находится тирозин, во втором - гэп, а тирозин в 38;
    - в первом случае в позиции 163 находятся два фенилаланина и два гэпа, а во втором - вместо гэпов два изолейцина, которые muscle поставил в столбец с функционально консервативными позициями (лейцин и изолейцин).

    Задание 2. Описание трех доменных архитектур, содержащих один и тот же домен

    Доменная архитектура белка Q58649

    Для выполнения данного задания был взят белок с идентификатором Q58649 (HcgF from Methanocaldococcus jannaschii), описанный мною ранее. С помощью Pham[2] была найдена доменная архитектура этого белка. Ниже вы можете видеть изображение, иллюстрирующее доменную архитектуру.
    Рис. 2. Архитектура белка
    Рис. 3. 3D-структура белка (домен окрашен зеленым)
    Как видно из рисунка 3, исследуемый белок содержит только один домен - UPF0254[3] (неохарактеризованное семейство белков). С такой доменной архитектурой на сайте Pham находится 21 структура, причем белки, содержащие этот домен, как и в случае с кластерами Uniprot (UniRef50) для этого белка, являются метаногенными организмами (выделяют метан как побочный продукт метаболизма), из чего можно сделать предположение, что данный домен специфичен метаногенным организма, хотя его функция еще не ясна. (Однако, там также находится и белок F0S2C1_DESTD из организма Desulfurobacterium thermolithotrophum, последовательность которого является предсказанной, возможно, это можно объяснить тем, что места обитания всех этих организмов связаны с глубоководными гидротермальными жерлами, и свойства домена каким-то образом с этим связаны).

    Доменные архитектуры белков, содержащие домен HTH_16

    Для выполнения этого задания был выбран домен Helix-Turn-Helix, он же мотив «спираль-поворот-спираль». Спираль-поворот-спираль (от англ. Helix-Turn-Helix, HTH-мотив) — мотив в белках, способный взаимодействовать с ДНК. Он состоит из двух -спиралей, соединенных короткой цепью аминокислот и входит в состав многих белков, регулирующих экспрессию генов. Мотив спираль-поворот-спираль связывает ДНК.
    Рис. 4. λ - репрессор бактериофага лямбда использует мотив «Спираль-поворот-спираль» (зелёный) для связывания с ДНК
    Узнавание и связывание обеспечивается двумя альфа-спиралями, одна из которых располагается в N-конце мотива, другая — в C-конце. В большинстве случаев, как, например, в репрессоре Cro, вторая спираль участвует в узнавании ДНК и часто называется «узнающая спираль». Она связывается с большой бороздкой ДНК через серию водородных связей и различных Ван-дер-ваальсово взаимодействие с экпонированными основаниями. Другая -спираль стабилизирует взаимодействие между белком и ДНК, но не играют особенно важную роль в её узнавании. Обе спирали всегда имеют одинаковую ориентацию друг относительно друга. [4] Ниже вы можете видеть изображения доменных архитектур, содержащих этот домен.

    W7YJJ2_9BACL Uncharacterized protein из организма Paenibacillus pini JCM 16418.

    • HTH_16; координаты: 6-62;

    Рис. 6. Архитектура белка W7YJJ2_9BACL

    C0R0S1_BRAHW [Brachyspira hyodysenteriae (strain ATCC 49526 / WA1)] RpoE, DNA-directed RNA polymerase specialized sigma subunit, sigma24

    • HTH_16 (зеленый); координаты: 18-76;
    • Sigma70_r4_2 (красный); координаты: 131-184;

    Области 4 Сигма-70, такие как Сигма-факторы, участвуют в связывании до -35 элемента промотора через мотив спираль-поворот-спираль.
    Рис. 7. Архитектура белка C0R0S1_BRAHW

    U2JQJ2_9FIRM [Peptostreptococcaceae bacterium oral taxon 113 str. W5053] Sigma-70, region 4.

    В данном случае произошла транслокация доменов (перестановка), а также делеция в начале и конце домена Sigma70_r4_2.
    • Sigma70_r4_2 (красный) - фрагмент; координаты: 80-128;
    • HTH_16 (зеленый); координаты: 159-223;

    Рис. 8. Архитектура белка U2JQJ2_9FIRM

    Источники:

    [1]: EMBL-EBI;
    [2], [3]: Pham;
    [4]: Википедия. Мотив «спираль-поворот-спираль».

    Titova Anastasiya, 2017 ©