Заданный белок - fj966976_pro - гемагглютинин вируса гриппа типа A, с помощбю BLAST найдем 4 гомолога из образцов разных годов отбора (их идентификаторы: ABC59716, ABD35782, ABL67043, ACQ83061). Выравнивание гомологов программаой muscle: скачать выранивание
Да, верно. Во множественном выравниании 23 мутировавших позиций (на каждой из них, хотя бы у одного из белков, есть аминокислота, отличающаяся от остальных), причем на 6 позициях мутация наблюдпется одновременно в 2 белках. В парном выравнивании заданной последовательности с наиболее несходной последовательностью ABD67043 найдено 17 выраниваний, поскольку во всех 5 последовательностях число аминокислот одинаково (759), эти 17 мутаций есть и во множественном выравнивании, значит добавились 6 мутаций, остальные же если есть, то есть на тех же позициях, что и в парном выравнивании с ABD35782.
Причем те позиции, где мутирован только один белок - не обязательно случайны, если взять вборку из большего числа гомологов (например из 12 белков) - в этих позициях будут мутированы несколько белков ( скачать выравнивание ). Например в 147 позиции первого выравнивания - мутация только одного белка ABD35782, во втором же выранивании на той же позиции (гэпов по-прежнему нет) мутированы 3 белка.
Однако, мутаций на самом деле больше, ведь мутирует вирусная РНК, что не всегда меняет аминокислоты закодированного белка. Скачать выравнивание нуклеотидных последовательностей , к частям РНК, кодирующим белок, у некоторых гомологов прицеплен еще фрагмент вирусной РНК, рассматриваем выравнивание с 28 по 2307 позиции (что как раз соответсвует 759 аминокислотам белков).
Рассмотрим парные выранивания заданного белка fj966976 с гомологами:
Год отбора пробы | Идентификатор гомолога | Число мутаций |
2009 | ACQ82709 | 1 |
2007 | ACE78143 | 12 |
2006 | ACE78134 | 11 |
2005 | ACE78127 | 13 |
2004 | ABA27429 | 11 |
2003 | ABQ41895 | 13 |
2002 | ABS70347 | 15 |
2001 | AAO65605 | 11 |
С помощью SRS ищем по банку нуклеотидных последовательностей EMBL: в поле Orzanism Name - Influenza A virus, в поле Description: hemagglutinin и */2009, по запросу найдена 101 последовательность, образцы получены из Китая, Италии, США, Германии, Новой Зеландии, Канады, Дании, Испании, Мексики, Италии, Кореи, Швеции, Тайланда, много проб из Мексики, США и Канады, из штатов США - больше всего из Техаса и Аризоны (граничат с Мексикой).
Если искать структуру гомолога заданного белка fj966976 с помощью BLAST по базе данных PDB, с выской достоверностью ( 5e-126 ) находится пространственная структура С-концевого домена РНК-зависимой полимеразы PB2 вируса гриппа типа A - идентификатор в базе данных PDB 3cw4, исходя из выравнивания BLAST (сопоставил 535-759 аминокислоты заданного белка с 1-225 аминокислотами найденного), мутирующие аминокислоты, найденные по выраниванию белка с гмологами (1-е задание): 590 а.а соответсвует 56 а.а найденного белка, 684 - 150, 645 - 111, на картинке перечисленные аминокислоты показаны толще и подписаны:
мутирующие аминокислоты находятся на поверхности белка, вероятно потому, что гемагглютини участвует в внедрении РНК вируса гриппа в клетки организма-хозяин, взаимодействуя с клетками своей поверхностью, эти аминокислоты функционально-значимы, их мутация - способ приспособления к меняющимся условиям