Анализ множественных выравниваний

Исходные данные

Дано множественное выравнивание последовательностей с идентификаторами:

  • A0A0C5WMF1_9GAMM
  • E6N8B3_9ARCH
  • G8X5N0_FLACA
  • A6TMY7_ALKMQ
  • C5AUG1_METEA
  • Ссылка на fasta-файл

  • Вертикальные блоки

    Вертикальный блок — это участок множественного выравнивания, обладающий следующими свойствами:

  • 1. Не содержит гэпов.
  • 2. Длина - не менее 4 колонок.
  • 3. Первая и последняя колонки - абсолютно консервативны или абсолютно функционально консервативны.
  • 4. Процент абсолютно консервативных колонок больше 35%
  • 5. Не содержит более 10 колонок, не являющихся абсолютно консервативными или абсолютно функционально консервативными, подряд.
  • 6. Не может быть расширен без нарушения предыдущих свойств.


  • Вертикальные блоки обозначены в выравнивании символом "B" в строке разметки "Vertical blocks". Таких блоков три, как видно из рис. 1.

    Рис. 1. Изображение вертикальных блоков

    Один блок из части последовательностей

    Из данных 5-ти последовательностей был выделен блок, содержащий 2 последовательности с идентификаторами A0A0C5WMF1_9GAMM, A6TMY7_ALKMQ и C5AUG1_METEA. Участков с консервативными или абсолютно консервативными позициями здесь было выделено 5 (они обозначены символом "H" в строке разметки "groups") ,и они длиннее, чем вертикальные блоки пяти последовательностей. Таким образом, можно с высокой вероятностью говорить о гомологичности остатков в столбцах блока с двумя последовательностями. Однако нельзя утверждать то же и для других последовательностей, так как в некоторых позициях столбцов с символом "H" в двух других последовательностях стоят негомологичные остатки.

    Рис. 2. Один блок из части последовательностей
  • Ссылка на проект JalView (задание 1)

  • Число и процент консервативных позиций

    Для выполнения данного задания был выбран блок из трех последовательностей с координатами 55-83. Всего в нем 29 позиций. Из них абсолютно консервативных (одинаковые аминокислоты) - 18. Функционально консервативных -6.

    Рис. 3. Участок блока из трех последовательностей
    ЧислоПроцент
    Абсолютно консервативные позиции1862,1%
    Абсолютно функционально консервативные позиции620,7%

    Число и процент позиций с гэпами

    Для подсчета числа и процента позиций с гэпами был выбран участок длиной 35 позиций (отмечен символами "X")

    Рис. 4. Самый длинный участок без блоков (обозначен "X")

    Здесь находится 3 позициии с гэпами, что составляет 8,6%.


    Консенсусная последовательность и LOGO одного блока

    Консенсусная последовательность (consensus sequence) — обобщенная нуклеотидная последовательность , выведенная на основании сравнения ряда отдельных последовательностей, выполняющих сходные функции в различных локусах генома, похожих друг на друга, но различающихся в деталях [1].

    Для поиска консенсусной последовательности был выбран блок из трех последовательностей с координатами 55-83 . Консенсус был скопирован из JalView:

    >Consensus/1-29 Percentage Identity Consensus 
    GEDAAVVESVKAASDIYAPLSGEVIEVNE
    

    LOGO белка — графичкское представление выравнивания, разработанное Томом Шнайдером и Майком Стефенсом. LOGO состоит из набора символов аминокислотных остатков. Общая высота указывает на сохранение последовательности в таком положении, высота конкретного сивола определяет его относительную частоту в данной позиции. По умолчанию аминокислотные остатки окрашиваются по гидрофобности. Гидрофобные — черным, гидрофильные — синим, а нейтральные — зеленым.

    Для получения LOGO был использован сервис WebLogo. LOGO построено для блока из трех последовательностей с координатами 55-83.

    Рис. 5. LOGO блока с координатами 55-83

    Паттерн блока

    Паттерн для блока из трех последовательностей с координатами 55-83:

    G-[ED]-[DA]-[ACF]-[AG]-V-[VA]-E-S-V-K-A(2)-S-D-[ILV]-Y-[AI]-P-L-S-G-[EFT]-V-[ITV]-[EA]-[VI]-N-E


    "Выравнивание" с заведомо негомологичной последовательностью

    В качестве дополнительной последовательности была выбрана последовательность белка рубреритрина (Q9UWP7_9EURY), которая являлась заведомо негомологичной исходным пяти. Однако удалось обнаружить 1 блок. Следует отметить, что из-за того, что исходные 5 последовательностей содержали мало консервативных колонок, то и при добавлении еще одной их стало еще меньше.

    В найденном блоке содержится 2 абсолютно функуионально конcервативные колонки, что составляет 40% блока.

    Рис. 6. Выравнивание с последовательностью Q9UWP7_9EURY

    Таким образом, можно сделать вывод о том, что можно "выровнять" любые последовательности (в них даже можно будет найти блоки). Однако говорить о гомологичности последовательностей исходя из наличия 1-го блока небольшого размера, конечно, нельзя.


    Множественное выравнивание заведомо негомологичных белков

    Для этого задания ыли взяты белки со следующими идентификаторами:

  • NP_895059.1 (Uniprot ID: ALDEC_PROMM)
  • YP_144425.1 (Uniprot ID: Q5SJ55_THET8)
  • NP_820762.2 (Uniprot ID: PGK_COXBU)
  • NP_603408.1 (Uniprot ID: Q8RG11_FUSNN)
  • NP_295013.1 (Uniprot ID: Q9RUU2_DEIRA)
  • NP_809341.1 (Uniprot ID: Q8AAN6_BACTN)

  • Рис. 5. Множественное выравнивание заведомо негомологичных белков

    Как видно из рис.5 вертикальных блоков для выравнивания данных последовательностей нет. Есть один блок длиной 4 а.о. для пяти последовательностей из шести.

    Для данного блока приведена характеристика в табл.2:

    ЧислоПроцент
    Абсолютно консервативные позиции125%
    Абсолютно функционально консервативные позиции125%

    Тааким образом, полученное выравнивание подтверждает негомологичность выбранных белков.


  • Ссылка на проект JalView (задания 6, 7)


  • Ссылки:

    1. Свердлов Е.Д. Взгляд на жизнь через окно генома. Т. 1. Москва. 2009


    © Васильева Елена, 2015