Множественные выравнивания


Понятие вертикальных блоков

Для того, чтобы приступить к работе, надо дать определение вертикального блока. Вертикальный блок должен обладать следующими свойствами:
  • Длина блока не менее 4 колонок
  • Первая и последняя колонки абсолютно консервативны или абсолютно функционально консервативны
  • Не содержит более 10 колонок, не являющихся абсолютно консервативными или абсолютно функционально консервативными, подряд
  • Не содержит гэпов(!)
  • Не может быть расширен без нарушения предыдущих свойств

  • Расположение вертикальных блоков



    Всего, как видно из рисунка выше, было найдено 6 коротких блока, где предположително можно ожидать гомологию аминокислотных остатков у всех представиетелей.
    {ссылка на jvp-проект с вертикальными блоками}

    Расположение гомологичных блоков

    Были выбраны две последовательности, S0GG81_9PORP и G2PJV4_MURRD, так как показалось, что они имеют довольно схожую последовательность аминокислот.



    {ссылка на jvp-проект с гомологичными блоками}

    Подсчёт консервативных столбцов в вертикальном блоке

    Был взят блок с 29 по 36 позиции для подсчёта абсолютно консервативных и абсолютно функционально консервативных столбцов.
    Результаты:
  • Абсолютно консервативные: 42.85%
  • Абсолютно функционально консервативные: 57.15%

  • Подсчёт позиций с гэпами в самом длинном участке за пределами блоков

    Самый длинный участок, подходящий к критерию, заданному в условии, - это участок с 79 по 132 позиции. Длина этого участка - 53 колонки, где в 8 из них содержатся гэпы. Значит процент колонок с гэпами равен 15.1% от общего числа колонок на этом участке.



    {ссылка на jvp-проект с участком с гэпами}

    Консеснсус и LOGO
    Рис. 1. LOGO блока 29-36.

    Консенсус - это некоторая усреднённая последовательность аминокислот (в нашем случае), которая отражает регулярно встречающиеся в анализируемом массиве выравнивания аминокислоты. С помощью сервера и программы cons была получена следующая консенсусная последовательность.
    Для создания своего LOGO потребовалось использовать данный сервис и команду Create your own logo, где необходимо ввести твою последовательность (блок).
    На рисунке 1 видно, что синис цветом обозначены гидрофильные аминокислоты, чёрным - гидрофобные, а зелёным - нейтральные. Такая раскраска стоит по умолчанию.

    Паттерн блока 29-36

    [IV]-G-[IL]-[TS]-[DN]-[FY]-A-Q

    Выравнивание последовательностей с заведомо негомологичной последовательностью

    В качестве заведомо негомологичной последовательности была взята последовательность белка аденилат киназы L. citreum KM20. Как видно из рисунка ниже, некоторые колонки всё же окрашены, однако это является не более чем случайностью, потому что основные блоки не окрашены. Всего окраске подверглись 12 из 147 колонок (8.2%), что говорит о том, что случайно выбранная последоваетельность, действительно не гомологична ранее анализируемым.


    {ссылка на jvp-проект с заведомо негомологичной последовательностью}

    Выравнивание заведомо негомологичных последовательностей

    В таблице 1 показаны основные характеристики 7 последовательностей, взятых случайным образом из списка белков студентов 1 курса.

    Таблица 1. Краткая информация о последовательностях
    Идентификатор белкаНазвание организмаФункция белка
    PHRA_AGRFCAgrobacterium fabrum C58Катализирует реакцию превращения циклобутадипиримидина в 2 пиримдиновых основания
    O66728_AQUAEAquifex aeolicus VF5Синтезирует поли-А хвост
    Q8AAN6_BACTNBacteroides thetaiotaomicron VPI-5482Катализирует реакцию синтеза фенилацетил-КоА
    PGK_COXBUCoxiella burnetii RSA 493Катализирует реакцию превращения 1,3-БФГ в 3-ФГ
    Q9RUU2_DEIRADeinococcus radiodurans R1Репарация ДНК вследствие УФ, свободных радикалов; необходим для плазмидной рекомбинации
    Q8RG11_FUSNNFusobacterium nucleatum ATCC 25586Катализирует реакцию превращения лактата в пируват и обратно
    Q74BH2_GEOSLGeobacter sulfurreducens PCAГалоацид дегидрогеназа

    Картинка выравнивания 7 случайных последовательностей представлена ниже. Из выравнивания видно, что ни в каких позициях не находятся функционально/структурно похожие аминокислоты, что говорит о негомологичности данных последовательностей. Так как блоки не обнаружены, 'X' придётся расствлять везде.



    {ссылка на jvp-проект с 7 негомологичными последовательностями}
    {ссылка на fasta-файл с 7 негомологичными последовательностями}