Анализ множественных выравниваний



Вертикальные блоки

Вертикальный блок мы определили как участок множественного выравнивания, обладающий следующими свойствами:

В выравнивании последовательностей с идентификаторами Uniprot I4C028_DESTA, D3V4H4_XENBS, V2VXE3_9GAMM, F4LVQ3_TEPAE, J7IPW5_DESMD мною было найдено 5 вертикальных блоков - участков, на которых для каждой колонки можно ожидать гомологию остатков из всех последовательностей. Вертикальные блоки обозначены символом B.



Ссылка на JalView проект, задание 1

Один блок из части последовательностей

Две из пяти данных последовательностей показались мне более схожими между собой. Я объединила их в одну группу и раскрасила так же, как выравнивание. Символом H выделен участок, на котором в пределах группы все остатки с очень высокой вероятностью гомологичны ввиду абсолютной консервативности колонок, а за пределами группы эта вероятность снижается, главным образом из-за наличия в других трех последовательностях гэпа и нескольких колонок, не являющихся абсолютно функционально консервативными.



Ссылка на JalView проект, задание 2

Число и процент консервативных позиций

Параметры были подсчитаны для вертикального блока с координатами 66-73. Всего в нем 8 колонок.

ПозицииЧислоПроцент
Абсолютно консервативные337,5%
Абсолютно функционально консервативные675,0%

Число и процент позиций с гэпами в самом длинном участке за пределами блоков

Самый длинный участок выравнивания, не входящий в состав блоков, обозначен символом X. Общее число колонок в нем - 35. Число позиций с гэпами - 2. Процент позиций с гэпами - 5,71%.



Ссылка на JalView проект, процент гэпов

Консенсусная последовательность и LOGO одного блока

Консенсусная последовательность (consensus sequence) — усредненная нуклеотидная или аминокислотная последовательность, которая регулярно встречается в данном генетическом элементе. В каждом из ее положений находятся аминокислоты или нуклеотиды, чаще всего встречающиеся в данной позиции во всех известных родственных последовательностях.
Консенсусные последовательности создаются на основе анализа массивов выровненных последовательностей и часто принимаются за эталон в сравнительном анализе. [1]

Для получения данной последовательности для блока 66-73 я воспользовалась программой cons на сервере http://emboss.bioinformatics.nl/. Она принимает на вход совокупность выровненных последовательностей и на выход выдает требуемую консенсусную последовательность в выбранном формате (Fasta, gbk и др.).
Полученный на выходе fasta-файл: consensus.fasta .

Для получения LOGO блока был использован сервис http://weblogo.threeplusone.com/, который принимает на вход совокупность выровненных последовательностей и автоматически выдает искомое изображение в указанном разрешении. По умолчанию аминокислотные последовательности окрашиваются по гидрофобности. Гидрофобные аминокислоты выделяются черным, гидрофильные синим, а нейтральные зеленым.


Паттерн блока

Паттерн для блока 66-73: [LVI]-S-G-E-[VI]-[LITV]-[EA]-[VI].

Выравнивание с негомологичной последовательностью

Для данного задания я использовала последовательность белка пыльцы-аллерегена (Uniprot ID: ALL1_OLEEU), очевидно не гомологичную пяти последовательностям, исследуемым ранее. Редактируя выравнивание, я нашла некоторое количество "консервативных" колонок, но тем не менее видно, что качество выравнивания очень низкое.



Процент консервативных позиций в блоках после добавления негомологичной последовательности, естественно, снизился. Ссылка на JalView проект, выравнивание с негомологичной последовательностью

Выравнивание заведомо неродственных белков

Я выбрала 5 случайных белков из списка и создала "выравнивание" согласно предыдущей схеме.

Uniprot IDUniprot ACНазвание белкаОрганизм
ISCS2_ARCFUO29689Cysteine desulfurase IscS 2Archaeoglobus fulgidus DSM 4304
Q8AAN6_BACTNQ8AAN6Phenylacetate-coenzyme A ligaseBacteroides thetaiotaomicron VPI-5482
C6XF58_LIBAPC6XF58Periplasmic solute binding proteinCandidatus Liberibacter asiaticus str. psy62
Q9RUU2_DEIRAQ9RUU2DNA helicase RecQDeinococcus radiodurans R1
PHNS_DESVMP21853; B8DPE1Periplasmic [NiFe] hydrogenase small subunitDesulfovibrio vulgaris str. 'Miyazaki F'

В полученном "выравнивании" не нашлось ни одного участка, удовлетворяющего введенному нами определению блока. Из 737 колонок колонок только 12 можно назвать абсолютно функционально консервативными (1,6%), из них только 2 (0,3%) абсолютно функционально консервативные.
В целом, выравнивание очень низкого качества: в нем мало консервативных позиций и много гэпов. Все это свидетельствует об отсутствии гомологии.



Ссылка на JalView проект, выравнивание негомологичных последовательностей





[1]. База знаний по биологии человека