|
|||||||||||||||||||||||||
|
|
Для построения множественного выравнивания я использовала последовательности девяти белков, которые представлены в данном
fasta-файле. Проект в формате .jvp можно скачать по
ссылке.
Рисунок 1. Дерево для последовательностей из файла align_06.fasta, получено методом Neighbour Joining Using PAM 250 Для начала я сделала изображения выравнивания с раскраской BLOSUM62 с порогом консервативности 30 и ClustalX. Они представлены на рисунках 2а и 2b соответственно.
Рисунок 2a. Выравнивание последовательностей с раскраской BLOSUM62, порог консервативности 30%
Рисунок 2b. Выравнивание последовательностей с раскраской ClustalX Затем я добавила строку разметки BLOCKS, в которой отмечены участки, где можно ожидать гомологию между всеми аминокислотными остатками из разных последовательностей. Всего я нашла 3 блока (позиции 21-46, 52-61 и 69-83), из них 2 последних можно объединить в кластер, потому что между ними нет гэпов. Самые длинные участки, не входящие в состав блоков и кластеров, расположены в начале и в конце последовательностей и имеют длину 20 и 21 аминокислотных остатков соответственно (позиции 1-20 и 84-105). Выравнивание с разметкой приведено на рисунках 3a и 3b.
Рисунок 3a. Выравнивание последовательностей с раскраской BLOSUM62, порог консервативности 30%. Символами B обозначены блоки, символом С - участок между блоками, объединенными в кластер, символами X - участки, не входящие в состав блоков и кластеров.
Рисунок 3b. Выравнивание последовательностей с раскраской ClustalX. Символами B обозначены блоки, символом С - участок между блоками, объединенными в кластер, символами X - участки, не входящие в состав блоков и кластеров. Можно выделить несколько последовательностей, которые скорее всего составляют отдельную группу, потому что они более близки друг к другу, чем все остальные последовательности. Я выделила 3 таких посдедовательности: LISML, LACLK и ENTFO. На рисунке 4 эти последовательности обведены черной рамкой, а также отмечены некоторые участки, на которых видны отличия этих последовательностей от всех остальных (символами H и черной рамкой). Можно заметить, что на выделенном участке (позиции 14-16 и 18-20) нельзя говорить о гомологии всех последовательностей выранивания, однако выбранные последовательности имеют высокое сходство, и можно считать, что аминокислотные остатки в соответствующих позициях для данных последовательностей гомологичны. На дереве, построенном для этого выравнивания (представленно на рисунке 1), также видно, что отмеченные последовательности составляют отдельную эволюционную группу.
Рисунок 4. Группа гомологичных последовательностей (обведена черной рамкой), раскраска ClustalX. Символом H отмечены участки, на которых можно увидеть отличия этих последовательностей от остальных. Отличающиеся аминокислотные остатки обведены черной рамкой. Для первого блока (отдельно представлен на рисунках 5a и 5b) я посчитала число и процент абсолютно консервативных позиций, абсолютно функционально консервативных, консервативных и функционально консервативных на 70%. Полученные данные записаны в таблице 1.
Рисунок 5a. Первый блок, раскраска BLOSUM62, порог консервативности 30%
Рисунок 5b. Первый блок, раскраска ClustalX
Для самых длинных участков, не входящих в состав блоков и кластеров, были посчитаны число и процент позиций с гэпами. В первом таком участке гэпов 3, во втором 1. Это составляет 15% и 4,76% соответственно от общей длины участка. Далее к уже имеющемуся выравниванию я добавила еще одну последовательность, которую можно скачать по ссылке. Я добавила несколько гэпов в участок между блоками, где уже был гэп. Получившееся выравнивание можно посмотреть на рисунках 6a и 6b, новая последовательность расположена снизу, ее название EUBR3.
Рисунок 6a. Выравнивание с добавленной последовательностью EUBR3, раскраска BLOSUM62, порог консервативности 30%
Рисунок 6b. Выравнивание с добавленной последовательностью EUBR3, раскраска ClustalX К исходному выравниванию я также попыталась добавить негомологичную последовательность. Для этого я использовала последовательность своего белка D-аланил-D-аланин карбоксипептидазы (ссылка на fasta-файл). Так как этот белок гораздо длиннее белков в выравнивании, я взяла фрагмент длиной 105 а.о. из середины его последовательности. Результаты выравнивания показаны на рисунках 7a и 7b, добавленная последовательность обозначена как YP.
Рисунок 7a. Выравнивание с добавленной последовательностью белка YP_007078865.1 (обозначение YP, последняя строчка), раскраска BLOSUM62, порог консервативности 30%
Рисунок 7b. Выравнивание с добавленной последовательностью белка YP_007078865.1 (обозначение YP, последняя строчка), раскраска ClustalX Как видно на рисунке 7b, некоторые позиции новой негомологичной последовательности совпадают с консервативными позициями в блоках исходного выравнивания (они раскрашены одним цветом). Таких позиций 12, то есть всего совпадений с негомологичным белком 11,43%. Совпадающие позиции 22, 27, 35, 39, 40, 41, 54, 59, 71, 72, 77, 79. Если учитывать такие функциональные группы аминокислот, как все гидрофильные и все гидрофобные аминокислоты и сходные по структуре доноры или акцепторы водородных связей, то число совпадений увеличивается до 20, что составляет 19,05%. Такие функционально консервативные позиции - это 32, 34, 38, 46, 58, 60, 61, 73. Однако эти совпадения можно считать случайными, потому что консервативные позиции нельзя объединить в блоки, поэтому участки последовательностей друг другу не гомологичны.
Также я построила выравнивание заведомо негомологичных последовательностей. Для этого я использовала 6 белков из
списка белков, с которыми работают мои
однокурсники. AC выбранных белков в базе данных UniProt: B8D2N2, F4BY60, I0I273, B2KEJ9, D1C2A4, F0QTE2.
Выравнивание было построено с помощью команды "Muscle with Default". Результат представлен на рисунке 8.
Совпадающих позиций очень мало, так как последовательности негомологичны друг другу. Самые лучшие блоки (те,
в которых аминокислотные остатки гомологичны в половине или более последовательностей) представлены отдельно
на рисунках 9a, 9b и 9c (позиции 68-71, 106-113, 157-162 соответственно). Однако эти блоки слишком короткие,
и совпадения можно считать случайными.
Рисунок 8. Выравнивание негомологичных последовательностей белков, раскраска ClustalX. Черной рамкой обведены участки более-менее хорошего выравнивания
Рисунок 9a (слева). Первый блок выравнивания негомологичных последовательностей, позиции 68-71,
раскраска ClustalX
|
||||||||||||||||||||||||
|
© Наталия Кашко, 2015 |
|||||||||||||||||||||||||