Выравнивание и гомология

Для построения множественного выравнивания я использовала последовательности девяти белков, которые представлены в данном fasta-файле. Проект в формате .jvp можно скачать по ссылке.
Я отсортировала последовательности с помощью дерева, построенного методом Neighbour Joining Using PAM 250 (рисунок 1).

Дерево

Рисунок 1. Дерево для последовательностей из файла align_06.fasta, получено методом Neighbour Joining Using PAM 250

Для начала я сделала изображения выравнивания с раскраской BLOSUM62 с порогом консервативности 30 и ClustalX. Они представлены на рисунках 2а и 2b соответственно.

Раскраска BLOSUM62

Рисунок 2a. Выравнивание последовательностей с раскраской BLOSUM62, порог консервативности 30%

Раскраска ClustalX

Рисунок 2b. Выравнивание последовательностей с раскраской ClustalX

Затем я добавила строку разметки BLOCKS, в которой отмечены участки, где можно ожидать гомологию между всеми аминокислотными остатками из разных последовательностей. Всего я нашла 3 блока (позиции 21-46, 52-61 и 69-83), из них 2 последних можно объединить в кластер, потому что между ними нет гэпов. Самые длинные участки, не входящие в состав блоков и кластеров, расположены в начале и в конце последовательностей и имеют длину 20 и 21 аминокислотных остатков соответственно (позиции 1-20 и 84-105). Выравнивание с разметкой приведено на рисунках 3a и 3b.

Разметка по блокам, раскраска BLOSUM62

Рисунок 3a. Выравнивание последовательностей с раскраской BLOSUM62, порог консервативности 30%. Символами B обозначены блоки, символом С - участок между блоками, объединенными в кластер, символами X - участки, не входящие в состав блоков и кластеров.

Разметка по блокам, раскраска ClustalX

Рисунок 3b. Выравнивание последовательностей с раскраской ClustalX. Символами B обозначены блоки, символом С - участок между блоками, объединенными в кластер, символами X - участки, не входящие в состав блоков и кластеров.

Можно выделить несколько последовательностей, которые скорее всего составляют отдельную группу, потому что они более близки друг к другу, чем все остальные последовательности. Я выделила 3 таких посдедовательности: LISML, LACLK и ENTFO. На рисунке 4 эти последовательности обведены черной рамкой, а также отмечены некоторые участки, на которых видны отличия этих последовательностей от всех остальных (символами H и черной рамкой). Можно заметить, что на выделенном участке (позиции 14-16 и 18-20) нельзя говорить о гомологии всех последовательностей выранивания, однако выбранные последовательности имеют высокое сходство, и можно считать, что аминокислотные остатки в соответствующих позициях для данных последовательностей гомологичны. На дереве, построенном для этого выравнивания (представленно на рисунке 1), также видно, что отмеченные последовательности составляют отдельную эволюционную группу.

Гомологичные последовательности, раскраска ClustalX

Рисунок 4. Группа гомологичных последовательностей (обведена черной рамкой), раскраска ClustalX. Символом H отмечены участки, на которых можно увидеть отличия этих последовательностей от остальных. Отличающиеся аминокислотные остатки обведены черной рамкой.

Для первого блока (отдельно представлен на рисунках 5a и 5b) я посчитала число и процент абсолютно консервативных позиций, абсолютно функционально консервативных, консервативных и функционально консервативных на 70%. Полученные данные записаны в таблице 1.

Первый блок, раскраска BLOSUM62

Рисунок 5a. Первый блок, раскраска BLOSUM62, порог консервативности 30%

Первый блок, раскраска ClustalX

Рисунок 5b. Первый блок, раскраска ClustalX

Таблица 1. Число и процент позиций различного типа в первом блоке
Позиция Число Процент Номера позиций
Абсолютно консервативные 10 38,46% 21, 24, 25, 27, 29, 30, 32, 33, 35, 38
Абсолютно функционально консервативные 9 34,62% 22, 26, 34, 39, 40, 41, 43, 45, 46
Консервативные на 70% 6 38,46% 22, 26, 31, 39, 41, 46
Функционально консервативные на 70% 2 7,69% 23, 42

Для самых длинных участков, не входящих в состав блоков и кластеров, были посчитаны число и процент позиций с гэпами. В первом таком участке гэпов 3, во втором 1. Это составляет 15% и 4,76% соответственно от общей длины участка.

Далее к уже имеющемуся выравниванию я добавила еще одну последовательность, которую можно скачать по ссылке. Я добавила несколько гэпов в участок между блоками, где уже был гэп. Получившееся выравнивание можно посмотреть на рисунках 6a и 6b, новая последовательность расположена снизу, ее название EUBR3.

Выравнивание с новой последовательностью, раскраска BLOSUM62

Рисунок 6a. Выравнивание с добавленной последовательностью EUBR3, раскраска BLOSUM62, порог консервативности 30%

Выравнивание с новой последовательностью, раскраска ClustalX

Рисунок 6b. Выравнивание с добавленной последовательностью EUBR3, раскраска ClustalX

К исходному выравниванию я также попыталась добавить негомологичную последовательность. Для этого я использовала последовательность своего белка D-аланил-D-аланин карбоксипептидазы (ссылка на fasta-файл). Так как этот белок гораздо длиннее белков в выравнивании, я взяла фрагмент длиной 105 а.о. из середины его последовательности. Результаты выравнивания показаны на рисунках 7a и 7b, добавленная последовательность обозначена как YP.

Выравнивание с негомологичной последовательностью, раскраска BLOSUM62

Рисунок 7a. Выравнивание с добавленной последовательностью белка YP_007078865.1 (обозначение YP, последняя строчка), раскраска BLOSUM62, порог консервативности 30%

Выравнивание с негомологичной последовательностью, раскраска ClustalX

Рисунок 7b. Выравнивание с добавленной последовательностью белка YP_007078865.1 (обозначение YP, последняя строчка), раскраска ClustalX

Как видно на рисунке 7b, некоторые позиции новой негомологичной последовательности совпадают с консервативными позициями в блоках исходного выравнивания (они раскрашены одним цветом). Таких позиций 12, то есть всего совпадений с негомологичным белком 11,43%. Совпадающие позиции 22, 27, 35, 39, 40, 41, 54, 59, 71, 72, 77, 79. Если учитывать такие функциональные группы аминокислот, как все гидрофильные и все гидрофобные аминокислоты и сходные по структуре доноры или акцепторы водородных связей, то число совпадений увеличивается до 20, что составляет 19,05%. Такие функционально консервативные позиции - это 32, 34, 38, 46, 58, 60, 61, 73. Однако эти совпадения можно считать случайными, потому что консервативные позиции нельзя объединить в блоки, поэтому участки последовательностей друг другу не гомологичны.

Также я построила выравнивание заведомо негомологичных последовательностей. Для этого я использовала 6 белков из списка белков, с которыми работают мои однокурсники. AC выбранных белков в базе данных UniProt: B8D2N2, F4BY60, I0I273, B2KEJ9, D1C2A4, F0QTE2. Выравнивание было построено с помощью команды "Muscle with Default". Результат представлен на рисунке 8. Совпадающих позиций очень мало, так как последовательности негомологичны друг другу. Самые лучшие блоки (те, в которых аминокислотные остатки гомологичны в половине или более последовательностей) представлены отдельно на рисунках 9a, 9b и 9c (позиции 68-71, 106-113, 157-162 соответственно). Однако эти блоки слишком короткие, и совпадения можно считать случайными.
В первом блоке (рисунок 9a) можно сказать, что для всех последовательностей есть 2 абсолютно функционально консервативные позиции (69 и 71) и функционально консервативные на 83,3% (68 и 70). Все позиции консервативны на 50%. Если учитывать только первые 5 последовательностей, то все 4 позиции блока являются абсолютно функционально консервативными. Во втором блоке (рисунок 9b) для четырех нижних последовательностей есть 1 абсолютно консервативная позиция (106), 1 консервативная на 75% (107) и 3 абсолютно функционально консервативные позиции (108, 111, 113). Для третьего блока (рисунок 9c) можно выделить, например, последние три последовательности. Для них есть 3 абсолютно функционально консервативные последовательности (157, 158 и 159) и 1 абсолютно консервативная (162).

Выравнивание негомологичных последовательностей

Рисунок 8. Выравнивание негомологичных последовательностей белков, раскраска ClustalX. Черной рамкой обведены участки более-менее хорошего выравнивания

Первый блок   Второй блок   Третий блок  

Рисунок 9a (слева). Первый блок выравнивания негомологичных последовательностей, позиции 68-71, раскраска ClustalX
Рисунок 9b (в центре). Второй блок выравнивания негомологичных последовательностей, позиции 106-113, раскраска ClustalX
Рисунок 9c (справа). Третий блок выравнивания негомологичных последовательностей, позиции 157-162, раскраска ClustalX

© Наталия Кашко, 2015