Учебная страница курса биоинформатики,
год поступления 2015
Практикум 10: Анализ множественных выравниваний
Дано: Множественное выравнивание, полученное в результате прошлого практикума.
1.#1 Найдите в выравнивании блоки - прямоугольники, в столбцах которых можно ожидать гомологию аминокислотных остатков из разных последовательностей. Блок не может содержать символы гэпа. А именно:
1a. Все вертикальные блоки, то есть участки, на которых для каждой колонки можно ожидать гомологию между остатками из ВСЕХ последовательностей. См. словарь терминов
В проекте JalView добавьте строку разметки (см. "Как разметить выравнивание" в подсказках). Вертикальные блоки отмечайте символом B.
1b. Один блок из части последовательностей, но не из всех. Требуется как предположительная гомологичность остатков в столбцах блока, так и негомологичность им остатков их остальных последовательностей (точнее, отсутствие данных за их гомологичность).
В проекте JalView создайте отдельное окно, в котором объедините найденные последовательности в одну группу, раскрасьте ГРУППУ так же, как все выравнивание, и отметьте найденный участок символом H.
Опишите свои аргументы в пользу гомологии отдельных остатков в данных последовательностях (высокое сходство этих последовательностей между собой при отсутствии сходства с другими последовательностями).
2a. Посчитайте число и процент абсолютно консервативных позиций; абсолютно функционально консервативных. Это задание надо выполнять для одного из блоков.
Используйте следующий список групп аминокислотных остатков:
KR ST LIVM FYW DN EQ P G A H С
Список составлен согласно матрице BLOSUM62, использующейся в программах выравнивания. Основанием для такого объединения остатков служат данные о частотах мутаций.
2b. Для самого длинного участка выравнивания, не входящего в состав блоков, посчитайте число и процент позиций с гепами.
Отметьте этот участок символом X.
Сохраните консенсусную последовательность и LOGO одного блока.
Воспользуйтесь программой cons на сервере http://emboss.bioinformatics.nl/, программой consambig на kodomo или скопируйте консенсус из JalView (кликнуть правой кнопкой на слове Consensus).
Воспользуйтесь сервисом http://weblogo.threeplusone.com/
Постройте паттерн выбранного блока.
Синтаксис паттернов: A, C, D, E ... - обозначения аминокислот. x - любая аминокислота. [] - любой из символов. {} - любой из символов, кроме заданных. (3) - повторить 3 раза, (2,5) - от 2 до 5 раз.
Подробности http://prosite.expasy.org/scanprosite/scanprosite_doc.html#mo_motifs .
Примеры:
A-C-N-R = последовательность ACNR
A-C(2)-N-R = последовательность ACCNR
A-x-N-R = последовательность ACNR, или ADNR, или ANNR, но не AKTNR
A-[ST]-N-R = последовательность ACNR или ATNR
A-[ST](2)-G-H = последовательность ASTGH или ATTGH, но не ATGH
A-[ST]-x(2)-R = последовательность ATKPR или ASFYR, но не ASNR
A-[ST]-x(2,3)-R = последовательность ATKPR или ASFHYR, но не ASNR
A-{ST}-G(1,1000)-R = последовательность ADGR или ADGGR или AAGGGGGGGR, но не ASGGGGR
Добавьте в выравнивание заведомо негомологичную последовательность и попытайтесь ее выровнять с остальными.
Возьмите, например, последовательность своего белка. Если она сильно длиннее вашего выравнивания, - возьмите любое ее участок соответствующей длины. Если сильно короче - повторите ее нужное число раз.
Разрешается добавлять гэпы в тех участках выравнивания, где они есть в выровненных последовательностях. Ваша задача - "найти" максимальное число совпадений вашей последовательностями с консервативными позициями в блоках из вашего выравнивания. Какой процент таких позиций удалось "найти"?
Постройте множественное "выравнивание" заведомо негомологичных (не родственных) белков. Найдите два самых лучших "блока", включающих не менее половины последовательностей, приведите их на html странице (и ссылку на "выравнивание" не забудьте!).
Выберете 5 - 7 любых последовательностей из списка белков, с которыми работают другие студенты вашего курса. Откройте JalView, импортируйте их: File -> Fetch sequences, укажите базу данных и AC последовательностей. Постройте выравнивание: web services -> Alignment -> muscle with default. Далее - как в заданиях 1 и 2. Выводы внесите в протокол и на сайт.
Добавьте в выравнивание последовательность, и впишите её вручную в исходное выравнивание
Воспользуйтесь меню File->Add sequence. Как перемещать часть последовательности см. в инструкции по JalView. Сохраните получившийся результат в отдельном окне.