Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2015

Практикум 10: Анализ множественных выравниваний

Дано: Множественное выравнивание, полученное в результате прошлого практикума.

1.#1 Найдите в выравнивании блоки - прямоугольники, в столбцах которых можно ожидать гомологию аминокислотных остатков из разных последовательностей. Блок не может содержать символы гэпа. А именно:

В проекте JalView добавьте строку разметки (см. "Как разметить выравнивание" в подсказках). Вертикальные блоки отмечайте символом B.

В проекте JalView создайте отдельное окно, в котором объедините найденные последовательности в одну группу, раскрасьте ГРУППУ так же, как все выравнивание, и отметьте найденный участок символом H.

Опишите свои аргументы в пользу гомологии отдельных остатков в данных последовательностях (высокое сходство этих последовательностей между собой при отсутствии сходства с другими последовательностями).

Используйте следующий список групп аминокислотных остатков:

KR
ST
LIVM
FYW
DN
EQ
P
G
A
H
С

Список составлен согласно матрице BLOSUM62, использующейся в программах выравнивания. Основанием для такого объединения остатков служат данные о частотах мутаций.

Отметьте этот участок символом X.

  1. Сохраните консенсусную последовательность и LOGO одного блока.

Воспользуйтесь программой cons на сервере http://emboss.bioinformatics.nl/, программой consambig на kodomo или скопируйте консенсус из JalView (кликнуть правой кнопкой на слове Consensus).

Воспользуйтесь сервисом http://weblogo.threeplusone.com/

  1. Постройте паттерн выбранного блока.

Синтаксис паттернов: A, C, D, E ... - обозначения аминокислот. x - любая аминокислота. [] - любой из символов. {} - любой из символов, кроме заданных. (3) - повторить 3 раза, (2,5) - от 2 до 5 раз.

Подробности http://prosite.expasy.org/scanprosite/scanprosite_doc.html#mo_motifs .

Примеры:

A-C-N-R = последовательность ACNR

A-C(2)-N-R = последовательность ACCNR

A-x-N-R = последовательность ACNR, или ADNR, или ANNR, но не AKTNR

A-[ST]-N-R = последовательность ACNR или ATNR

A-[ST](2)-G-H = последовательность ASTGH или ATTGH, но не ATGH

A-[ST]-x(2)-R = последовательность ATKPR или ASFYR, но не ASNR

A-[ST]-x(2,3)-R = последовательность ATKPR или ASFHYR, но не ASNR

A-{ST}-G(1,1000)-R = последовательность ADGR или ADGGR или AAGGGGGGGR, но не ASGGGGR

  1. Добавьте в выравнивание заведомо негомологичную последовательность и попытайтесь ее выровнять с остальными.

Возьмите, например, последовательность своего белка. Если она сильно длиннее вашего выравнивания, - возьмите любое ее участок соответствующей длины. Если сильно короче - повторите ее нужное число раз.

Разрешается добавлять гэпы в тех участках выравнивания, где они есть в выровненных последовательностях. Ваша задача - "найти" максимальное число совпадений вашей последовательностями с консервативными позициями в блоках из вашего выравнивания. Какой процент таких позиций удалось "найти"?

  1. Постройте множественное "выравнивание" заведомо негомологичных (не родственных) белков. Найдите два самых лучших "блока", включающих не менее половины последовательностей, приведите их на html странице (и ссылку на "выравнивание" не забудьте!).

Выберете 5 - 7 любых последовательностей из списка белков, с которыми работают другие студенты вашего курса. Откройте JalView, импортируйте их: File -> Fetch sequences, укажите базу данных и AC последовательностей. Постройте выравнивание: web services -> Alignment -> muscle with default. Далее - как в заданиях 1 и 2. Выводы внесите в протокол и на сайт.