Учебная страница курса биоинформатики,
год поступления 2018
Задания практикума 13
Пожалуй, оставим одно
Задание 1. Указать блоки в множественном выравнивании
ВВЕДЕНИЕ
Как обосновать гомологичность последовательностей белков с помощью выравнивания?
- Во-первых, гомологичными могут быть или полные последовательности или их части, домены.
- Парное выравнивание с процентом идентичности менее (условно) 40% мало пригодно для этого из-за возможности наличия колонок со случайным совпадением букв.
- Следует построить множественное выравнивание вероятных гомологов, которых можно найти с помощью BLAST, по функции, взять семейство Pfam с доменом, который есть в вашем белке, и как-то еще.
Вот перед нами множественное выравнивание, открытое в Jalviw. Стандартные действия
Свою последовательность не удалять или после редактирования вернуть в выравнивание!
удалить (если занудствовать — отправить в отдельный файл) очевидные фрагменты последовательности белка, те, у которых с N- или С-конца отсутствуют протяженные участки. Условно, протяженные - больше 10 а/к остатков, но этот порог, как и все остальные этом тексте, не закон, а ориентир.
- удалить последовательности с протяженными вставками или делециями в середине
из одинаковых или почти одинаковых последовательностей оставить по одной (Jalview, функция Edit > Remove redundancy порог на совпадение 100% или 90%, подбирать по обстоятельствам)
удалить колнки из одних гэпов (Edit > remove empty columns)
Sort > by pairwise identity
Если в выравнивании осталось много последовательностей, то посмотрите сколько ( View > alignment properties)
Для вас, сократите до примерно десятка последовательностей. В обычной работе биоинформатика выравнивния из сотен последовательностей глазами тоже трудно анализировать. Надо либо использовать скрипты, либо сократить до десятков.
В результате перед нами выравнивание, б.м. приведенное в порядок
- найдите консервативные блоки в выравнивании достаточно длинные (условно, более 6-ти позиций) участки выравнивания, на которых часто (супер-условно - консервативных позиций э-э-э-э почти половина и расстояния между ними э-э-э менее 6-и позиций) расположены консервативные позиции или функционально консервативные и ни в одной позиции нет гэпов.
Увидеть такой блок в выравнивании негомологичных последовательностей, кроме последовательностей малой сложности, дело безнадежное.
Во-первых, вероятность получить случайно консервативную позицию в выравнивании 10 последовательностей уже сильно меньше (возводится в степень) чем вероятности такового в парном выравнивании. Во-вторых, случайная группировка консервативных позиций еще значительно менее вероятна.
В-третих, известно, что в белках консервативные а/к остатки обычно группируются на важных для функции и структуре участках, а не консервативные остатки часто расположены в петлях, выходящих на поверхность глобулы (вспомните пространственные структуры).
В Jalview уберите строки с консервативностями снизу окна, они толь захламляют изображение (Annotations > убрать галочку Show annotations; или можно убирать эти строчки с аннотациями по одной - курсор на название строчки и щелкните по правой кнопке мыши)
- Вставьте свою строку аннотаций для разметки блоков (курсор в область названий строк аннотаций снизу,щелкните по правой кнопке мыши, выберите Add New Row)
- Найдите блоки глазами и вставьте их аннотацию, выделив столбцы с блоком
- ДОСТАТОЧНО БЛИЗКО ДРУГ К ДРУГУ РАСПОЛОЖЕННЫЕ БЛОКИ СВИДЕТЕЛЬСТВУЮ О ГОМОЛОГИЧНОСТЬ ВСЕХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ, ВХОДЯЩИХ В БЛОКИ на участке объединения блоков. УРА!
ЗАДАНИЕ
Выбрать множественное выравнивание (см. указания)
- Привести в порядок, как описано выше
- Найдите и разметьте блоки в выравнивании
- На веб-странице объясните полученный результат - гомологичность последовательностей из выравнивания и как она установлена, сколько и какие блоки найдены.
- Поставьте ссылку на проект Jalview.