Учебная страница курса биоинформатики,
год поступления 2020
Для успешного выполнения задания крайне желательно знать свойства аминокислотных остатков! И иметь представление о 3D структурах белков. Надеюсь на то, что после блока Саши Злобина вы ориентируетесь в этих вопросах.
Задание пр.14
Не выполнившие задание в день занятия, могут его выполнить в ОДИН день - воскресенье 23 мая до 23:59
При записи в очередь в поле комментариев следует указать день и примерное время начала выполнения.
ААл
Начало выполнения в классе, завершение до конца ДНЯ занятия (т.е. до 24-х часов)
Время выполнения определяется по сообщению в очередь со ссылкой на страницу практикума 14.
На странице практикума 14 должны быть:
Ссылка на файл с проектом JalView с разметкой трех блоков и адекватным упорядочением последовательностей. ii. Протокол выполнения. Содержащий: ответы на вопросы; указание того, где и как в окне JalView выделены нужные блоки; паттерны плюс-блоков.
Задание. Найти в выравнивании три блока: (i) Вертикальный плюс-блок (ii) Частичный плюс-блок (iii) Минус-блок
Вертикальный плюс-блок тот, который содержит фрагменты всех последовательностей и является плюс-блоком (см. ниже).
- Задаётся координатами: позиции выравнивания от .... и до ....
- Паттерном, выделяющим фрагменты последовательностей, входящие в блок (возможно, не все, см ниже)
- В выравнивании эти позиции должны быть выделены буквой V (от Vertical) в строке аннотаций ниже выравнивания (по правок кнопке мыши под выравниваем, Add new row, имя строки BLOCKS)
Частичный плюс-блок тот, который содержит фрагменты обязательно не из всех последовательностей. В этом его отличие от вертикального плюс-блока. Так же задаётся координатами, паттерном (см. ниже), буквой P (от Partial) в той же строке BLOCKS.
- Дополнительно, последовательности, входящие в частичный плюс-блок, должны быть собраны вместе снизу или сверху выравнивания.
Требования к плюс-блоку
- Плюс-блок не содержит гэпов (чисто гэповая колонка в частичном плюс-блоке может быть, т.к. она не влияет на выравнивание).
- Первая и последняя позиции блока входят в паттерн, т.е. консервативны, хотя не обязательно абсолютно консервативны
- Паттерн блока удовлетворяет требованиям к паттерну (см. ниже)
- Блок не расширяет ни в ширину, ни в высоту (для частичного) с сохранением условий
Требования к паттерну плюс-блока
- Паттерн должен находить все или почти все фрагменты плюс-блока
Не найденные фрагменты должны частично удовлетворять паттерну, т.е. отличаться на один или несколько аминокислотных остатков. Сколько -невозможно написать, т.к. зависит от длины блока и паттерна. К сожалению, JalView не позволяет разрешить указать на приемлемое число несовпадени
Условия на позицию не должны состоять в перечислениии всех букв, встретившихся в выравнивании; в таком случае лучше ставить знак любой буквы - точку в JalView. Задание условия основанного на свойстве аминокислот, допускается и приветствуется (алифатические, гиброфобные, маленькие и т.п.). Проявите разумное отношение к паттерну и, по возможности, обоснуйте его.
- Если допускаются отличия от паттерна в один или несколько аминокислотных остатков. Сколько -невозможно написать, т.к. зависит от длины блока и паттерна.
Паттерн должен быть достаточно строгим, т.е. не встречаться в большом числе в последовательностях в случайных местах. Проверяется поиском по ВСЕМУ выравниванию, что находятся фрагменты блока, а вне их встреч паттерна мало, штуки, хотя они и не исключены. Если находка паттерна рядом с блоком, то подумайте не является ли она ошибкой программы выравнивания? Если да, напишите об этом - будет круто, и даже можете исправить выравнивание вручную. JalView позволяет эт делать (выделяте окошко, в котором есть место для передвижки и двигаете в нем мышкой, удерживая Shift или Ctrl)
- Первая и последняя позиции блока входят в паттерн, т.е. консервативны, хотя не обязательно абсолютно консервативны
- Блок не расширяет нив ширину, ни в высоту (для частичного) с сохранением условий
Минус-блок тот, из фрагментов, которого невозможно составить плюс-блок, вертикальный или частичный. Задаётся координатами, буквой M (от Minus) в той же строке BLOCKS. Желательно, чтобы он был вертикальным, включал фрагменты из всех последовательностей. Фрагмент из всех гэпов тоже могут быть. Если все-таки минус блок частичный, то все фрагменты с теми же коодинатами, не вошедшие в него, должны входить в частичные плюс-блоки; их может бытьболее одного.
Образец того, что нужно сделать см. на первом содержательном слайде презентации.
Как будет проверяться ответ
Вертикальный блок
- Проверю, что паттерн во всем выравнивании находит большинство фрагментов из блока и число встреч паттерна в других местах невелико. Это условие на то, что паттерн не встречается по случайными причинам где угодно.
- Проверю, что плюс-блок нельзя расширить добавлением позиций с N- и C- концов.
Частичный блок
- Так же, как вертикадьный. Проверю, что паттерн во всем выравнивании находит большинство фрагментов из блока и число встреч паттерна в других местах невелико.
- Проверю, что по вертикали блок не расширяется
- Расширение частичного блока в ширину не проверяется. Ведь с N- и C- концов от него могут быть вертикальные блоки
Минус блок
- Проверю, что из фрагментов минус блока нельзя составить частичный плюс-блок.
Порядок действий
Выбрать домен. Не успел подготовить список проверенные доменов. Поэтому сами выберите домен на свой вкус. Обязательное условие: в выравнивании seed домена более 10 последовательностей и меньше 60. Pfam Browse (https://pfam.xfam.org/family/browse?browse) и выбираете
- Выравнивание доступно со страницы домена по ссылке Alignmens. Сначала посмотрите на выравнивание View seed HTML (на посторонние строчки, если есть, не бращайте внимания, это разметка последовательности по вторичной структуре - при наличии 3D). Подходит если похоже на то, что нужные блоки найдутся
- Запишите в протоколе – ID и AC (PF…..) домена, число последовательностей в выравниваниях seed и full
Скачайте выравнивание seed. Format an alignment выберите seed и format fasta => generate (это и есть скачивание, не забудьте поменять расширение на fasta чтобы JalView понимал.
Откройте в JalView и ищите нужные три блока.
Технология JalView позволяет
- Сортировка
- Вручную выделить одну или несколько посл-й и двигать стрелками вверх или вниз. Удобно выделить последовательности поиском по паттерну и собрать их вместе вручную. Мы спциально выбираем выравнивания с небольшим числом последовательностей
- По попарному сходству
- По длине
- По группам. Группы можно определять
- построив дерево; щелчек мышкой приводит к вертикальной линии, отделяющей группы которые соотвествуют кладам - ветвям пересеченным линией
- выделив окно или несколько позиций можно определить группы по совпадению фрагментов в выделенном. удобно, только над выбирать позиции почти консервативные, т.к. ода группа соотвествует полностью свпадающим фрагментам
Выделение блока и выбор раскраски внутри выделения. В JalView выделить блок, правая кпопка мыши => Selection => make group, потом Edit group => Color