Комментарии по результатам проверки выполненных заданий
Некоторые задания то ли я плохо объяснил, то ли студенты не слушали и не прочитали внимательно подсказки, то ли и то и другое
.
Я засчитывал некоторые задания выполненные не так, как ожидал бы. Снижал балл и писал комментарий. В обучении темам, в которых необходимо накопление собственного опыта и интуиции, важен диалог.
.
Профессор кардиолог А.Л.Сыркин так отвечал на вопрос: как Вы учите студентов?
А.Л. "Это - кошка, это - собака, это - кошка, это - собака, это опять собака.
.
В этом семестре с диалогами не просто, а написание индивидуальных комментариев занимает много времени. Поэтому решил прокомментировать типичные ошибки. И еще раз написать как их избежать.
Посмотрите этот текст при подготовке к коллоквиуму.
Ревизия выравнивания
Выравнивание на слайде 1 выглядит странно из-за множественных длинных вставок в отдельных последовательностях.
Глазами видим довольно консервативный блок поз. 30 - 45. Похоже на N-концевой консервативный блок домена.
Удаляю отмеченные последовательности. Потом Esc (чтобы снять случайные выделения) Edit => Remove empty columns.
Еще одна последовательность похожа на не принадлежащую семейству по той же причине - длинная вставка только у нее(слайд 2). К тому же она выбивается из выравнивания по всей длине.
Удаляю. Remove empty columns.
Любая ли длинная вставка говорит о том, что последовательность не из семейства? НЕТ, в эволюции бывают такие вставки (слайд 3).
Присмотритесь, отмеченная вставка не в одной последовательности, а в нескольких, да еще вставленные а/к во всех сходны. Слева и справа от вставок последовательности сходны c консенсусом консервативных блоков. Оставляем!
В таких случаях я собираю последовательности с гомологичными вставками в соседних строках выравнивания. Выделяю колонки 256 - 268 => Select => Make groups for selection; calculate => sort by groups; Select => undefine groups. Получаем слайд 4.
Очевидно, группа сходных последовательностей со вставкой, которая снизу,должна быть представлена после ревизии! Заметим, после сортировки консервативные колонки выделяются лучше!
Еще один вопрос возникает при разглядывании слайда 1. У большинства последовательностей первая аминокислота M стоит примерно в колонке 28. А у многих первый M стоит в колонке 39. Может быть это фрагменты? В данном случае похоже НЕТ. По той же причине - у десятка последовательностей первая а/к M стоит ровно водной и той же колонке 39, и на глаз далее последовательности похожи друг на друга. Применяя тот же финт: группы по колонкам 25 - 40, сортировка по группам, получаем слайд 5. Появилась вторая группа сходных последовательностей, которая должна быть представлена в выравнивании revised.
Пора удалить избыточность похожих последовательностей. Esc (чтобы снять все случайные выделения) => Edit => Remove redundancy. После проб и ошибок остановился на 90%.
Осталось 22 последовательности. ОК. Слайд 6. А посмотрю-ка внимательнее на консервативные блоки.
Из нижней пары консервативных позиций и из верхней пары частично консервативных позиций выбивается одна и та же последовательность JH85.1. И по ходу выравнивания она отличается сильнее остальных от консенсуса. Ошибочно попала в семейство? 100% уверенности нет, но может быть и так. Удаляю. В конце концов мне нужны вертикальные консервативные блоки. Удалил еще 2ю последовательность. Осталось 20 последовательностей, см. слайд 7.
Цель Оставить в выравнивании небольшое число последовательностей таких, что
- каждая последовательность содержит полную последовательность домена
- последовательности хорошо представляют исходное выравнивание, не считая последовательностей, которые (i) лишь фрагменты домена, (ii) нет уверенности, что они из семейства
- выборка последовательностей не избыточная (nonredundent) - не содержит очень похожих последовательностей
- в выравнивании нет пустых колонок
Примерно так составляется выравнивание seed в Pfam. Если есть 3D структуры домена, то в seed добавляются последовательности доменов из соответствующих белков для проверки выравнивания по 3D структурам.
Блоки
Взяли выравнивание после ревизии в GeneDoc см слайд 8. Иногда умолчательные группы функционально похожих а/к могут не удовлетворять студента, знающего свойства а/к.
Можно изменять их (i) меняя матрицу весов замен Project => Configure => Score Table. (ii) Там же можно определить группы по своему усмотрению.
.
Блоки демонстрируются в презентации на слайде 8.
.
Вертикальные (содержащие фрагменты из всех последовательностей) 100% консервативные (консервативная колонка содержит сходные а/к во всех последовательностях) в красной рамке.
.
Частичные (содержащий фрагменты из нескольких но не всех последовательностей) 100% консервативные (консервативная колонка содержит сходные а/к во всех последовательностях блока) в желтой рамке.
.
100% консервативные вертикальные и частичные блоки выбираются не расширяемыми ни в ширину, ни в высоту для частичных блоков с сохранением признаков блоков.
.
Минус блок, блок в которых нельзя утверждать гомологичность никаких а/к остатков ни в какой колонке, в голубой рамке.
—
Колонка выравнивания называется 100% консервативной, если в ней нет гэпов и все а/к принадлежат одной функционально группе а/к. Функциональные группы определяются матрицей весов замен или задаются вручную.
.
Вертикальным блоком называется это прямоугольник в выравнивании, определяемый участком выравнивания от позиции .... до позиции ...., включающий все последовательности.
В вертикальном блоке на может быть пустых колонок, т,к. их не может быть в выравнивании за бессмысленностью.
.
100% консервативным вертикальным блоком называется вертикальный блок, в котором:
- Первая и последняя колонка 100% консервативны
- Ни в одной колонке блока нет ни одного гэпа
- Между соседними консервативными колонками число не 100% консервативных позиций невелико. Точного порога нет. 20 неоконсервативных подряд в консервативном блоке многовато. 2-3-4 неконсервативные подряд в блоке допустимы. [Объяснение. Если консервативны а/к на одной стороне альфа-спирали, то число неконсервативных между ними как раз и будет 3 - 4]
- Блок не может быть расширен добавлением колонок с N- или C-конца, так чтобы он оставался 100% консервативным вертикальным блоком
Биологически консервативный блок это такой блок, в котором предполагается гомологичность а/к стоящих в любой его колонке.
.
Т.е. то, к чему стремятся программы выравнивания, но не всегда достигают, должно выполняться в консервативном блоке, так как на него накладываются дополнительные требования.
.
Важно понять В консервативном блоке бывает много неконсервативных колонок! Часто неконсервативных колонок в консервативном блоке больше чем консервативных. . . Путем перестановки последовательностей в выравнивании можно добиться того, что частичный блок будет выглядеть как прямоугольник в выравнивании. . . . . Случайные совпадения а/к в колонке нельзя считать гомологичностью остатко. - в синей рамке. Другими словами. Минус блок это такой блок, который не содержит консервативных частичных подблоков.