Учебная страница курса биоинформатики,
год поступления 2016
Анализ крупных перестроек геномов
Минимум для получения зачета практикума - задания 2 и 3; построение двух карт локального сходства одного генома с двумя другими; описание нескольких крупных перестроек, видимых на них
Считайте вопросы из задания 3 ориентиром. Не нужно отвечать на все! Можно полно ответить на один вопрос; можно привести по одному примеру на два-три вопроса. Творческий подход в зависимости от особенностей конкретных геномов, приветствуется
Задания можно выполнять одним из двух методов
- С помощью blst2seq, сравнивая один геном с двумя другими
- С помощью NPG-explorer, построив нуклеотидный пангеном для трех геномов.
Метод b. позволяет боле полно отвечать на вопросы сразу о трех геномах. Поэтому вероятно получение более высоких баллов, если, конечно, вы разобрались в выдаче NPG-explorer.
1. Выберите три генома бактерий или архей одного вида
- Требования
- Берите бактерии или археи, геномы которых представлены одной хромосомой, без плазмид
- Хромосомы должны быть собраны полностью, набор контигов или скэффолдов не годятся
- бактерии или археи должны быть одного вида; как правило, только на этом уровне ортологичность участков геномов можно определить по сходству нуклеотдных последовательностей; но бывают исключения, т.к. таксономия традиционно строится на микробиологических признаках, а не на геномных данных
- плохой выбор геномов, если i) между геномами нет крупных перестроек; (ii) сумма длин детектируемых гомологичных участков невелика, менее 50% от более короткого генома;
Впрочем, выбор геномов за вами; а наше, преподавателей, дело оценивать результат!
2. Вычислите сходство (identity %) на гомологичных участках геномов и покрытие геномов гомологичными участками (процент гомологичных участков от длины геномов)
3. Исследуйте один или несколько типов крупных перестроек
Минимальный ответ - пример
- крупные делеции и вставки
- гены, потерянные при делециях
- участки, имеющиеся в одном геноме и отсуствующие в двух других
- верно ли, что горизонтально перенесены из далеких таксонов?
- какие в них гены
- участки, повторяющиеся в одном геноме
- гены в таких участках
- инверсии
- синтеничные участки
4.* (дополнительное) Приведите пример ошибки аннотации гена
Ошибки аннотации генов белков ищите исходя из гипотезы.
На ортологичных (гомологичных) участках из двух или трех геномов аннотированные пересекающиеся гены расположены на одной и той же цепи ДНК, имеют совпадающие в выравнивании участков стоп-кодоны и инициаторные кодоны - если не было мутаций в стоп-кодонах; в инициаторных кодонах; мутаций, приводящих к появлению стоп-кодона в рамке считывания.
Считайте гены из разных геномов пересекающимися, если в выравивании гомологичных участков они пересекается больше, чем на 60 нуклеотидов (20 аминокислотных остатков)