Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2019

Задание 4

Отчёт по этому заданию выкладывается на сайт со ссылкой со страницы семестра. Срок без потери баллов — утро 12 марта 2021. Срок со штрафом 0,5 балла — 19 марта 2021.

1. Составление списка гомологичных белков, включающих паралоги

Найдите в своих бактериях достоверные гомологи белка CLPX_ECOLI.

Чтобы найти гомологов в заданных организмах, воспользуйтесь файлами, лежащими на kodomo в директории /P/y19/term4/Proteomes (они содержат скачанные из Uniprot полные протеомы бактерий, перечисленных в таблице первого практикума). Необходимо провести поиск программой blastp гомологов (с разумным порогом на E-value, скажем, 0,001) по протеомам отобранных вами бактерий.

Приведите в отчёте список находок из выдачи BLAST (без заголовка выдачи и выравниваний).

2. Реконструкция и визуализация

(a) Реконструируйте дерево найденных гомологов (в отчёте обязательно укажите программу и метод реконструкции). Приведите дерево в Newick-формате.

(b) Считая дерево реконструированным верно, укажите три пары паралогов и три пары ортологов.

Указание. Два гомологичных белка будем называть ортологами, если они: а) из разных организмов; б) разделение их общего предка на линии, ведущие к ним, произошло в результате видообразования. Два гомологичных белка из одного организма будем называть паралогами.

(c) Создайте несколько изображений дерева. На первом изображении разные ортологичные группы (то есть наборы попарно ортологичных белков) должны быть покрашены в разные цвета (группы, содержащие три и менее последовательностей, можно оставить чёрными, а остальные должны быть других и разных цветов). На втором изображении все ортологичные группы, содержащие более трёх последовательностей, должны быть "схлопнуты" и надписаны. В подписи ко второму изображению для каждой такой группы должно быть описание её состава (какие белки, изо всех ли бактерий, соответствует ли реконструированная филогения белков филогении бактерий).

Будет оцениваться прежде всего ясность и информативность изображений и подписей. Но эстетическая сторона тоже будет учитываться.