Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2018

Задание 4

Отчёт по этому заданию выкладывается на сайт со ссылкой со страницы семестра. Срок без потери баллов — утро 6 марта 2019. Срок со штрафом 0,5 балла — 13 марта 2020.

1. Составление списка гомологичных белков, включающих паралоги

Найдите в своих бактериях достоверные гомологи белка CLPX_ECOLI.

Чтобы найти гомологов в заданных организмах, воспользуйтесь файлами, лежащими на kodomo в директории /P/y18/term4/Proteomes (они содержат скачанные из Uniprot полные протеомы бактерий, перечисленных в таблице первого практикума). Необходимо провести поиск программой blastp гомологов (с разумным порогом на E-value, скажем, 0,001) по протеомам отобранных вами бактерий.

Замечание. По техническим причинам при скачивании полных протеомов некоторые организмы первоначального списка были заменены на близких родственников. Если среди отобранных вами при выполнении первого задания бактерий есть перечисленные в следующей таблице, используйте протеом с названием, указанным в третьей колонке этой таблицы.

Бактерия

Старая мнемоника

Новая мнемоника

Clostridium botulinum

CLOBA

CLOBH

Lactococcus lactis

LACLM

LACLA

Staphylococcus aureus

STAAR

STAA8

Staphylococcus epidermidis

STAES

STAEQ

Streptococcus pyogenes

STRP1

STREQ

Приведите в отчёте список находок из выдачи BLAST (без заголовка выдачи и выравниваний).

2. Реконструкция и визуализация

(a) Реконструируйте дерево найденных гомологов (в отчёте обязательно укажите программу и метод реконструкции). Приведите дерево в Newick-формате.

(b) Считая дерево реконструированным верно, укажите три пары паралогов и три пары ортологов.

Указание. Два гомологичных белка будем называть ортологами, если они: а) из разных организмов; б) разделение их общего предка на линии, ведущие к ним, произошло в результате видообразования. Два гомологичных белка из одного организма будем называть паралогами.

(c) Создайте несколько изображений дерева. На первом изображении разные ортологичные группы (то есть наборы попарно ортологичных белков) должны быть покрашены в разные цвета (группы, содержащие три и менее последовательностей, можно оставить чёрными, а остальные должны быть других и разных цветов). На втором изображении все ортологичные группы, содержащие более трёх последовательностей, должны быть "схлопнуты" и надписаны. В подписи ко второму изображению для каждой такой группы должно быть описание её состава (какие белки, изо всех ли бактерий, соответствует ли реконструированная филогения белков филогении бактерий).