Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2013

Занятие 4

Отчёт по заданиям должен быть выложен на сайт, со ссылкой со страницы семестра, к утру 13 марта 2015

Деревья в обоих заданиях следует строить программой MEGA, любым из методов Neighbor-Joining, Minimum evolution, Maximum likelihood. Указывайте в отчётах, какой метод был использован.

1. Построение дерева по нуклеотидным последовательностям

Постройте филогенетическое дерево тех же бактерий, что в предыдущих заданиях, используя последовательности РНК малой субъединицы рибосомы (16S rRNA).

В отчёте приведите:

Этапы работы:

2. Построение и анализ дерева, содержащего паралоги

Найдите в своих бактериях достоверные гомологи белка CLPX_BACSU. Постройте дерево этих гомологов. Считая дерево реконструированным верно, укажите несколько пар паралогов и одну-две группы попарно ортологичных белков. Приведите примеры отражённых на дереве эволюционных событий двух типов: 1) дупликация гена; 2) разделение путей эволюции белков в результате видообразования.

Указание. Два гомологичных белка будем называть ортологами, если они: а) из разных организмов; б) разделение их общего предка на линии, ведущие к ним, произошло в результате видообразования. Два гомологичных белка из одного организма будем называть паралогами.

Чтобы найти гомологов в заданных организмах, воспользуйтесь файлами, лежащими в директории P:\y13\term4\Proteomes (они содержат скачанные из Uniprot полные протеомы бактерий, перечисленных в таблице первого практикума). Необходимо провести поиск программой blastp гомологов (с разумным порогом на E-value, скажем, 0,001) по протеомам отобранных вами бактерий. Совет: чтобы не запускать BLAST много раз, разумно создать объединённый файл с протеомами нужных бактерий. Для создания такого файла можно воспользоваться командой вида:

cat file1 >> file2

которая добавляет содержимое файла file1 в конец файла file2.

Другой способ — несколько раз воспользоваться BLAST'ом на сайте NCBI, устанавливая фильтр по организму, а в качестве банка — "nr" (поскольку Swiss-Prot может содержать не все гомологи). Если пользоваться этим способом, то придётся, чтобы не запутаться в том, какие белки из какого организма, придумать систему названий белков и переименовывать их сразу после скачивания.