Вырезать нужный участок из записи EMBL можно командой seqret -sask.
Не забудьте "обратить" (т.е. взять комплементарную) последовательность,
если рРНК в записи находится на обратной цепи!
Вставьте в отчёт изображение полученного дерева и проанализируйте это дерево
(совпадает ли с правильным?
Что можно сказать о качестве реконструкции по сравнению с деревьями,
построенным по белкам?)
Указание. Два гомологичных белка будем называть ортологами, если они а) из разных организмов; б) разделение их общего предка на линии, ведущие к ним, произошло в результате видообразования. Два гомологичных белка из одного организма будем называть паралогами.
Чтобы найти гомологов в заданных организмах, воспользуйтесь файлом proteo.fasta на диске P, там лежат записи банка UNIPROT, относящиеся к бактериям, перечисленным в таблице к заданию 1. Необходимо провести поиск программой BLASTP гомологов (с разумным порогом на E-value, скажем, 0,001) и отобрать по мнемонике видов только те находки, которые относятся к отобранным вами бактериям. Другой способ — несколько раз воспользоваться BLAST'ом на сайте NCBI, устанавливая фильтр по организму, а в качестве банка — "nr" (поскольку Swiss-Prot может содержать не все гомологи). Если пользоваться этим способом, то придётся, чтобы не запутаться в том, какие белки из какого организма, придумать систему названий белков и переименовывать их сразу после скачивания.