Деревья в обоих заданиях следует строить программой MEGA, любым из методов Neighbor-Joining, Minimum evolution, Maximum likelihood. Указывайте в отчётах, какой метод был использован.
В отчёте приведите:
Вырезать нужный участок из записи EMBL с AC (к примеру) X00000 можно командой
seqret embl:x00000 -sask
Обращайте внимание на то, чтобы правильно ответить на все вопросы программы seqret!
Указание. Два гомологичных белка будем называть ортологами, если они а) из разных организмов; б) разделение их общего предка на линии, ведущие к ним, произошло в результате видообразования. Два гомологичных белка из одного организма будем называть паралогами.
Чтобы найти гомологов в заданных организмах, воспользуйтесь файлом proteo.fasta на диске P, там лежат записи банка UNIPROT, относящиеся к бактериям, перечисленным в таблице к заданию 1. Необходимо провести поиск программой blastp гомологов (с разумным порогом на E-value, скажем, 0,001) и отобрать по мнемонике видов только те находки, которые относятся к отобранным вами бактериям. Другой способ — несколько раз воспользоваться BLAST'ом на сайте NCBI, устанавливая фильтр по организму, а в качестве банка — "nr" (поскольку Swiss-Prot может содержать не все гомологи). Если пользоваться этим способом, то придётся, чтобы не запутаться в том, какие белки из какого организма, придумать систему названий белков и переименовывать их сразу после скачивания.