Другой способ — воспользоваться сервисом Silva. Вам нужна "SSU Database" (Small subunit, то есть малая субъединица); на запрос по имени организма выдаётся, как правило много находок (поскольку рРНК секвенировались многими группами), можно взять, например, наибольшую по длине. Разобраться, как добыть последовательность из этой базы данных, может оказаться непросто!
Указание. Два гомологичных белка будем называть ортологами, если они а) из разных организмов; б) разделение их общего предка на линии, ведущие к ним, произошло в результате видообразования. Два гомологичных белка из одного организма будем называть паралогами.
Чтобы найти гомологов в заданных организмах, воспользуйтесь файлом proteo.fasta на диске P, там лежат записи банка UniProt, относящиеся к протеобактериям, перечисленным в таблице к заданию 1. Необходимо провести поиск программой BLASTP гомологов (с разумным порогом на E-value, скажем, 0,0001) и отобрать по мнемонике видов только те находки, которые относятся к отобранным вами бактериям. Другой способ — несколько раз воспользоваться BLAST'ом на сайте NCBI, устанавливая фильтры по организму, а в качестве банка — "nr" (поскольку Swiss-Prot может содержать не все гомологи). Если пользоваться этим способом, то придётся, чтобы не запутаться в том, какие белки из какого организма, придумать систему названий белков и переименовывать их сразу после скачивания.