© Kholina Tatiana, 2013 You can contact me at tatiana96-khol@yandex.ru

Построение дерева по нуклеотидным последовательностям

Для семи видов бактерий были выбраны случайные штаммы в базе ncbi. Из файлов с расширением .frn, содержащим последовательности генов нетранслируемых РНК, были скопированы последовательности 16s рРНК. Эти последовательности выровнялись MUSCLE. Получившееся выравнивание: [x]

Это выравнивание было открыто в программе MEGA. Дерево было построено методом Maximum Likelihood. Получившееся дерево представлено на рис.1. Дерево отличается от правильного: BACSU объединен в одну ветвь с STAA1, а не с LISMO, а STRPN объединено в единую ветвь с BACSU, STAA1 и LISMO отдельно от LACAC. Если использовать методы Neighbor-Joining и Minimal Evolution, получается то же самое. Возможно, если брать последовательности рРНК из других штаммов тех же видов, дерево получится более близкое к оригиналу, поскольку, по моим наблюдениям, последовательности рРНК в файлах были все же различны для разных штаммов.

Дерево для бактериальных 16s рРНК, построенное методом Maximum Likelihood

Оригинальное дерево

Построение и анализ дерева, содержащего паралоги

Это дерево строилось по гомологам белка CLPX_BACSU из Bacillus subtilis. Clpx - это АТР-связывающий домен протеазы Clp.

По последовательности белка был проведен BLAST по протеомам моих семи выбранных бактерий. Ограничение на параметр E-value ставилось <0.001. Из выданной таблицы были отобраны в файл-список ID и по ним скачаны последовательности программой seqret. Всего было найдено 35 предполагаемых гомологов.

По этим последовательностям провелось выравнивание MUSCLE и было построено дерево методом Maximum likelihood:

Дерево гомологов ClpX из Bacillus subtilis.

Некоторые последовательности, видимо, неверно проаннотированы, поскольку являются одними и теми же генами, например Q891B9_CLOTE и Q899H3_CLOTE (выделены желтыми прямоугольниками). Паралогами можно назвать гомологи из одного организма, например MecB и ClpB из Clostridium tetani (выделены красным). Ортологами можно назвать гомологи из разных организмов, например ClpX из Bacillus subtilis и Streptococcus pneumoniae (выделены зеленым).

Первая ветвь (зеленая) объединяет гомологи ClpX в наших семи бактериях. Соседняя фиолетовая ветвь содержит протеазы ClpY (HslU), АТР-связывающий домен протеазы HslVU [x]. Соседняя ветвь (розовая) содержит кладу из протеаз FtsH, при этом если верить Merops, FtsH и ClpX находятся не только в разных семьях, но даже в разных кланах: SK и MA. Однако походив по разным ссылкам, можно понять, что ClpX, ClpY и FtsH все относятся к большому семейству протеаз AAA [x]. Ветвь, выделенная голубым, содержит некоторые другие протеазы под именем Clp, которые тоже принадлежат семейству AAA.