Реконструкция деревьев по нуклеотидным последовательностям. Деревья. содержащие паралоги


Построение дерева по нуклеотидным последовательностям

Для работы были найдены характеристики РНК малой субъединицы рибосомы (16S rRNA) каждой из исследуемых бактерий.

Название МнемоникаAC EMBLE Координаты Цепь
1 Bacillus subtilis BACSUAF008220 485-2034 Прямая
2 Clostridium tetani CLOTEAE015927 8715-10223 Прямая
3 Finegoldia magna FINM2AP008971 611796-613319 Прямая
4 Lactobacillus acidophilus LACACCP002559 447399..448973 Прямая
5 Lactococcus lactis LACLMAM406671 511423..512971 Прямая
6 Staphylococcus aureus STAA1AP009324 531922:533476 Прямая
7 Streptococcus pyogenes STRP1AE004092 17170..18504 Прямая

Последовательности РНК малой субъединицы рибосомы (16S rRNA) были получены из соответствующих записей EMBLE с помощью команды seqret пакета EMBOSS. После чего было построено их выравнивание программой MUSCLE. В программе MEGA с помощью метода Max likelihood было реконструировано филогенетическое дерево.



Нетривиальные ветви идеального дерева
{'BACSU', 'STAA1'}vs{'LACLM', 'LACAC', 'STRP1', 'CLOTE', 'FINM2'}
{'LACLM', 'STRP1'}vs{'LACAC', 'BACSU', 'CLOTE', 'STAA1', 'FINM2'}
{'CLOTE', 'FINM2'}vs{'LACLM', 'LACAC', 'BACSU', 'STAA1', 'STRP1'}
{'LACAC', 'LACLM', 'STRP1'}vs{'BACSU', 'CLOTE', 'STAA1', 'FINM2'}
Нетривиальные ветви реконструированного дерева
{'BACSU', 'FINM2', 'STAA1'}vs{'LACLM', 'LACAC', 'CLOTE', 'STRP1'}
{'BACSU', 'STAA1'}vs{'LACLM', 'LACAC', 'STRP1', 'CLOTE', 'FINM2'}
{'LACLM', 'STRP1'}vs{'LACAC', 'BACSU', 'CLOTE', 'STAA1', 'FINM2'}
{'LACAC', 'LACLM', 'STRP1'}vs{'BACSU', 'CLOTE', 'STAA1', 'FINM2'}
Ветви которые есть в идеальном дереве, но отсутствуют в реконструированном
{'CLOTE', 'FINM2'}vs{'LACLM', 'LACAC', 'BACSU', 'STAA1', 'STRP1'}
Ветви которые есть в реконструированном дереве, но отсутствуют в идеальном
{'BACSU', 'FINM2', 'STAA1'}vs{'LACLM', 'LACAC', 'CLOTE', 'STRP1'}


Построение и анализ дерева, содержащего паралоги

Был осуществлен поиск программой blastp гомологов (с порогом E-value 0,001). Из результатов поиска были отобраны по мнемонике видов только те находки, которые относятся к отобранным ранее бактериям. Затем по полученному программой MUSCLE выравниванию было построено дерево в программе MEGA с помощью метода Max likelihood.



Примеры:
 
Паралоги : CLPC_BACSU и CLPX_BACSU; A2RIW9_LACLM и CLPX_LACLM. 
Ортологи :CLPX_BACSU и CLPX_STAA1; BS0E3_FINM2 и Q891B9_CLOTE.