Постороение дерева по нуклеотидным последовательностям

В данном задании были получены координаты генов 16S рРНК в геномах изучаемых бактерий. Полученные результаты были приведены в таблице ниже.

НазваниеМнемоникаAC записи EMBLКоординаты РНКЦепь
Bacillus subtilis BACSUAL00912630279..31832Прямая
Clostridium tetaniCLOTEAE015927176113..177621Прямая
Enterococcus faecalisENTFAAE016830 1018187..1019708Прямая
Geobacillus kaustophilus GEOKABA00004330790..32343Прямая
Lactobacillus delbrueckiiLACDACR95425345160..46720Прямая
Listeria monocytogenes LISMOAL59198096266..97811Обратная
Staphylococcus epidermidisSTAESAE0159291598006..1599559Обратная

Создадим общий fasta-файл с последовательностями, в котором отредактируем название последовательностей оставив только мнемонику.

При помощи програмы Mega построим дерево методом Maximum Likelihood.

Ниже представлено правильное дерево

На дереве, построенном по нуклеотидным последовательностям появились такие ветви как:

  • {ENTFA, LACDA, LISMO} vs {BACSU, STAES, GEOKA, CLOTE}
  • {ENTFA, LACDA, LISMO, BACSU, STAES,} vs { GEOKA, CLOTE}
  • { BACSU, STAES} vs { ENTFA, LACDA, LISMO, GEOKA, CLOTE}
  • А на правильном дереве в отличии от построенного присутствуют такие ветви как:

  • {CLOTE, LACDA, ENTFA} против {BACSU, GEOKA, LISMO, STAES}
  • {BACSU, GEOKA} против {CLOTE, LACDA, ENTFA,LISMO, STAES}
  • {CLOTE, LACDA, ENTFA} против {BACSU, GEOKA, LISMO, STAES}
  • Как видно из изображений, представленных выше, деревья достаточно сильно различаются. В одном из предыдущих практикумов мы строили деревья по аминокислотным последовательностям 5 различными способами, и сравнив эти построения мы можем сказать, что дерево построенное по аминокислотным последовательностям является более точным. С одной стороны это могло произойти потому, что аминокислот у нас 20, а нуклеотидов всего 4. Но это компенсирутся тем, что длина нуклеотидной последовательности больше, чем аминокислотной. Поэтому причина различий не совсем ясна.

    Постороение и анализ дерева, содержащего паралоги

    В выбранных мною бактериях я нашла гомологи белка CLPX_BACSU. Для нахождения гомологов воспользовалась файлом proteo.fasta, который находится на диске Р. При помощи программы blastp был произведен поиск и отбор последовательностей по мнемонике, которые относятся к моим бактериям.

    Далее был получен файл, содержащий находки, относящиеся к моим бактериям. Данный файл был импортирован в Mega и выровнен. Далее было постороено дерево представленное на рисунке ниже.

    Если белки находятся в разных организмах и разделение их общего предка на линии, ведущие к ним, произошло в результате видообразования, то такие белки называются ортологами. А два гомологичных белка, находящиеся в одном организме, будут называться паралогами.

    Ортологи: CLPX BACSU и CLPX GEOKA, HSLU ENTFA и HSLU LACDA

    Паралоги: Q8YAB6 LISMO и Q8Y8B1 LISMO, CLPC BACSU и CLPE BACSU