Вернуться на страницу семестров

Реконструкция деревьев по нуклеотидным последовательностям. Деревья, содержащие паралоги.


     Задание 1. Построение дерева по нуклеотидным последовательностям.

Необходимо построить филогенетическое дерево тех же бактерий, что в предыдущих заданиях, используя последовательности РНК малой субъединицы рибосомы (16S rRNA). Для этого:
1) командой secret sw:'AC бактерии по SwissProt' cкачал все 7 файлов бактерий
2) в них посмотрел AC банка EMBL, далее получил 7 файлов с помощью команды entret embl:'AC бактерии по EMBL'
3) далее в каждой записи искал поля FT, где указаны координаты, а в поле /note написана информация (в данном случае 16s рРНК)

Название бактерии Мнемоника AC с EMBL Координаты Цепь
Clostridium botulinum CLOB1 CP000726 9282..10783 +
Clostridium tetani CLOTE AE015927 176113..177621 +
Lactobacillus acidophilus LACAC CP000033 59255..60826 +
Streptococcus pneumoniae STRPN* -> STRP4 AE005672* -> CP001015 15360..16817 +
Streptococcus pyogenes STRP1 AE004092 23171..24505 +
Bacillus anthracis BACAN AE016879 9335..10841 +
Bacillus subtilis BACSU AL009126 90536..92089 +

* - так вышло, что в записи EMBL, описывающей полный геном одной из бактерий, рРНК не аннотированы, этой бактерией стала Streptococcus pneumoniae, поскольку, вариант исключить её и делать все праки по новой без неё меня не вдохновил, был получен полный геном данной бактерии и 16S РНК какой-либо близкородственной бактерии, которой оказалась Streptococcus pneumoniae G54(STRP4). Получилось прекрасное дерево, построенное методом "Maximum Likelihood" предоставленное ниже:

Ссылка на выравнивание, полученное Muscle

Наконец, после всех неудач с деревьями, построенными по белкам, получилось дерево максимально совпадающее с правильным. В нем класс Clostridia отделен от класса Bacilli, а класс Bacilli, в свою очередь, разделен на 2 порядка: Lactobacillales и Bacillales.


     Задание 2. Построение и анализ дерева, содержащего паралоги.

Необходимо было найти в своих бактериях достоверные гомологи белка CLPX_BACSU. Построить дерево этих гомологов. Указать несколько пар ортологов и несколько пар паралогов. Привести примеры отраженных на дереве эволюционных событий двух типов: 1) дупликация гена; 2) разделение путей эволюции белков в результате видообразования.

По-полному образу практикума прошлого семестра - ForeverAlone Blast, в котором нужно было найти тРНК в гомологичных организмах, нашел гомологов, единственное отличие, что в прошлом семестре был blastn, сейчас же воспользовался blastp, ниже изображение, которое возможно поможет кому-нибудь

Ссылка на файл, полученный командой выше

Получил полный список гомологов, механически выбрал гомологи выбранных мною организмов. Ниже предоставлено дерево, полученное методом "Maximum Likelihood"

Обсуждение:
1. Два гомологичных белка называют ортологами, если они:
   а) из разных организмов;
   б) разделение их общего предка на линии, ведущие к ним, произошло в результате видообразования.
Например ортологами являются cледующие парочки: CLPX_BACSU and CLPX_BACAN; СLPX_CLOTE and CLPX_CLOB1; HSLU_LACAC and HSLU_BACAN

2. Два гомологичных белка из одного организма - паралоги. Паралогами являются, например: J7M389_STRP1 and J7MBF8_STRP1; A7FZ97_CLOB1 and A7FYT8_CLOB1; Q891B9_CLOTE and Q899H3_CLOTE.