Элементарные эволюционные события


Задание 1. Оценка давления отбора на ген заданного белка (работа с веб-сервером PAL2NAL)


Биологическая задача состоит в том, чтобы оценить давление отбора на ген заданного белка в период, начиная с момента расхождения кишечной палочки и холерного вибриона.

Подготовка данных
Последовательности моего белка TKT1_ECOLI Последовательность его гена tktA

С помощью программы blastp пакета BLAST был найден ортолог A2PAD5_VIBCH из указанного организма холерного вибриона. В подтверждение тому, что выбранный белок действительно является ортологом послужили:
  • ID 79%
  • Белки имееют похожие аннотации в Uniprot: связывание пирофосфата тиамина.
Последовательность белка A2PAD5_VIBCH Последовательность его гена tktA-1.

Построение выравниваний
С помощью программы needle были построены белковое и нуклеотидное выравнивания.
ID белкового выравнивания 75.6%, нуклеотидного - 71.8% (Gap_penalty: 10.0 - параметры по умолчанию). В случае нуклеотидного выравнивания количество гепов практически в 2 раза больше по сравнению с белковым.
Поэтому, для того, чтобы максимально убрать все гепы, необходимо увеличить штрафы. При увеличении параметра Gap_penalty до 25.0 и параметра Extend_penalty до 10.0 было получено новое нуклеотидное выравнивание, в котором ID составил 71.3%, а количество гепов упало до 4.6% по сравнению с 9.4% (при построении выравнивания с параметром Gap_penalty 10.0).

Построение нуклеотидного выравнивания с разбивкой на кодоны
PAL2NAL - программа, преобразующая множественное выравнивание последовательностей белков и соответствующих ДНК (или мРНК) в кодоновое выравнивание. Программа автоматически выдаёт правильное выравнивание с разбивкой на кодоны даже если поданный ей на вход фрагмент последовательности ДНК плохо соответствует данной белковой последовательности, содержит UTRs (нетранслируемые области) и полиадениновые хвосты. Таким образом, с помощью данной программы можно также анализировать последовательности псевдогенов. По полученому выравниванию программа может посчитать число синонимичных (Кs) и несинонимичных (Ka) замен на 1 сайт.
В результате было построено выравнивание с разбивкой на кодоны двух исследуемых генов из организмов кишечной палочки и холерного вибриона. Если сравнить выравнивания, построенные программами PAL2NAL и needle, то можно заметить, что во-первых, первая программа требует больше исходных данных: выравнивание белковых последовательностей и соответствующие последовательности генов, а не просто последовательности белков или генов как needle, которая строит соответственно либо белковое, либо нуклеотидное выравнивания. Во-вторых, получаемое с помощью PAL2NAL выравнивание с разбивкой на кодоны дает более ясную и полную информацию, так что можно более детально отследить возникшие замены, определить, какая из них была синонимичной, а какая несинонимичной.
Разницы в полученных варавниваниях не оказалось, поскольку и белковое, и нуклеотидное (после повышения штрафов) выравнивания содержали меньшее количество гепов. Для того, чтобы программа посчитала Ka/Ks, в меню "Option settings" пришлось выбрать в пункте "Remove gaps, inframe stop codons": "Yes".
На основе полученных данных:
  • KS = 1.3507
  • KA = 0.1470
  • KA/KS = 0.1088
можно сделать вывод, что давление отбора на ген tktA заданного белка TKT1_ECOLI в период, начиная с момента расхождения кишечной палочки и холерного вибриона было отрицательным, поскольку KA/KS<1. Таким образом, в данном случае осуществлялся вполне существенный стабилизирующий отбор.
Вернуться на страничку четвертого семестра

© Головкина Мария Сергеевна