Занятие 1. Элементарные эволюционные события
Задание 1. Оценить давление отбора на ген заданного белка (работа с веб-сервером PAL2NAL)
Биологическая задача состоит в том, чтобы оценить давление отбора на ген заданного белка в период, начиная с момента расхождения
кишечной палочки и холерного вибриона.
- Подготовка данных
Для исследования была взята последовательность белка RIR1_Ecoli (P00452.2), а также его гена.
С использованием возможностей blast был найден ортолог RIR1_Ecoli с ID около 80% в холерном вибрионе.
В первом приближении будем считать ортологами последовательности, совпадающие на 60-80% и имеющие похожую аннотацию в UniProt.
Как видно из описания последовательности NP_230901.1 этот белок также является
рибонуклеотид-дифосфат редуктазой, как и P00452.2, то есть подходит для нашего исследования. Последовательность гена NP_230901.1
лежит здесь.
- Построение выравниваний
C помощью программы needle были построены попарные белковое и нуклеотидное выравнивания найденных последовательностей.
При этом нуклеотидное выравнивание не соответствует белковому: в нуклеотидном имеются гэпы, чего не наблюдается в белковом.
Для уменьшения их числа при построении нуклеотидного выравнивания были изменены параметры needle: штраф за
появление делеции - 17 (против 10 по умолчанию), за удлинение ее на один нуклеотид - 1 (против 0.5 по умолчанию).
Таким образом количество гэпов резко уменьшилось до 4-х штук, причем сдвиг рамки считывания происходит только в двух из них, да и то с последующим
её возвратом через несколько нуклеотидов.
- Знакомство с PAL2NAL.
PAL2NAL - это программа, которая переводит множественное выравнивание белковых последовательностей и соответствующих им
нуклеотидных последовательностей в нуклеотидное выравнивание с разбивкой на кодоны. При этом программа даст результат даже если в
последовательности НК имеются несоответствия с пептидной последовательностью, polyA участки, сдвиги рамки считывания.
Также PAL2NAL может рассчитывать Ka и Ks.
- Построение нуклеотидного выравнивания с разбивкой на кодоны.
С помощью PAL2NAL было получено выравнивание сравниваемых генов с разбивкой на кодоны.
Основное его отличие, помимо указания для каждого кодона кодируемой аминокислоты, - отсутствие гэпов.
- Получение значения Ka/Ks для данных генов
Ознакомится со страницей результатов можно тут.
В меню "Option settings" пришлось выбрать опцию "Remove gaps, inframe stop codons" - убрать гэпы и стоп-кодоны,
а затем выбрать "Yes" для опции
"Calculate KS and KA", чтобы программа посчитала Ka/Ks.
Было получено значение Ka/Ks = 0.0607.
- На основе полученных данных, можно сделать вывод, о том что в данном случае имеет место стабилизирующий отбор, по
данным двум генам.
Оценка давления отбора на гены обонятельных рецепторов человека
Полученная инфорамиция: есть данные, что обонятельные рецепторы (olfactory receptors) человека находятся под давлением положительного отбора.
Задача - проверить на конкретном примере.
Для решения поставленной задачи было решено действовать по схеме, предложенной в первом задании.
С помощью сервера ExPASy был найден человеческий белок OR1J2_HUMAN, описанный как Olfactory receptor 1J2.
Затем с помощью сервера BLAST, а именно с помощью программы blastp, был найден предполагаемый ортолог
найденного белка в протеоме шимпанзе - OR1E5_PANTR, описанный как Olfactory receptor 1E5. Ортологами считаем белки, совпадающие на 60-80 % и
имеющие схожую аннотацию Uniprot. Гены выбранных белков были найдены также с помощью сервера ExPASy.
Было построено соответствующие белковое выравнивание данных последовательностей с помощью прогаммы needle(в форматах msf и fasta).
Дальнейшая работа проводилась на сервере PAL2NAL: было построено выравнивание последовательностей с разбивкой на кодоны, а также
с подсчетом Ka и Ks.
Как видно, данные о том, что обонятельные рецепторы человека находятся под давлением положительного отбора не подтвердились.
Более того, исходя из полученного значения Ka/Ks = 0.1 можно сделать вывод о стабилизируещем отборе по данным двум генам.
Вернуться к списку протоколов.
©:Сорокин Максим