Задание 1. Оценка давления отбора на ген белка DHAS_ECOLI
Для выполнения задания был использован белок DHAS_ECOLI (аминокислотная и нуклеотидная последовательности) #2 С помощью программы needle были выполнены выравнивания белковых и нуклеотидных последовательностей. Белковое выравнивание далось «малой кровью» со стандартными параметрами. С нуклеотидным выравниванием было сложнее, поскольку при стандартных параметрах (Gap penalty: 10.0 Extend penalty: 0.5) в выравнивании было большое количество гэпов, к тому же с длиной не кратной трем, т.е. рамка считывания "скакала". Постепенное повышение штрафа за открытие гэпа количество гэпов в начале и середине было приведено к минимуму с целью большего соответствия белковому выравниванию, поскольку в нем они в начале и середине отсутствуют (кроме одного, о котором ниже). Это привело к подбору наиболее, на мой взгляд, оптимальных параметров: Gap penalty: 30.0 Extend penalty: 1.0. Правда, имеется локальный сдвиг рамки считывания в районе 770 нуклеотида. При этом отсутствуют какие-либо проявления этого сдвига (гэпы) )в белковом выравнивании. Это единственное серьезное различие между белковым и нуклеотидным выравниваниями. #3 PAL2NAL PAL2NAL – это программа, которая конвертирует множественные белковые выравнивания и соответствующую последовательность ДНК (или мРНК) в выравнивание кодонов. Программа автоматически приписывает соответствующий кодон последовательности, даже в том случае, когда последовательность ДНК имеет несовпадения с белковой последовательностью, содержит UTR или polyA хвосты. Она может даже справиться с сдвигами рамки во входном выравнивании, что походит для анализа псевдогенов. Выходное выравнивание кодонов может быть использовано для подсчета синонимичных и несинонимичных замен. (Дословный перевод описания с сайта программы)
Красным выделены различия. Они подтверждают предположение что needle выровнял последовательности не точно.
Для подсчета Ka и Ks необходимо поставить флажки у пунктов: Calculate KS and KA: Yes и Remove gaps, inframe stop codons Программа PAL2NAL показала себя как удобный инструмент для сравнения нуклеотидных и белковых выравниваний: она сильно облегчает сравнение нуклеотидных и белковых выравниваний. И еще она делает "грязную работу" по подсчету Ka и Ks. #4 Оценка давления эволюционного отбора на обонятельные рецепторы человека Для выполнения задания был проведен поиск по базам данных UniProtKB и Swiss-Prot по ключевым словам "olfactory receptors" и "human". Из находок была выбрана запись O51E2_HUMAN — olfactory receptor 51E2 (prostate specific G-protein coupled receptor). Далее было решено найти программой BLASTP ортологов в шимпанзе (Pan troglodytes). |