Задание 1. Оценка давления отбора на ген белка DHAS_ECOLI

    #1

    Для выполнения задания был использован белок DHAS_ECOLI (аминокислотная и нуклеотидная последовательности)
    Программой BLASTP был найден вероятный ортолог — Q9KQG2_VIBCH. Предположение о ортологичности вынесено на основании сочетания самого высокого в выдаче BLASTP процента совпадений (66%) и полного совпадения описания с описанием DHAS_ECOLI. (аминокислотная и нуклеотидная последовательности Q9KQG2_VIBCH).

    #2

    С помощью программы needle были выполнены выравнивания белковых и нуклеотидных последовательностей. Белковое выравнивание далось «малой кровью» со стандартными параметрами. С нуклеотидным выравниванием было сложнее, поскольку при стандартных параметрах (Gap penalty: 10.0 Extend penalty: 0.5) в выравнивании было большое количество гэпов, к тому же с длиной не кратной трем, т.е. рамка считывания "скакала". Постепенное повышение штрафа за открытие гэпа количество гэпов в начале и середине было приведено к минимуму с целью большего соответствия белковому выравниванию, поскольку в нем они в начале и середине отсутствуют (кроме одного, о котором ниже). Это привело к подбору наиболее, на мой взгляд, оптимальных параметров: Gap penalty: 30.0 Extend penalty: 1.0. Правда, имеется локальный сдвиг рамки считывания в районе 770 нуклеотида. При этом отсутствуют какие-либо проявления этого сдвига (гэпы) )в белковом выравнивании. Это единственное серьезное различие между белковым и нуклеотидным выравниваниями.

    #3 PAL2NAL

    PAL2NAL – это программа, которая конвертирует множественные белковые выравнивания и соответствующую последовательность ДНК (или мРНК) в выравнивание кодонов. Программа автоматически приписывает соответствующий кодон последовательности, даже в том случае, когда последовательность ДНК имеет несовпадения с белковой последовательностью, содержит UTR или polyA хвосты. Она может даже справиться с сдвигами рамки во входном выравнивании, что походит для анализа псевдогенов. Выходное выравнивание кодонов может быть использовано для подсчета синонимичных и несинонимичных замен.

    Программа PAL2NAL позволяет провести сравнение нуклеотидного и белкового выравнивания:

    PAL2NAL E E W K G Q A E T N K I L N - T S S V I DHAS_ECOLI gaa gag tgg aaa ggg cag gcg gaa acc aac aag atc ctc aac --- aca tct tcc gta att E E W K A G V E A N K I L G L Q D S P V Q9KQG2_VIBCH gaa gag tgg aaa gcg ggt gta gaa gcc aac aaa att ctg ggt ttg caa gat tct cca gta Needle V00262 751 aagatcct------ caacacatcttccgtaattccggtagatggtttat 793 ||.||.|| |||.| |||...|.|.|||.|.||||||...| AAF95184 748 aaaattctgggtttgcaaga--- ttctccagtaccgattgatggtacgt 793

    Красным выделены различия. Они подтверждают предположение что needle выровнял последовательности не точно.

    Полное выравнивание PAL2NAL.

    Для подсчета Ka и Ks необходимо поставить флажки у пунктов: Calculate KS and KA: Yes и Remove gaps, inframe stop codons
    Для моего выравнивания были получены следующие значения констант:
    KS = 3.6920
    KA = 0.2870
    KA/KS = 0.0777
    Отбор отрицательный (стабилизирующий).

    Программа PAL2NAL показала себя как удобный инструмент для сравнения нуклеотидных и белковых выравниваний: она сильно облегчает сравнение нуклеотидных и белковых выравниваний. И еще она делает "грязную работу" по подсчету Ka и Ks.

    #4 Оценка давления эволюционного отбора на обонятельные рецепторы человека

    Для выполнения задания был проведен поиск по базам данных UniProtKB и Swiss-Prot по ключевым словам "olfactory receptors" и "human". Из находок была выбрана запись O51E2_HUMAN — olfactory receptor 51E2 (prostate specific G-protein coupled receptor). Далее было решено найти программой BLASTP ортологов в шимпанзе (Pan troglodytes).
    В выдаче BLASTP подавляющее число находок имели описание данное на основе сравнения с белками человека:
    первые 2ве записи имели 99% соответствие белку O51E2_HUMAN (различие по одной позиции), это говорит о том что этот белок практически не изменился с ходом эволюции, то есть отбор сильный стабилизирующий.
    Для дополнительного анализа был выбран белок AC: AF546234 из той же выборки BLASTP. Критерием было отсутствие в описании слова predicted. В описании есть заметка:

    7 transmembrane receptor (rhodopsin family). This family contains, amongst other G-protein-coupled receptors (GCPRs), members of the opsin family, which have been considered to be typical members of the rhodopsin superfamily; pfam00001.

    Тоесть этот белок в первом приближении можно считать ортологом. (Совпадений 45%, выравнивание).
    Выравнивание needle, стандартные параметры.
    Нуклеотидные последовательности: O51E2_HUMAN и AF546234.

    Для подсчета Ka/Ks использовался PAL2NAL:

    Ks = 30.3847
    Ka = 0.4275
    Ka/Ks = 0.0141 (<<1)

    В итоге оба белка подтверждают гипотезу о стабилизирующим отборе.