Элементарные эволюционные события

 
     

 


Задание. Оценить давление отбора на ген заданного белка (работа с веб-сервером PAL2NAL)

Биологическая задача состояла в том, чтобы оценить давление отбора на ген заданного белка в период, начиная с момента расхождения
кишечной палочки и синегнойной палочки.
  • Подготовка данных

  • Последовательность белка HSLU_ECOLI из кишечной палочки;
    Последовательность его гена;
    Последовательность гомолога этого белка - HSLU_PSEA7 - из синегнойной палочки;
    Последовательность его гена;

    При помощи программы blastp был найден гомолог данного белка HSLU_ECOLI в организме синегнойной палочки (Pseudomonas aeruginosa). Ниже приведено соответствующее выравнивание.
    Как видно, последовательности совпадают на 72%, а также имеют похожие аннотации в UniProt (описание белка из кишечной палочки - ATP-dependent hsl protease ATP-binding subunit hslU (Heat shock protein hslU)). Эти данные позволяют сделать вывод, что последовательности в первом приближении являются ортологами.
    >ref|YP_001351110.1|  heat shock protein HslVU, ATPase subunit HslU [Pseudomonas aeruginosa 
    PA7]
     sp|A6VDH5.1|HSLU_PSEA7  ATP-dependent hsl protease ATP-binding subunit hslU
     gb|ABR81627.1|  heat shock protein HslVU, ATPase subunit HslU [Pseudomonas aeruginosa 
    PA7]
    Length=447
    
     GENE ID: 5353816 hslU | heat shock protein HslVU, ATPase subunit HslU
    [Pseudomonas aeruginosa PA7]
    
     Score =  637 bits (1642),  Expect = 0.0, Method: Compositional matrix adjust.
     Identities = 321/445 (72%), Positives = 379/445 (85%), Gaps = 5/445 (1%)
    
    Query  4    MTPREIVSELDKHIIGQDNAKRSVAIALRNRWRRMQLNEELRHEVTPKNILMIGPTGVGK  63
                MTPREIV EL++HIIGQD+AKR+VAIALRNRWRRMQL  ELR EVTPKNILMIGPTGVGK
    Sbjct  3    MTPREIVHELNRHIIGQDDAKRAVAIALRNRWRRMQLPAELRAEVTPKNILMIGPTGVGK  62
    
    Query  64   TEIARRLAKLANAPFIKVEATKFTEVGYVGKEVDSIIRDLTDAAVKMVRVQAIEKNRYRA  123
                TEIARRLA+LANAPFIKVEATKFTEVGYVG++V+SIIRDL DAAVKM+R Q I+K +YRA
    Sbjct  63   TEIARRLARLANAPFIKVEATKFTEVGYVGRDVESIIRDLADAAVKMLREQEIQKVKYRA  122
    
    Query  124  EELAEERILDVLIPPAKNNWG-QTEQQQEPSAARQAFRKKLREGQLDDKEIEIDLAAAPM  182
                E+ AEERILD L+P A+   G   E  +E S  RQ FRK+LREGQLDDKEI+I++A  P 
    Sbjct  123  EDAAEERILDALLPAARPAMGFGDEPAREDSNTRQLFRKRLREGQLDDKEIDIEVADNPA  182
    
    Query  183  GVEIMAPPGMEEMTSQLQSMFQNLGGQKQKARKLKIKDAMKLLIEEEAAKLVNPEELKQD  242
                GVEIMAPPGMEEMT+QLQ++F  +   K+K RKLK+ DA+K++ +EEAA+LVN EELK  
    Sbjct  183  GVEIMAPPGMEEMTNQLQNLFSGMSKGKKKTRKLKVADALKMIRDEEAARLVNEEELKAR  242
    
    Query  243  AIDAVEQHGIVFIDEIDKICKRGESSGPDVSREGVQRDLLPLVEGCTVSTKHGMVKTDHI  302
                A++AVEQHGIVFIDEIDKI KR  + G DVSREGVQRDLLPL+EGCTV+TK GMVKTDHI
    Sbjct  243  ALEAVEQHGIVFIDEIDKIAKRANAGGADVSREGVQRDLLPLIEGCTVNTKLGMVKTDHI  302
    
    Query  303  LFIASGAFQIAKPSDLIPELQGRLPIRVELQALTTSDFERILTEPNASITVQYKALMATE  362
                LFIASGAF ++KPSDL+PELQGRLPIRVEL+AL+ +DFERILTEP+AS+T QY+ L+ TE
    Sbjct  303  LFIASGAFHLSKPSDLVPELQGRLPIRVELKALSPNDFERILTEPHASLTEQYRELLKTE  362
    
    Query  363  GVNIEFTDSGIKRIAEAAWQVNESTENIGARRLHTVLERLMEEISYDASDLSGQN----I  418
                G+ IEF + GIKR+AE AWQVNE TENIGARRLHT+LERL+EE+S+ A+DL+ ++    I
    Sbjct  363  GLGIEFAEDGIKRLAEIAWQVNEKTENIGARRLHTLLERLLEEVSFSAADLASEHSDKPI  422
    
    Query  419  TIDADYVSKHLDALVADEDLSRFIL  443
                 IDA YV+ HL  L  DEDLSR+IL
    Sbjct  423  RIDAGYVNSHLGELAEDEDLSRYIL  447
    
    
  • Построение выравниваний

    С помощью программы needle с параметрами по умолчанию были построены попарные белковое и нуклеотидное выравнивания.
    Выравнивание белков
    Нуклеотидное выравнивание
    Нуклеотидное выравнивание не соответствует белковому. Возможно, нуклеотидное выравнивание хуже из-за малого значения штрафа за появление гэпов. При изменении gap penalty от 10 до 20, выравнивание незначительно улучшается. При дальнейшем повышении штрафа за гэпы выравнивание не меняется.

  • PAL2NAL

    PAL2NAL - это программа, которая конвертирует множественное выравнивание последовательностей белков и соответствующие им последовательности ДНК (или мРНК) в выравнивание кодонов. Программа автоматически определяет соответствующую последовательность кодонов, даже если последовательность ДНК (или мРНК) не полностью совпадает с белковой или содержит нетранслируемые участки и полиаденилированные концы. Она также учитывает возможность сдвига рамки считывания в исходном выравнивании, поэтому эта программа подходит для анализа псевдогенов. Результирующее триплетное выравнивание предназначено для оценки частот и типов нуклеотидных замен. Если выравниваются две последовательности, PAL2NAL автоматически считает значения Ks и Ka.

  • Построение нуклеотидного выравнивания с разбивкой на кодоны

    Программа PAL2NAL построила нуклеотидное выравнивание с разбивкой на кодоны. Выравнивания, построенные программой needle и PAL2NAL существенно различаются. Программа PAL2NAL построила лучшее выравнивание с очень малым числом гэпов, что свидетельствует о высоком сходстве двух последовательностей, кроме того, это выравнивание основывается на аминокислотном, что дает основание больше ему доверять. Выравнивание, построенное программой needle, по какой-то причине показывает не очень большой процент сходств, хотя аминокислотное выравнивание, построенное этой же программой показывает более высокий процент. Это также свидетельствует о том, что программа PAL2NAL строит более достоверное выравнивание.

  • С помощью PAL2NAL получены значения Ka/Ks для сравниваемых генов

    Выравнивание и значения в формате fasta.
    Для рассчета значений Ka/Ks в меню "Option settings" необходимо выбрать пункты "Remove gaps, inframe stop codons" и "Calculate KS and KA".
     KS = 66.6603 
     KA = 0.1874 
     KA/KS = 0.0028 
    
    Значение Ka/Ks значительно меньше 1. Это свидетельствует о том, что в период, начиная с момента расхождения синегнойной и кишечной палочек, на ген белка кишечной палочки действовал стабилизирующий отбор.
    | на главную
    | назад


© Smirnova Alexandra