Множественное выравнивание последовательностей

на главную
  • Ознакомление с программой Muscle

    Получим выравнивание вирусных белков, называемых "дельта-антигенами", посредством программы muscle:

    1)Получила файл с последовательностями дельта-антигенов в формате fasta. В SRS создала запрос к банку Swiss-Prot, написав Deltavirus в поле Taxonomy и delta* в поле Description. delta.fasta

    Файл с невыровненными последовательностями, импортированный в GeneDoc nevirovnen.gif

    2)Выравнивание в fasta-формате delta_aligned.fasta

    3)Картинка с выравниванием в GeneDoc GeneDoc2_alignment.gf.GIF

    4)Выравнивание в формате msf Gene1_alignment.msf

    Впечатления: консервативные участки были и до выравнивания (nevirovnen.gif) , но после выравнивания программой muscle (GeneDoc2_alignment.gf.GIF) из-за нескольких гэпов выравнивание стало содержать больше консервативных участков. Последовательности имеют большое сходство, поэтому вручную без особого труда можно выровнять некоторые участки

  • Выравнивание набора гомологов своего белка

    Получила 6 гомологов своего белка RBSB_ECOLI посредством BLAST на NCBI по Swiss-Prot, ограничив выдачу таксоном Bacteria и поставив порог на E-value, равный 0.001

    sp|P44737.1|RBSB_HAEIN  RecName: Full=D-ribose-binding peripla...   426    4e-119
    sp|P36949.2|RBSB_BACSU  RecName: Full=D-ribose-binding protein...   286    3e-77 
    sp|P39265.1|ALSB_ECOLI  RecName: Full=D-allose-binding peripla...   141    2e-33 
    sp|P39325.1|YTFQ_ECOLI  RecName: Full=ABC transporter periplas...   123    7e-28 
    sp|P49308.1|MOCB_RHIME  RecName: Full=Putative rhizopine-bindi...   115    2e-25 
    sp|Q9K6K2|  RBSR_BACHD  Ribose operon repressor                     99.0    1e-20 
     
    

    С помощью программы muscle построила множественное выравнивание

    Выравнивание в fasta-формате myproteins.fasta

    Картинка из GeneDoc приведена ниже myproteins.gif

    Список идентификаторов отобранных белков

    sw:RBSB_HAEIN  
    sw:RBSB_BACSU   
    sw:ALSB_ECOLI  
    sw:YTFQ_ECOLI   
    sw:MOCB_RHIME   
    sw:RBSR_BACHD  
    sw:RBSB_ECOLI  
    

    Описание структуры выравнивания

    Имеется четыре участка с повышенной долей консервативных позиций

    Координаты: 113-114 и 257-258,181-182, 188-189 по белку RBSB_ECOLI (седьмой в списке), 149-150 и 312-313, 229-230, 236-237 соответственно по столбцам выравнивания

    Картинка, на которой эти четыре участка выделены в зеленой рамочке приведена ниже concervation.gif

    Остальные участки с консервативными позициями состоят из одного столбика, наверно из-за малой идентичности (у этих белков она была 73%, 54%, 33%, 29%, 28%)

    Если бы последовательность в белке YTFQ_ECOLI в начале(координата 2: а.к. MV) была бы смещена вправо на одну а.к., то образовался бы консервативный участок. Возможно, данный участок выравнивания не имеет биологического смысла

    Также у этого белка отличается конец последовательности (координаты: 300-309). Наверно, участок просто не имеет биологического смысла.
    ©Старовойтова Анна,2008