Элементарные эволюционные события

Элементарные эволюционные события

Подготовка данных

Здесь хранится белковая последовательность моего белка GYRB_ECOLY

здесь хранится ген моего белка ABCDEF.fasta
С помощью пакета Blast(BlastP) была найдена белковая последовательность, идентичная моей на 77%.

Само выравнивание:
>sp|Q9KVX3|GYRB_VIBCH  DNA gyrase subunit B
Length=805

 Score = 1286 bits (3329),  Expect = 0.0, Method: Compositional matrix adjust.
 Identities = 628/806 (77%), Positives = 706/806 (87%), Gaps = 3/806 (0%)

Query  1    MSNSYDSSSIKVLKGLDAVRKRPGMYIGDTDDGTGLHHMVFEVVDNAIDEALAGHCKEII  60
            MSN+YDSSSIKVLKGLDAVRKRPGMYIGDTDDGTGLHHMVFEVVDN+IDEALAG+CK+I+
Sbjct  1    MSNNYDSSSIKVLKGLDAVRKRPGMYIGDTDDGTGLHHMVFEVVDNSIDEALAGYCKDIV  60

Query  61   VTIHADNSVSVQDDGRGIPTGIHPEEGVSAAEVIMTVLHAGGKFDDNSYKVSGGLHGVGV  120
            VTIH DNSVSV DDGRGIPT +HPEE VSAAEVIMTVLHAGGKFDDNSYKVSGGLHGVGV
Sbjct  61   VTIHEDNSVSVSDDGRGIPTEMHPEEKVSAAEVIMTVLHAGGKFDDNSYKVSGGLHGVGV  120

Query  121  SVVNALSQKLELVIQREGKIHRQIYEHGVPQAPLAVTGETEKTGTMVRFWPSLETFTNVT  180
            SVVNALS+K+ L I R GKIH Q Y HGVPQAPLAV GETE+TGT VRFWPS +TFTN+ 
Sbjct  121  SVVNALSEKVLLTIYRGGKIHSQTYHHGVPQAPLAVVGETERTGTTVRFWPSAQTFTNI-  179

Query  181  EFEYEILAKRLRELSFLNSGVSIRLRDKRD-GKEDHFHYEGGIKAFVEYLNKNKTPIHPN  239
            EF Y+ILAKRLRELSFLNSGVSI+L D+R+  K+DHF YEGGI+AFV +LN+NKTPIH  
Sbjct  180  EFHYDILAKRLRELSFLNSGVSIKLTDEREEDKKDHFMYEGGIQAFVTHLNRNKTPIHEK  239

Query  240  IFYFSTEK-DGIGVEVALQWNDGFQENIYCFTNNIPQRDGGTHLAGFRAAMTRTLNAYMD  298
            +F+F+ E+ DGI VEVA+QWNDGFQENIYCFTNNIPQRDGGTHLAGFR A+TRTLN YMD
Sbjct  240  VFHFNQEREDGISVEVAMQWNDGFQENIYCFTNNIPQRDGGTHLAGFRGALTRTLNNYMD  299

Query  299  KEGYSKKAKVSATGDDAREGLIAVVSVKVPDPKFSSQTKDKLVSSEVKSAVEQQMNELLA  358
            KEG+SKKA+ + +GDDAREGL AVVSVKVPDPKFSSQTKDKLVSSEVKSAVE  MNE LA
Sbjct  300  KEGFSKKAQAATSGDDAREGLTAVVSVKVPDPKFSSQTKDKLVSSEVKSAVESAMNEKLA  359

Query  359  EYLLENPTDAKIVVGKIIDAARAREAARRAREMTRRKGALDLAGLPGKLADCQERDPALS  418
            ++L ENP++AK V  KIIDAARAREAAR+AREMTRRKGALDLAGLPGKLADCQE+DPALS
Sbjct  360  DFLAENPSEAKNVCSKIIDAARAREAARKAREMTRRKGALDLAGLPGKLADCQEKDPALS  419

Query  419  ELYLVEGDSAGGSAKQGRNRKNQAILPLKGKILNVEKARFDKMLSSQEVATLITALGCGI  478
            ELY+VEGDSAGGSAKQGRNRKNQAILPLKGKILNVEKARFDKMLSSQEVATLITALGCGI
Sbjct  420  ELYIVEGDSAGGSAKQGRNRKNQAILPLKGKILNVEKARFDKMLSSQEVATLITALGCGI  479

Query  479  GRDEYNPDKLRYHSIIIMTDADVDGSHIRTLLLTFFYRQMPEIVERGHVYIAQPPLYKVK  538
            GRDEYNPDKLRYH+IIIMTDADVDGSHIRTLLLTFFYRQMPE++ERG++YIAQPPLYKVK
Sbjct  480  GRDEYNPDKLRYHNIIIMTDADVDGSHIRTLLLTFFYRQMPELIERGYIYIAQPPLYKVK  539

Query  539  KGKQEQYIKDDEAMDQYQISIALDGATLHTNASAPALAGEALEKLVSEYNATQKMINRME  598
            KGKQEQYIKD+EAM+QYQ+++A+DGA LH NA APALAGE LEKLV +YNA  K++ RM 
Sbjct  540  KGKQEQYIKDEEAMNQYQVALAMDGAELHVNADAPALAGEPLEKLVQQYNAAIKLVERMS  599

Query  599  RRYPKAMLKELIYQPTLTEADLSDEQTVTRWVNALVSELNDKEQHGSQWKFDVHTNAEQN  658
            RRYP AML ELIY P +     +D+  V  W   LV +LN KE   SQ+   V  NAE N
Sbjct  600  RRYPYAMLHELIYVPRINAELCADKAAVEAWTQRLVEQLNAKEVGASQYSVLVEHNAELN  659

Query  659  LFEPIVRVRTHGVDTDYPLDHEFITGGEYRRICTLGEKLRGLLEEDAFIERGERRQPVAS  718
            ++ P ++VRTHGV  +Y L  + I   EY ++  L E L GL+E  AFI+RGER QP++S
Sbjct  660  VYLPKIQVRTHGVTHEYLLSADLINSKEYAKLADLSEALDGLIEAGAFIKRGERVQPISS  719

Query  719  FEQALDWLVKESRRGLSIQRYKGLGEMNPEQLWETTMDPESRRMLRVTVKDAIAADQLFT  778
            F  ALDWL+KESRRGLSIQRYKGLGEMNP+QLWETTMDPE+RRM++VT++DA+ AD+LFT
Sbjct  720  FAAALDWLIKESRRGLSIQRYKGLGEMNPDQLWETTMDPETRRMMQVTIEDAVGADELFT  779

Query  779  TLMGDAVEPRRAFIEENALKAANIDI  804
            TLMGD VEPRRAFIE NALK AN+D+
Sbjct  780  TLMGDQVEPRRAFIETNALKVANLDV  805

последовательность белка из Vibrio cholera GYRB_VIBCH

ген данного белка из полного генома Vibrio cholera ae003852.fasta

Построение выравниваний

При помощи программы needle были посторены 2 выравнивания: белковое и нуклеотидное- с параметрами по умолчнию.

Белковое выравнивание можно посмотреть в этом файле- res.file



Нуклеотидное выравнивание можно посмотеть в этом файле- res2.file
Когда я изменила параметры , выравнивание практически полностью совпало с белковым(различие в том, что в нуклеотидном выравнивании программа needle
 поставила больше гепов.Но полного соответствия добиться не удалось ни при каких параметрах)(-gapopen 20 -gapextend 10)
Выравнивание можно посмотреть здесьres4.file

Pal2nal

PAL2NAL - программа, преобразующая множественное выравнивание последовательностей белков и соответствующих ДНК (или мРНК) в выравнивание с разбивкой на кодоны.Программа выдает это выравнивание даже в том случае, если поданный на вход фрагмент последовательности ДНК будет не полностью совпадать с белковым выравниванием или будет содержать UTRs и полиадениновые хвосты.Данная программа может так же анализировать псевдогены, т.к. она справляется со сдвигом рамки считывания. В полученном выравнивании можно так же рассчитать количество синонимичных и несинонимичных замен на один сайт.

При помощи данной программы было получено следующее выравнивание: pal2nal output
Непонятно, почему программа указала несоответствие кодона atg метионину. Так же, были найдены несколько других аминокислот, которые действительно не соответствуют своим кодонам. Причина такого несоответствия мне не очень понятна.
Для подсчета Ka/Ks необходимо в "Option settings" в графе "Remove gaps, inframe stop codons" выбрать "Yes".
Таким образом для моего выравнивания программа подсчитала, что KA/KS = 0.0207 (посмотреть выдачу программы можно здесь) Вывод:поскольку значение KA/KS много меньще единицы можно предположить , что на мой ген действует стабилизирующий отбор.

вернуться на страницу четвертого семестра

главная страница


©Подковкина Анна