Здесь хранится белковая последовательность моего белка GYRB_ECOLY
здесь хранится ген моего белка ABCDEF.fasta
С помощью пакета Blast(BlastP) была найдена белковая последовательность, идентичная моей на 77%.
Само выравнивание: >sp|Q9KVX3|GYRB_VIBCH DNA gyrase subunit B Length=805 Score = 1286 bits (3329), Expect = 0.0, Method: Compositional matrix adjust. Identities = 628/806 (77%), Positives = 706/806 (87%), Gaps = 3/806 (0%) Query 1 MSNSYDSSSIKVLKGLDAVRKRPGMYIGDTDDGTGLHHMVFEVVDNAIDEALAGHCKEII 60 MSN+YDSSSIKVLKGLDAVRKRPGMYIGDTDDGTGLHHMVFEVVDN+IDEALAG+CK+I+ Sbjct 1 MSNNYDSSSIKVLKGLDAVRKRPGMYIGDTDDGTGLHHMVFEVVDNSIDEALAGYCKDIV 60 Query 61 VTIHADNSVSVQDDGRGIPTGIHPEEGVSAAEVIMTVLHAGGKFDDNSYKVSGGLHGVGV 120 VTIH DNSVSV DDGRGIPT +HPEE VSAAEVIMTVLHAGGKFDDNSYKVSGGLHGVGV Sbjct 61 VTIHEDNSVSVSDDGRGIPTEMHPEEKVSAAEVIMTVLHAGGKFDDNSYKVSGGLHGVGV 120 Query 121 SVVNALSQKLELVIQREGKIHRQIYEHGVPQAPLAVTGETEKTGTMVRFWPSLETFTNVT 180 SVVNALS+K+ L I R GKIH Q Y HGVPQAPLAV GETE+TGT VRFWPS +TFTN+ Sbjct 121 SVVNALSEKVLLTIYRGGKIHSQTYHHGVPQAPLAVVGETERTGTTVRFWPSAQTFTNI- 179 Query 181 EFEYEILAKRLRELSFLNSGVSIRLRDKRD-GKEDHFHYEGGIKAFVEYLNKNKTPIHPN 239 EF Y+ILAKRLRELSFLNSGVSI+L D+R+ K+DHF YEGGI+AFV +LN+NKTPIH Sbjct 180 EFHYDILAKRLRELSFLNSGVSIKLTDEREEDKKDHFMYEGGIQAFVTHLNRNKTPIHEK 239 Query 240 IFYFSTEK-DGIGVEVALQWNDGFQENIYCFTNNIPQRDGGTHLAGFRAAMTRTLNAYMD 298 +F+F+ E+ DGI VEVA+QWNDGFQENIYCFTNNIPQRDGGTHLAGFR A+TRTLN YMD Sbjct 240 VFHFNQEREDGISVEVAMQWNDGFQENIYCFTNNIPQRDGGTHLAGFRGALTRTLNNYMD 299 Query 299 KEGYSKKAKVSATGDDAREGLIAVVSVKVPDPKFSSQTKDKLVSSEVKSAVEQQMNELLA 358 KEG+SKKA+ + +GDDAREGL AVVSVKVPDPKFSSQTKDKLVSSEVKSAVE MNE LA Sbjct 300 KEGFSKKAQAATSGDDAREGLTAVVSVKVPDPKFSSQTKDKLVSSEVKSAVESAMNEKLA 359 Query 359 EYLLENPTDAKIVVGKIIDAARAREAARRAREMTRRKGALDLAGLPGKLADCQERDPALS 418 ++L ENP++AK V KIIDAARAREAAR+AREMTRRKGALDLAGLPGKLADCQE+DPALS Sbjct 360 DFLAENPSEAKNVCSKIIDAARAREAARKAREMTRRKGALDLAGLPGKLADCQEKDPALS 419 Query 419 ELYLVEGDSAGGSAKQGRNRKNQAILPLKGKILNVEKARFDKMLSSQEVATLITALGCGI 478 ELY+VEGDSAGGSAKQGRNRKNQAILPLKGKILNVEKARFDKMLSSQEVATLITALGCGI Sbjct 420 ELYIVEGDSAGGSAKQGRNRKNQAILPLKGKILNVEKARFDKMLSSQEVATLITALGCGI 479 Query 479 GRDEYNPDKLRYHSIIIMTDADVDGSHIRTLLLTFFYRQMPEIVERGHVYIAQPPLYKVK 538 GRDEYNPDKLRYH+IIIMTDADVDGSHIRTLLLTFFYRQMPE++ERG++YIAQPPLYKVK Sbjct 480 GRDEYNPDKLRYHNIIIMTDADVDGSHIRTLLLTFFYRQMPELIERGYIYIAQPPLYKVK 539 Query 539 KGKQEQYIKDDEAMDQYQISIALDGATLHTNASAPALAGEALEKLVSEYNATQKMINRME 598 KGKQEQYIKD+EAM+QYQ+++A+DGA LH NA APALAGE LEKLV +YNA K++ RM Sbjct 540 KGKQEQYIKDEEAMNQYQVALAMDGAELHVNADAPALAGEPLEKLVQQYNAAIKLVERMS 599 Query 599 RRYPKAMLKELIYQPTLTEADLSDEQTVTRWVNALVSELNDKEQHGSQWKFDVHTNAEQN 658 RRYP AML ELIY P + +D+ V W LV +LN KE SQ+ V NAE N Sbjct 600 RRYPYAMLHELIYVPRINAELCADKAAVEAWTQRLVEQLNAKEVGASQYSVLVEHNAELN 659 Query 659 LFEPIVRVRTHGVDTDYPLDHEFITGGEYRRICTLGEKLRGLLEEDAFIERGERRQPVAS 718 ++ P ++VRTHGV +Y L + I EY ++ L E L GL+E AFI+RGER QP++S Sbjct 660 VYLPKIQVRTHGVTHEYLLSADLINSKEYAKLADLSEALDGLIEAGAFIKRGERVQPISS 719 Query 719 FEQALDWLVKESRRGLSIQRYKGLGEMNPEQLWETTMDPESRRMLRVTVKDAIAADQLFT 778 F ALDWL+KESRRGLSIQRYKGLGEMNP+QLWETTMDPE+RRM++VT++DA+ AD+LFT Sbjct 720 FAAALDWLIKESRRGLSIQRYKGLGEMNPDQLWETTMDPETRRMMQVTIEDAVGADELFT 779 Query 779 TLMGDAVEPRRAFIEENALKAANIDI 804 TLMGD VEPRRAFIE NALK AN+D+ Sbjct 780 TLMGDQVEPRRAFIETNALKVANLDV 805
последовательность белка из Vibrio cholera GYRB_VIBCH
ген данного белка из полного генома Vibrio cholera ae003852.fasta
При помощи программы needle были посторены 2 выравнивания: белковое и нуклеотидное- с параметрами по умолчнию.
Белковое выравнивание можно посмотреть в этом файле- res.file Нуклеотидное выравнивание можно посмотеть в этом файле- res2.file Когда я изменила параметры , выравнивание практически полностью совпало с белковым(различие в том, что в нуклеотидном выравнивании программа needle поставила больше гепов.Но полного соответствия добиться не удалось ни при каких параметрах)(-gapopen 20 -gapextend 10) Выравнивание можно посмотреть здесьres4.file
Pal2nal
PAL2NAL - программа, преобразующая множественное выравнивание последовательностей белков и соответствующих ДНК (или мРНК) в выравнивание с разбивкой на кодоны.Программа выдает это выравнивание даже в том случае, если поданный на вход фрагмент последовательности ДНК будет не полностью совпадать с белковым выравниванием или будет содержать UTRs и полиадениновые хвосты.Данная программа может так же анализировать псевдогены, т.к. она справляется со сдвигом рамки считывания. В полученном выравнивании можно так же рассчитать количество синонимичных и несинонимичных замен на один сайт.При помощи данной программы было получено следующее выравнивание: pal2nal output
Непонятно, почему программа указала несоответствие кодона atg метионину. Так же, были найдены несколько других аминокислот, которые действительно не соответствуют своим кодонам. Причина такого несоответствия мне не очень понятна.
Для подсчета Ka/Ks необходимо в "Option settings" в графе "Remove gaps, inframe stop codons" выбрать "Yes".
Таким образом для моего выравнивания программа подсчитала, что KA/KS = 0.0207 (посмотреть выдачу программы можно здесь) Вывод:поскольку значение KA/KS много меньще единицы можно предположить , что на мой ген действует стабилизирующий отбор.
вернуться на страницу четвертого семестра
©Подковкина Анна