Элементарные эволюционные события

    Задание 1. Оценить давление отбора на ген заданного белка (работа с веб-сервером PAL2NAL)
      1) Кишечная палочка и синегнойная палочка.
        a) Последовательность белка RPOA_ECOLI: >uniprot|P0A7Z4|RPOA_ECOLI DNA-directed RNA polymerase subunit alpha (EC 2.7.7.6) MQGSVTEFLKPRLVDIEQVSSTHAKVTLEPLERGFGHTLGNALRRILLSSMPGCAVTEVE IDGVLHEYSTKEGVQEDILEILLNLKGLAVRVQGKDEVILTLNKSGIGPVTAADITHDGD VEIVKPQHVICHLTDENASISMRIKVQRGRGYVPASTRIHSEEDERPIGRLLVDACYSPV ERIAYNVEAARVEQRTDLDKLVIEMETNGTIDPEEAIRRAATILAEQLEAFVDLRDVRQP EVKEEKPEFDPILLRPVDDLELTVRSANCLKAEAIHYIGDLVQRTEVELLKTPNLGKKSL TEIKDVLASRGLSLGMRLENWPPASIADE b) Последовательность гена rpoa: > ATGCAGGGTTCTGTGACAGAGTTTCTAAAACCGCGCCTGGTTGATATCGAGCAAGTGAGTTCGACGCACGCCAAG GTGACCCTTGAGCCTTTAGAGCGTGGCTTTGGCCATACTCTGGGTAACGCACTGCGCCGTATTCTGCTCTCATCG ATGCCGGGTTGCGCGGTGACCGAGGTTGAGATTGATGGTGTACTACATGAGTACAGCACCAAAGAAGGCGTTCAG GAAGATATCCTGGAAATCCTGCTCAACCTGAAAGGGCTGGCGGTGAGAGTTCAGGGCAAAGATGAAGTTATTCTT ACCTTGAATAAATCTGGCATTGGCCCTGTGACTGCAGCCGATATCACCCACGACGGTGATGTCGAAATCGTCAAG CCGCAGCACGTGATCTGCCACCTGACCGATGAGAACGCGTCTATTAGCATGCGTATCAAAGTTCAGCGCGGTCGT GGTTATGTGCCGGCTTCTACCCGAATTCATTCGGAAGAAGATGAGCGCCCAATCGGCCGTCTGCTGGTCGACGCA TGCTACAGCCCTGTGGAGCGTATTGCCTACAATGTTGAAGCAGCGCGTGTAGAACAGCGTACCGACCTGGACAAG CTGGTCATCGAAATGGAAACCAACGGCACAATCGATCCTGAAGAGGCGATTCGTCGTGCGGCAACCATTCTGGCT GAACAACTGGAAGCTTTCGTTGACTTACGTGATGTACGTCAGCCTGAAGTGAAAGAAGAGAAACCAGAGTTCGAT CCGATCCTGCTGCGCCCTGTTGACGATCTGGAATTGACTGTCCGCTCTGCTAACTGCCTTAAAGCAGAAGCTATC CACTATATCGGTGATCTGGTACAGCGTACCGAGGTTGAGCTCCTTAAAACGCCTAACCTTGGTAAAAAATCTCTT ACTGAGATTAAAGACGTGCTGGCTTCCCGTGGACTGTCTCTGGGCATGCGCCTGGAAAACTGGCCACCGGCAAGC ATCGCTGACGAGTAA
      2) При помощи программы Blast был найден ортолог - последовательность, 
      совпадающая с нашей на 60-80% и имеющая похожую аннотацию в UniProt:
      
        >ref|NP_252928.1| DNA-directed RNA polymerase subunit alpha [Pseudomonas aeruginosa PAO1] ref|ZP_00967359.1| COG0202: DNA-directed RNA polymerase, alpha subunit/40 kD subunit [Pseudomonas aeruginosa C3719] ref|ZP_00973075.1| COG0202: DNA-directed RNA polymerase, alpha subunit/40 kD subunit [Pseudomonas aeruginosa 2192] ref|ZP_01367672.1| hypothetical protein PaerPA_01004825 [Pseudomonas aeruginosa PACS2] ref|YP_788881.1| DNA-directed RNA polymerase subunit alpha [Pseudomonas aeruginosa UCBPP-PA14] ref|YP_001346248.1| DNA-directed RNA polymerase, alpha subunit [Pseudomonas aeruginosa PA7] sp|O52760.2|RPOA_PSEAE DNA-directed RNA polymerase subunit alpha (RNAP subunit alpha) (Transcriptase subunit alpha) (RNA polymerase subunit alpha) sp|Q02T55.1|RPOA_PSEAB DNA-directed RNA polymerase subunit alpha (RNAP subunit alpha) (Transcriptase subunit alpha) (RNA polymerase subunit alpha) gb|AAG07626.1|AE004841_4 DNA-directed RNA polymerase alpha chain [Pseudomonas aeruginosa PAO1] gb|ABJ15630.1| DNA-directed RNA polymerase alpha chain [Pseudomonas aeruginosa UCBPP-PA14] gb|EAZ54544.1| DNA-directed RNA polymerase alpha chain [Pseudomonas aeruginosa C3719] gb|EAZ60350.1| DNA-directed RNA polymerase alpha chain [Pseudomonas aeruginosa 2192] gb|ABR81740.1| DNA-directed RNA polymerase, alpha subunit [Pseudomonas aeruginosa PA7] Length=333 GENE ID: 881813 rpoA | DNA-directed RNA polymerase subunit alpha [Pseudomonas aeruginosa PAO1] (10 or fewer PubMed links) Score = 384 bits (987), Expect = 2e-107, Method: Compositional matrix adjust. Identities = 191/266 (71%), Positives = 225/266 (84%), Gaps = 1/266 (0%) Query 1 IDGVLHEYSTKEGVQEDILEILLNLKGLAVRVQGKDEVILTLNKSGIGPVTAADITHDGD 60 IDGVLHEYS EGVQED++EILLNLKGLA+++ G+DEV LTL K G G VTAADI D D Sbjct 61 IDGVLHEYSAIEGVQEDVIEILLNLKGLAIKLHGRDEVTLTLAKKGSGVVTAADIQLDHD 120 Query 61 VEIVKPQHVICHLTDENASISMRIKVQRGRGYVPASTRIHSEEDERPIGRLLVDACYSPV 120 VEI+ HVI +L D N +++M++KV RGRGY PA R E++ R IGRL +DA +SPV Sbjct 121 VEIINGDHVIANLAD-NGALNMKLKVARGRGYEPADARQSDEDESRSIGRLQLDASFSPV 179 Query 121 ERIAYNVEAARVEQRTDLDKLVIEMETNGTIDPEEAIRRAATILAEQLEAFVDLRDVRQP 180 R++Y VE ARVEQRT+LDKLV+++ETNGT+DPEEAIRRAATIL +QL AFVDL+ +P Sbjct 180 RRVSYVVENARVEQRTNLDKLVLDLETNGTLDPEEAIRRAATILQQQLAAFVDLKGDSEP 239 Query 181 EVKEEKPEFDPILLRPVDDLELTVRSANCLKAEAIHYIGDLVQRTEVELLKTPNLGKKSL 240 V+E++ E DPILLRPVDDLELTVRSANCLKAE I+YIGDL+QRTEVELLKTPNLGKKSL Sbjct 240 VVEEQEDEIDPILLRPVDDLELTVRSANCLKAENIYYIGDLIQRTEVELLKTPNLGKKSL 299 Query 241 TEIKDVLASRGLSLGMRLENWPPASI 266 TEIKDVLASRGLSLGMRL+NWPPAS+ Sbjct 300 TEIKDVLASRGLSLGMRLDNWPPASL 325
       a) Белковая последовательнось:
      >gi|15599434|ref|NP_252928.1| DNA-directed RNA polymerase subunit alpha [Pseudomonas aeruginosa PAO1]
      MQSSVNEFLTPRHIDVQVVSQTRAKITLEPLERGFGHTLGNALRRILLSSMPGCAVVEAEIDGVLHEYSA
      IEGVQEDVIEILLNLKGLAIKLHGRDEVTLTLAKKGSGVVTAADIQLDHDVEIINGDHVIANLADNGALN
      MKLKVARGRGYEPADARQSDEDESRSIGRLQLDASFSPVRRVSYVVENARVEQRTNLDKLVLDLETNGTL
      DPEEAIRRAATILQQQLAAFVDLKGDSEPVVEEQEDEIDPILLRPVDDLELTVRSANCLKAENIYYIGDL
      IQRTEVELLKTPNLGKKSLTEIKDVLASRGLSLGMRLDNWPPASLKKDDKATA
      
      
       b)Нуклеотидная последовательность:
      >gi|110645304:c4755424-4754423 Pseudomonas aeruginosa PAO1, complete genome
      ATGCAGAGTTCGGTAAATGAGTTCCTGACCCCCCGCCACATCGATGTGCAGGTGGTCAGTCAAACCCGCG
      CCAAGATCACGCTCGAGCCTCTCGAGCGTGGTTTTGGTCACACCCTGGGCAACGCGCTGCGTCGCATCCT
      GTTGTCCTCCATGCCTGGCTGCGCAGTGGTCGAGGCCGAGATCGACGGCGTACTCCACGAGTACTCGGCG
      ATCGAAGGTGTGCAGGAAGATGTAATCGAGATCCTGCTGAACCTGAAAGGTCTGGCCATCAAGCTGCACG
      GTCGTGATGAAGTGACGCTGACCCTGGCTAAGAAGGGCTCGGGTGTTGTGACTGCTGCCGATATTCAGCT
      GGATCACGATGTTGAGATCATCAACGGTGACCACGTTATCGCCAACCTGGCAGACAACGGCGCGCTGAAC
      ATGAAGCTGAAGGTAGCTCGTGGCCGTGGCTACGAGCCTGCCGACGCACGTCAGAGCGATGAAGACGAAA
      GCCGCAGCATCGGCCGTCTGCAGCTCGACGCATCGTTCAGCCCGGTCCGTCGTGTCTCCTACGTGGTGGA
      AAACGCCCGTGTCGAGCAGCGCACCAACCTGGACAAACTGGTCCTGGACCTGGAAACCAACGGCACTCTG
      GATCCCGAAGAGGCTATCCGTCGCGCCGCTACCATCCTGCAACAGCAGCTGGCAGCGTTCGTGGACCTCA
      AGGGCGACAGCGAACCCGTCGTTGAAGAGCAGGAAGACGAGATCGATCCGATCCTCCTGCGCCCGGTCGA
      TGACCTGGAACTGACCGTACGTTCGGCCAACTGCCTGAAGGCGGAAAACATCTACTACATCGGTGACCTG
      ATCCAGCGCACCGAAGTGGAACTGTTGAAAACGCCGAACCTGGGCAAGAAGTCCCTGACCGAAATCAAGG
      ACGTTCTGGCTTCCCGTGGTCTGTCCCTCGGTATGCGCCTCGATAACTGGCCGCCGGCAAGTCTTAAGAA
      AGACGACAAGGCCACTGCCTGA
      
      
      
      
        3) Построение выравниваний:
          needle 1.fasta 2.fasta res.file. Аминокислотное выравнивание получилось довольно хорошим (по умолчанию приняты параметрами штрафов за открытие и продолжение гэпов). Нуклеотидное выравнивание можно считать лишь удовлетворительным (при параметрах 20 за открытие и 10 за продолжение гепов).
            Аминокислотное выравнивание:
              Aligned_sequences: 2 1: RPOA_ECOLI 2: NP_252928.1 Matrix: EBLOSUM62 Gap_penalty: 10.0 Extend_penalty: 0.5 Length: 334 Identity: 238/334 (71.3%) Similarity: 277/334 (82.9%) Gaps: 6/334 ( 1.8%) Score: 1208.0 RPOA_ECOLI 1 MQGSVTEFLKPRLVDIEQVSSTHAKVTLEPLERGFGHTLGNALRRILLSS 50 ||.||.|||.||.:|::.||.|.||:|||||||||||||||||||||||| NP_252928.1 1 MQSSVNEFLTPRHIDVQVVSQTRAKITLEPLERGFGHTLGNALRRILLSS 50 RPOA_ECOLI 51 MPGCAVTEVEIDGVLHEYSTKEGVQEDILEILLNLKGLAVRVQGKDEVIL 100 ||||||.|.||||||||||..||||||::||||||||||:::.|:|||.| NP_252928.1 51 MPGCAVVEAEIDGVLHEYSAIEGVQEDVIEILLNLKGLAIKLHGRDEVTL 100 RPOA_ECOLI 101 TLNKSGIGPVTAADITHDGDVEIVKPQHVICHLTDENASISMRIKVQRGR 150 ||.|.|.|.||||||..|.||||:...|||.:|.| |.:::|::||.||| NP_252928.1 101 TLAKKGSGVVTAADIQLDHDVEIINGDHVIANLAD-NGALNMKLKVARGR 149 RPOA_ECOLI 151 GYVPASTRIHSEEDERPIGRLLVDACYSPVERIAYNVEAARVEQRTDLDK 200 ||.||..|...|::.|.||||.:||.:|||.|::|.||.|||||||:||| NP_252928.1 150 GYEPADARQSDEDESRSIGRLQLDASFSPVRRVSYVVENARVEQRTNLDK 199 RPOA_ECOLI 201 LVIEMETNGTIDPEEAIRRAATILAEQLEAFVDLRDVRQPEVKEEKPEFD 250 ||:::|||||:|||||||||||||.:||.|||||:...:|.|:|::.|.| NP_252928.1 200 LVLDLETNGTLDPEEAIRRAATILQQQLAAFVDLKGDSEPVVEEQEDEID 249 RPOA_ECOLI 251 PILLRPVDDLELTVRSANCLKAEAIHYIGDLVQRTEVELLKTPNLGKKSL 300 |||||||||||||||||||||||.|:|||||:|||||||||||||||||| NP_252928.1 250 PILLRPVDDLELTVRSANCLKAENIYYIGDLIQRTEVELLKTPNLGKKSL 299 RPOA_ECOLI 301 TEIKDVLASRGLSLGMRLENWPPASIADE----- 329 ||||||||||||||||||:||||||:..: NP_252928.1 300 TEIKDVLASRGLSLGMRLDNWPPASLKKDDKATA 333
        Нуклеотидное выравнивание:
          # Program: needle # Rundate: Tue 20 May 2008 17:51:21 # Commandline: needle # [-asequence] rpoa_gene.fasta # [-bsequence] rpoa2_gene.fasta # [-outfile] ress2.file # -gapopen 20 # -gapextend 10 # Align_format: srspair # Report_file: ress2.file ######################################## # # Aligned_sequences: 2 # 1: rpoa # 2: c4755424-4754423 # Matrix: EDNAFULL # Gap_penalty: 20.0 # Extend_penalty: 10.0 # # Length: 1005 # Identity: 678/1005 (67.5%) # Similarity: 678/1005 (67.5%) # Gaps: 18/1005 ( 1.8%) # Score: 2114.0 # # rpoa 1 ATGCAGGGTTCTGTGACAGAGTTTCTAAAACCGCGCCTGGTTGATATCGA 50 ||||||.||||.||.|..|||||.||.|..||.||||...|.|||.|..| c4755424-4754 1 ATGCAGAGTTCGGTAAATGAGTTCCTGACCCCCCGCCACATCGATGTGCA 50 rpoa 51 GCAAGTGAGTTCGACGCACGCCAAGGTGACCCTTGAGCCTTTAGAGCGTG 100 |...||.|||...||.|.|||||||.|.||.||.||||||.|.||||||| c4755424-4754 51 GGTGGTCAGTCAAACCCGCGCCAAGATCACGCTCGAGCCTCTCGAGCGTG 100 rpoa 101 GCTTTGGCCATACTCTGGGTAACGCACTGCGCCGTATTCTGCTCTCATCG 150 |.|||||.||.||.|||||.|||||.|||||.||.||.|||.|.||.||. c4755424-4754 101 GTTTTGGTCACACCCTGGGCAACGCGCTGCGTCGCATCCTGTTGTCCTCC 150 rpoa 151 ATGCCGGGTTGCGCGGTGACCGAGGTTGAGATTGATGGTGTACTACATGA 200 |||||.||.|||||.|||..|||||..|||||.||.||.|||||.||.|| c4755424-4754 151 ATGCCTGGCTGCGCAGTGGTCGAGGCCGAGATCGACGGCGTACTCCACGA 200 rpoa 201 GTACAGCACCAAAGAAGGCGTTCAGGAAGATATCCTGGAAATCCTGCTCA 250 ||||....|.|..|||||.||.|||||||||.|..|.||.||||||||.| c4755424-4754 201 GTACTCGGCGATCGAAGGTGTGCAGGAAGATGTAATCGAGATCCTGCTGA 250 rpoa 251 ACCTGAAAGGGCTGGCGGTGAGAGTTCAGGGCAAAGATGAAGTTATTCTT 300 ||||||||||.|||||..|.|...|.||.||....||||||||.|..||. c4755424-4754 251 ACCTGAAAGGTCTGGCCATCAAGCTGCACGGTCGTGATGAAGTGACGCTG 300 rpoa 301 ACCTTGAATAAATCTGGCATTGGCCCTGTGACTGCAGCCGATATCACCCA 350 |||.||..|||....|||...||...|||||||||.||||||||....|. c4755424-4754 301 ACCCTGGCTAAGAAGGGCTCGGGTGTTGTGACTGCTGCCGATATTCAGCT 350 rpoa 351 CGACGGTGATGTCGAAATCGTCAAGCCGCAGCACGTGATCTGCCACCTGA 400 .||....|||||.||.|||.||||.....|.|||||.|||..|.||||| c4755424-4754 351 GGATCACGATGTTGAGATCATCAACGGTGACCACGTTATCGCCAACCTG- 399 rpoa 401 CCGATGAGAACGCGTCTATTAGCATGCGTATCAAAGTTCAGCGCGGTCGT 450 |..||.||||...|..|.|.||||....|.||.||....||.||.||| c4755424-4754 400 --GCAGACAACGGCGCGCTGAACATGAAGCTGAAGGTAGCTCGTGGCCGT 447 rpoa 451 GGTTATGTGCCGGCTTCTACCCGAATTCATTCGGAAGAAGATGAGCGCCC 500 ||.||.|.|||.||.....|.||..........|||||.||....|||.. c4755424-4754 448 GGCTACGAGCCTGCCGACGCACGTCAGAGCGATGAAGACGAAAGCCGCAG 497 rpoa 501 AATCGGCCGTCTGCTGGTCGACGCATGCTACAGCCCTGTGGAGCGTATTG 550 .|||||||||||||.|.|||||||||..|.||||||.||....|||.|.. c4755424-4754 498 CATCGGCCGTCTGCAGCTCGACGCATCGTTCAGCCCGGTCCGTCGTGTCT 547 rpoa 551 CCTACAATGTTGAAGCAGCGCGTGTAGAACAGCGTACCGACCTGGACAAG 600 |||||...||.|||...||.|||||.||.|||||.|||.||||||||||. c4755424-4754 548 CCTACGTGGTGGAAAACGCCCGTGTCGAGCAGCGCACCAACCTGGACAAA 597 rpoa 601 CTGGTCATCGAAATGGAAACCAACGGCACAATCGATCCTGAAGAGGCGAT 650 ||||||.|.||..||||||||||||||||..|.|||||.||||||||.|| c4755424-4754 598 CTGGTCCTGGACCTGGAAACCAACGGCACTCTGGATCCCGAAGAGGCTAT 647 rpoa 651 TCGTCGTGCGGCAACCATTCTGGCTGAACAACTGGAAGCTTTCGTTGACT 700 .|||||.||.||.|||||.|||....|.||.||||.|||.|||||.|||. c4755424-4754 648 CCGTCGCGCCGCTACCATCCTGCAACAGCAGCTGGCAGCGTTCGTGGACC 697 rpoa 701 TACGTGATGTACGTCAGCCTGAAGTGAAAGAAGAGAAACCAGAGTTCGAT 750 |....|..|...|..|.||.|..||..||||..||.||...|||.||||| c4755424-4754 698 TCAAGGGCGACAGCGAACCCGTCGTTGAAGAGCAGGAAGACGAGATCGAT 747 rpoa 751 CCGATCCTGCTGCGCCCTGTTGACGATCTGGAATTGACTGTCCGCTCTGC 800 ||||||||.||||||||.||.||.||.||||||.||||.||.||.||.|| c4755424-4754 748 CCGATCCTCCTGCGCCCGGTCGATGACCTGGAACTGACCGTACGTTCGGC 797 rpoa 801 TAACTGCCTTAAAGCAGAAGCTATCCACTATATCGGTGATCTGGTACAGC 850 .||||||||.||.||.|||...|||.||||.||||||||.|||.|.|||| c4755424-4754 798 CAACTGCCTGAAGGCGGAAAACATCTACTACATCGGTGACCTGATCCAGC 847 rpoa 851 GTACCGAGGTTGAGCTCCTTAAAACGCCTAACCTTGGTAAAAAATCTCTT 900 |.|||||.||.||.||..|.||||||||.|||||.||.||.||.||.||. c4755424-4754 848 GCACCGAAGTGGAACTGTTGAAAACGCCGAACCTGGGCAAGAAGTCCCTG 897 rpoa 901 ACTGAGATTAAAGACGTGCTGGCTTCCCGTGGACTGTCTCTGGGCATGCG 950 ||.||.||.||.|||||.||||||||||||||.|||||.||.||.||||| c4755424-4754 898 ACCGAAATCAAGGACGTTCTGGCTTCCCGTGGTCTGTCCCTCGGTATGCG 947 rpoa 951 CCTGGAAAACTGGCCACCGGCAAGCATCGCTGACGAGTAA---------- 990 |||.||.||||||||.||||||||..|.....|.||..|. c4755424-4754 948 CCTCGATAACTGGCCGCCGGCAAGTCTTAAGAAAGACGACAAGGCCACTG 997 rpoa 990 ----- 990 c4755424-4754 998 CCTGA 1002 Белковое выравнивание достаточно соответствует нуклеотидному. В белковом выравнивании есть только один геп, в то время как в нуклеотидном выравнивании гепы встречаются в трех местах. Это можно объяснить тем, что программа что построение нуклеотидного выравнивания, большого по размеру, достаточно непросто для любой программы, в том числе и для needle.
        4) PAL2NAL:
          1. Перечислить, что может делать PAL2NAL. Pal2Nal - это программа, которая превращает выравнивание белковых последовательностей и соответствующие последовательности ДНК (или мРНК) в выравнивание кодонов. Эта программа автоматически приводит надлежащий кодон (даже если в подаваемой на вход последовательности ДНК имеются несоответствия с белковой последовательностью или присутствуют UTRs, polyA tails). Pal2Nal работает даже со сдвигом рамки. Также PAL2NAL может рассчитывать Ka и Ks. 2. Построение нуклеотидного выравнивания с разбивкой на кодоны. PAL2NAL output M Q G S V T E F L K P R L V D I E Q V S RPOA_ECOLI ATG CAG GGT TCT GTG ACA GAG TTT CTA AAA CCG CGC CTG GTT GAT ATC GAG CAA GTG AGT M Q S S V N E F L T P R H I D V Q V V S NP_252928.1 ATG CAG AGT TCG GTA AAT GAG TTC CTG ACC CCC CGC CAC ATC GAT GTG CAG GTG GTC AGT S T H A K V T L E P L E R G F G H T L G RPOA_ECOLI TCG ACG CAC GCC AAG GTG ACC CTT GAG CCT TTA GAG CGT GGC TTT GGC CAT ACT CTG GGT Q T R A K I T L E P L E R G F G H T L G NP_252928.1 CAA ACC CGC GCC AAG ATC ACG CTC GAG CCT CTC GAG CGT GGT TTT GGT CAC ACC CTG GGC N A L R R I L L S S M P G C A V T E V E RPOA_ECOLI AAC GCA CTG CGC CGT ATT CTG CTC TCA TCG ATG CCG GGT TGC GCG GTG ACC GAG GTT GAG N A L R R I L L S S M P G C A V V E A E NP_252928.1 AAC GCG CTG CGT CGC ATC CTG TTG TCC TCC ATG CCT GGC TGC GCA GTG GTC GAG GCC GAG I D G V L H E Y S T K E G V Q E D I L E RPOA_ECOLI ATT GAT GGT GTA CTA CAT GAG TAC AGC ACC AAA GAA GGC GTT CAG GAA GAT ATC CTG GAA I D G V L H E Y S A I E G V Q E D V I E NP_252928.1 ATC GAC GGC GTA CTC CAC GAG TAC TCG GCG ATC GAA GGT GTG CAG GAA GAT GTA ATC GAG I L L N L K G L A V R V Q G K D E V I L RPOA_ECOLI ATC CTG CTC AAC CTG AAA GGG CTG GCG GTG AGA GTT CAG GGC AAA GAT GAA GTT ATT CTT I L L N L K G L A I K L H G R D E V T L NP_252928.1 ATC CTG CTG AAC CTG AAA GGT CTG GCC ATC AAG CTG CAC GGT CGT GAT GAA GTG ACG CTG T L N K S G I G P V T A A D I T H D G D RPOA_ECOLI ACC TTG AAT AAA TCT GGC ATT GGC CCT GTG ACT GCA GCC GAT ATC ACC CAC GAC GGT GAT T L A K K G S G V V T A A D I Q L D H D NP_252928.1 ACC CTG GCT AAG AAG GGC TCG GGT GTT GTG ACT GCT GCC GAT ATT CAG CTG GAT CAC GAT V E I V K P Q H V I C H L T D E N A S I RPOA_ECOLI GTC GAA ATC GTC AAG CCG CAG CAC GTG ATC TGC CAC CTG ACC GAT GAG AAC GCG TCT ATT V E I I N G D H V I A N L A D - N G A L NP_252928.1 GTT GAG ATC ATC AAC GGT GAC CAC GTT ATC GCC AAC CTG GCA GAC --- AAC GGC GCG CTG S M R I K V Q R G R G Y V P A S T R I H RPOA_ECOLI AGC ATG CGT ATC AAA GTT CAG CGC GGT CGT GGT TAT GTG CCG GCT TCT ACC CGA ATT CAT N M K L K V A R G R G Y E P A D A R Q S NP_252928.1 AAC ATG AAG CTG AAG GTA GCT CGT GGC CGT GGC TAC GAG CCT GCC GAC GCA CGT CAG AGC S E E D E R P I G R L L V D A C Y S P V RPOA_ECOLI TCG GAA GAA GAT GAG CGC CCA ATC GGC CGT CTG CTG GTC GAC GCA TGC TAC AGC CCT GTG D E D E S R S I G R L Q L D A S F S P V NP_252928.1 GAT GAA GAC GAA AGC CGC AGC ATC GGC CGT CTG CAG CTC GAC GCA TCG TTC AGC CCG GTC E R I A Y N V E A A R V E Q R T D L D K RPOA_ECOLI GAG CGT ATT GCC TAC AAT GTT GAA GCA GCG CGT GTA GAA CAG CGT ACC GAC CTG GAC AAG R R V S Y V V E N A R V E Q R T N L D K NP_252928.1 CGT CGT GTC TCC TAC GTG GTG GAA AAC GCC CGT GTC GAG CAG CGC ACC AAC CTG GAC AAA L V I E M E T N G T I D P E E A I R R A RPOA_ECOLI CTG GTC ATC GAA ATG GAA ACC AAC GGC ACA ATC GAT CCT GAA GAG GCG ATT CGT CGT GCG L V L D L E T N G T L D P E E A I R R A NP_252928.1 CTG GTC CTG GAC CTG GAA ACC AAC GGC ACT CTG GAT CCC GAA GAG GCT ATC CGT CGC GCC A T I L A E Q L E A F V D L R D V R Q P RPOA_ECOLI GCA ACC ATT CTG GCT GAA CAA CTG GAA GCT TTC GTT GAC TTA CGT GAT GTA CGT CAG CCT A T I L Q Q Q L A A F V D L K G D S E P NP_252928.1 GCT ACC ATC CTG CAA CAG CAG CTG GCA GCG TTC GTG GAC CTC AAG GGC GAC AGC GAA CCC E V K E E K P E F D P I L L R P V D D L RPOA_ECOLI GAA GTG AAA GAA GAG AAA CCA GAG TTC GAT CCG ATC CTG CTG CGC CCT GTT GAC GAT CTG V V E E Q E D E I D P I L L R P V D D L NP_252928.1 GTC GTT GAA GAG CAG GAA GAC GAG ATC GAT CCG ATC CTC CTG CGC CCG GTC GAT GAC CTG E L T V R S A N C L K A E A I H Y I G D RPOA_ECOLI GAA TTG ACT GTC CGC TCT GCT AAC TGC CTT AAA GCA GAA GCT ATC CAC TAT ATC GGT GAT E L T V R S A N C L K A E N I Y Y I G D NP_252928.1 GAA CTG ACC GTA CGT TCG GCC AAC TGC CTG AAG GCG GAA AAC ATC TAC TAC ATC GGT GAC L V Q R T E V E L L K T P N L G K K S L RPOA_ECOLI CTG GTA CAG CGT ACC GAG GTT GAG CTC CTT AAA ACG CCT AAC CTT GGT AAA AAA TCT CTT L I Q R T E V E L L K T P N L G K K S L NP_252928.1 CTG ATC CAG CGC ACC GAA GTG GAA CTG TTG AAA ACG CCG AAC CTG GGC AAG AAG TCC CTG T E I K D V L A S R G L S L G M R L E N RPOA_ECOLI ACT GAG ATT AAA GAC GTG CTG GCT TCC CGT GGA CTG TCT CTG GGC ATG CGC CTG GAA AAC T E I K D V L A S R G L S L G M R L D N NP_252928.1 ACC GAA ATC AAG GAC GTT CTG GCT TCC CGT GGT CTG TCC CTC GGT ATG CGC CTC GAT AAC W P P A S I A D E - - - - - RPOA_ECOLI TGG CCA CCG GCA AGC ATC GCT GAC GAG --- --- --- --- --- W P P A S L K K D D K A T A NP_252928.1 TGG CCG CCG GCA AGT CTT AAG AAA GAC GAC AAG GCC ACT GCC В полученном выравнивании встретился только 1 геп, также как при выравнивании, полученном с помощью программы needle. 3. Значения Ka/Ks для сравниваемых генов: KS = 50.4626 KA = 0.1932 KA/KS = 0.0038 Так как полученное отношение меньше единицы, то мы можем сделать вывод, что на ген rpoA действует стабилизирующий отбор.
      На главную страницу


      ©Фомичева Анастасия,2006