Моя задача - оценить давление отбора на ген PflB белка
пируват формат-лиазы в период, начиная с момента расхождения кишечной
палочки (E.coli) и холерного вибриона (Vib.ch)
Итак, в моем распоряжении последовательность гена pflb_ecoli и белка Р09373 . Из геномной ДНК вибриона холеры я вырезала участок длиной 2364 нуклеотида (с 6852 по 9215), соответствующий гену PflB , сохранила в 2A6AGNOn.fasta , соответствующия белок - в 2A6AGNOp.fasta . Более подробно о белке я узнала на UniProtKB . Проанализировав полученные последовательности с помощью программы needle (параметры по умолчанию: gapopen 10, gapextend 0.5), получила следующие выравнивания белковых и нуклеотидных последовательностей. Чтобы уменьшить количество гэпов в нуклеотидном выравнивании, я изменила эти параметры (gapopen 20, gapextend 2). Теперь сравним полученные результаты: в белковом выравнивании хорошее совпадение начинается с 32-й позиции последовательности холеры и 6-й позиции моей лиазы. в нуклеотидном - с 98-й холерной и 21-й гена лиазы. В нуклеотидном после 134-й позиции тройной гэп (не смещается рамка считывания!), в белковом выравнивании гэп в последовательности лиазы идет после 47-й позиции. Остальные участки как белковой, так и нуклеотидной последовательности выровнены без гэпов. Эти наблюдения позволяют сделать следующий вывод: полученное с измененными параметрами нуклеотидное выравнивание совпадает с белковым. |
Переходим к следующей части - построение выравниваний с помощью PAL2NAL.
PAL2NAL - программа, которая переводит множественные выравнивания белковых последовательностей и соответствующих последовательностей ДНК (или мРНК) в выравнивания кодонов. Программа автоматически определяет соответствующую последовательность кодонов даже если между последовательностями ДНК и белковой, поданными на вход, встречаются несоответствия, или UTR, сайты полиаденилирования. Она так же справляется со сдвигом рамки во вводимой последовательности, что удобно при анализе псевдогенов. Для полученного выравнивания кодонов можно подсчитать количество синонимичных (KS) и несинонимичных (КА) замен. При подаче на вход двух последовательностей, PAL2NAL автоматически считает KS и КА с помощью программы PAML. Под заголовком Run PAL2NAL - 2 окна, в первое необходимо ввести 4 выравнивание белковых последовательностей , во второе - обе последовательности ДНК. Здесь можно ознакомиться с настройками по умолчанию. Результаты, полученные с помощью PAL2NAL: выравнивание в формате FASTA и Codon with Amino acid а так же выравнивание с подсчетом КА и KS (с заданными параметрами ): PAL2NAL output #------------------------------------------------------------------------# # WARNING: A6AGN0|A6AGN0_VIBCH pepAlnPos 1: M does not correspond to ttg #------------------------------------------------------------------------# CLUSTAL W multiple sequence alignment swissprot|P09373|PFLB_ECOLI atgtccgagcttaatgaaaagttagccacagcctgggaaggttttaccaaaggtgactgg A6AGN0|A6AGN0_VIBCH aggtatgtcatggcagagcaatttgctaaagcttgggaaggttttgcggcaggtgactgg swissprot|P09373|PFLB_ECOLI cagaatgaagtaaacgtccgtgacttcattcagaaaaactacactccgtacgagggtgac A6AGN0|A6AGN0_VIBCH caaaacgaagttaacgttcgtgattttattcaaaagaactacacaccgtacgaaggcgac swissprot|P09373|PFLB_ECOLI gagtccttcctggctggcgctactgaagcgaccaccaccctgtgggacaaagtaatggaa A6AGN0|A6AGN0_VIBCH gaatctttcctagtctcagaaactgaagcgaccaacaagctttgggctaaagtaatggaa swissprot|P09373|PFLB_ECOLI ggcgttaaactggaaaaccgcactcacgcgccagttgactttgacaccgctgttgcttcc A6AGN0|A6AGN0_VIBCH ggtatcagacaggaaaattcaactcacgctcctgttgacttcgacacttctcttatctct swissprot|P09373|PFLB_ECOLI accatcacctctcacgacgctggctacatcaacaagcagcttgagaaaatcgttggtctg A6AGN0|A6AGN0_VIBCH accatcacagctcacgacgctggctacatcaacaaagatcttgaaaagatcgttggtcta swissprot|P09373|PFLB_ECOLI cagactgaagctccgctgaaacgtgctcttatcccgttcggtggtatcaaaatgatcgaa A6AGN0|A6AGN0_VIBCH caaaccgatgctccactgaaacgtgcaatcatccctaacggtggtatccgtatggtagaa swissprot|P09373|PFLB_ECOLI ggttcctgcaaagcgtacaaccgcgaactggatccgatgatcaaaaaaatcttcactgaa A6AGN0|A6AGN0_VIBCH ggttcatgcaaagcatatggtcgtgaactggatccacaagtttcaaaaatctactctgaa swissprot|P09373|PFLB_ECOLI taccgtaaaactcacaaccagggcgtgttcgacgtttacactccggacatcctgcgttgc A6AGN0|A6AGN0_VIBCH taccgcaaaacgcacaacgcaggtgtattcgacatctacactccagaaattctggcttgt swissprot|P09373|PFLB_ECOLI cgtaaatctggtgttctgaccggtctgccagatgcatatggccgtggccgtatcatcggt A6AGN0|A6AGN0_VIBCH cgtaaatctggcgttctgactggtcttccagatgcttacggccgtggtcgtatcatcggt swissprot|P09373|PFLB_ECOLI gactaccgtcgcgttgcgctgtacggtatcgactacctgatgaaagacaaactggcacag A6AGN0|A6AGN0_VIBCH gactaccgtcgtgtagctctgtacggtatcgacttcctgatgaaagacaaactggctcag swissprot|P09373|PFLB_ECOLI ttcacttctctgcaggctgatctggaaaacggcgtaaacctggaacagactatccgtctg A6AGN0|A6AGN0_VIBCH ttcaagtctctgcaggaaaaatttgaaaacggcgaagatctgcaaatgaccatgcaactg swissprot|P09373|PFLB_ECOLI cgcgaagaaatcgctgaacagcaccgcgctctgggtcagatgaaagaaatggctgcgaaa A6AGN0|A6AGN0_VIBCH cgtgaagaaattgcagaacaacaccgtgcgcttggccaaatgaaacagatggctgcgaaa swissprot|P09373|PFLB_ECOLI tacggctacgacatctctggtccggctaccaacgctcaggaagctatccagtggacttac A6AGN0|A6AGN0_VIBCH tacggttacgatatttctcgcccagctgaaacggcacaagaagcaatccaatggacttac swissprot|P09373|PFLB_ECOLI ttcggctacctggctgctgttaagtctcagaacggtgctgcaatgtccttcggtcgtacc A6AGN0|A6AGN0_VIBCH ttcggctacctagcggcagtgaaatctcaaaacggtgctgcaatgtctcttggccgtacc swissprot|P09373|PFLB_ECOLI tccaccttcctggatgtgtacatcgaacgtgacctgaaagctggcaagatcaccgaacaa A6AGN0|A6AGN0_VIBCH tctactttcttggacgtgtacattgagcgcgacatgaaagccggcaagatcacggaagtt swissprot|P09373|PFLB_ECOLI gaagcgcaggaaatggttgaccacctggtcatgaaactgcgtatggttcgcttcctgcgt A6AGN0|A6AGN0_VIBCH gaagcgcaagaaatgatcgaccacttcgtcatgaagctgcgtatggttcgtttcctacgt swissprot|P09373|PFLB_ECOLI actccggaatacgatgaactgttctctggcgacccgatctgggcaaccgaatctatcggt A6AGN0|A6AGN0_VIBCH actcctgagtacgatgagctgttctctggtgacccaatttgggcaaccgaatctatgggt swissprot|P09373|PFLB_ECOLI ggtatgggcctcgacggtcgtaccctggttaccaaaaacagcttccgtttcctgaacacc A6AGN0|A6AGN0_VIBCH ggtatgggtctggacggtcgtacgctggtaacacgtactaacttccgcttcctgaattca swissprot|P09373|PFLB_ECOLI ctgtacaccatgggtccgtctccggaaccgaacatgaccattctgtggtctgaaaaactg A6AGN0|A6AGN0_VIBCH ctgtacaccatgggtccatctccagagccaaacatcactgtcctgtggtcagagcaactg swissprot|P09373|PFLB_ECOLI ccgctgaacttcaagaaattcgccgctaaagtgtccatcgacacctcttctctgcagtat A6AGN0|A6AGN0_VIBCH cctgaaggcttcaagaagttctgtgcgaaagtgtctatcgatacctcgtctatccagtac swissprot|P09373|PFLB_ECOLI gagaacgatgacctgatgcgtccggacttcaacaacgatgactacgctattgcttgctgc A6AGN0|A6AGN0_VIBCH gaaaacgatgacttgatgcgtcctgacttcaacaatgatgactacgctatcgcatgttgt swissprot|P09373|PFLB_ECOLI gtaagcccgatgatcgttggtaaacaaatgcagttcttcggtgcgcgtgcaaacctggcg A6AGN0|A6AGN0_VIBCH gtatcaccaatggttattggtaaacacatgcagttcttcggtgctcgcgctaaccttgct swissprot|P09373|PFLB_ECOLI aaaaccatgctgtacgcaatcaacggcggcgttgacgaaaaactgaaaatgcaggttggt A6AGN0|A6AGN0_VIBCH aaaacgctgctgtatgtaatcaacggtggtgtggatgagaaactgaaaatccaagtgggt swissprot|P09373|PFLB_ECOLI ccgaagtctgaaccgatcaaaggcgatgtcctgaactatgatgaagtgatggagcgcatg A6AGN0|A6AGN0_VIBCH ccaaaaatgcctaagatcaccgacgaagtgctcgacttcgacgatgtatggggcaagctg swissprot|P09373|PFLB_ECOLI gatcacttcatggactggctggctaaacagtacatcactgcactgaacatcatccactac A6AGN0|A6AGN0_VIBCH gatcacttcatgggttggctggcaacacaatacgtcactgcactgaatgccatccactac swissprot|P09373|PFLB_ECOLI atgcacgacaagtacagctacgaagcctctctgatggcgctgcacgaccgtgacgttatc A6AGN0|A6AGN0_VIBCH atgcatgacaagtacagctacgaagcggctctaatggcgctgcatgaccgtgatgtacgt swissprot|P09373|PFLB_ECOLI cgcaccatggcgtgtggtatcgctggtctgtccgttgctgctgactccctgtctgcaatc A6AGN0|A6AGN0_VIBCH cgtactatggcgtgtggtatcgcaggtctgtctgtagcggctgactcactgtctgctatc swissprot|P09373|PFLB_ECOLI aaatatgcgaaagttaaaccgattcgtgacgaagacggtctggctatcgacttcgaaatc A6AGN0|A6AGN0_VIBCH aagtacgcgaaagtaaaaccaattcgtgacgaagatggtgtagctatcgattttgaaatc swissprot|P09373|PFLB_ECOLI gaaggcgaatacccgcagtttggtaacaatgatccgcgtgtagatgacctggctgttgac A6AGN0|A6AGN0_VIBCH gaaggcgactatccaaaattcggtaacaacgattcacgcgttgatgacatcgcctgtgaa swissprot|P09373|PFLB_ECOLI ctggtagaacgtttcatgaagaaaattcagaaactgcacacctaccgtgacgctatcccg A6AGN0|A6AGN0_VIBCH ctggttgagcgtttcatgaacaaaattcgttcactgaaaacttaccgtaacgcagtacca swissprot|P09373|PFLB_ECOLI actcagtctgttctgaccatcacttctaacgttgtgtatggtaagaaaacgggtaacacc A6AGN0|A6AGN0_VIBCH actcagtctatcctgactatcacgtcaaacgtggtatacggtaagaagacaggtaacaca swissprot|P09373|PFLB_ECOLI ccagacggtcgtcgtgctggcgcgccgttcggaccgggtgctaacccgatgcacggtcgt A6AGN0|A6AGN0_VIBCH ccagacggtcgtcgtgcaggtgcgccatttgcaccgggtgcaaacccaatgcacggtcgt swissprot|P09373|PFLB_ECOLI gaccagaaaggtgcagtagcctctctgacttccgttgctaaactgccgtttgcttacgct A6AGN0|A6AGN0_VIBCH gacgagaaaggtgcggtagcgtctctgacttcagtcggtaaactgccatttgctcacgcg swissprot|P09373|PFLB_ECOLI aaagatggtatctcctacaccttctctatcgttccgaacgcactgggtaaagacgacgaa A6AGN0|A6AGN0_VIBCH aaagacggtatctcttataccttctctatcgtgccaaatgcactgggtaaagatgagaac swissprot|P09373|PFLB_ECOLI gttcgtaagaccaacctggctggtctgatggatggttacttccaccacgaagcatccatc A6AGN0|A6AGN0_VIBCH tcacagcgtgcgaacctagctggcttgatggacggttacttccaccacgaagcaggcatc swissprot|P09373|PFLB_ECOLI gaaggtggtcagcacctgaacgttaacgtgatgaaccgtgaaatgctgctcgacgcgatg A6AGN0|A6AGN0_VIBCH gagggtggtcaacacctgaacgttaacgttctgaaccgtgacactctgcttgatgcagtt swissprot|P09373|PFLB_ECOLI gaaaacccggaaaaatatccgcagctgaccatccgtgtatctggctacgcagtacgtttc A6AGN0|A6AGN0_VIBCH aagcatccagaaaagtacccacaactgactatccgtgtatctggatacgcagtgcgcttt swissprot|P09373|PFLB_ECOLI aactcgctgactaaagaacagcagcaggacgttattactcgtaccttcactcaatctatg A6AGN0|A6AGN0_VIBCH aactctctgactgctgaacagcaacaagacgttatcgctcgtactttcactgaatcgcta Synonymous (KS) and non-synonymous (KA) substitution rates calcualted by codeml in the PAML package: KS = 1.0044 KA = 0.1105 KA/KS = 0.1100 You can see the parameters used in codeml to calculate these values. If you use these values, please cite the following peper: Goldman, N. and Yang, Z. 1994. A codon-based model of nucleotide substitution for protein-coding DNA sequences. Molecular Biology and Evolution 11:725-736.Значение KA/KS < 1, следовательно, мы имеем дело со стабилизирующим отбором. |
4 семестр |
на главную |