Моя задача - оценить давление отбора на ген PflB белка пируват формат-лиазы в период, начиная с момента расхождения кишечной палочки (E.coli) и холерного вибриона (Vib.ch)
Итак, в моем распоряжении последовательность гена pflb_ecoli и белка Р09373 . Из геномной ДНК вибриона холеры я вырезала участок длиной 2364 нуклеотида (с 6852 по 9215), соответствующий гену PflB , сохранила в 2A6AGNOn.fasta , соответствующия белок - в 2A6AGNOp.fasta . Более подробно о белке я узнала на UniProtKB .

Проанализировав полученные последовательности с помощью программы needle (параметры по умолчанию: gapopen 10, gapextend 0.5), получила следующие выравнивания белковых и нуклеотидных последовательностей. Чтобы уменьшить количество гэпов в нуклеотидном выравнивании, я изменила эти параметры (gapopen 20, gapextend 2). Теперь сравним полученные результаты: в белковом выравнивании хорошее совпадение начинается с 32-й позиции последовательности холеры и 6-й позиции моей лиазы. в нуклеотидном - с 98-й холерной и 21-й гена лиазы. В нуклеотидном после 134-й позиции тройной гэп (не смещается рамка считывания!), в белковом выравнивании гэп в последовательности лиазы идет после 47-й позиции. Остальные участки как белковой, так и нуклеотидной последовательности выровнены без гэпов. Эти наблюдения позволяют сделать следующий вывод: полученное с измененными параметрами нуклеотидное выравнивание совпадает с белковым.
Переходим к следующей части - построение выравниваний с помощью PAL2NAL.

PAL2NAL - программа, которая переводит множественные выравнивания белковых последовательностей и соответствующих последовательностей ДНК (или мРНК) в выравнивания кодонов. Программа автоматически определяет соответствующую последовательность кодонов даже если между последовательностями ДНК и белковой, поданными на вход, встречаются несоответствия, или UTR, сайты полиаденилирования. Она так же справляется со сдвигом рамки во вводимой последовательности, что удобно при анализе псевдогенов. Для полученного выравнивания кодонов можно подсчитать количество синонимичных (KS) и несинонимичных (КА) замен.

При подаче на вход двух последовательностей, PAL2NAL автоматически считает KS и КА с помощью программы PAML.

Под заголовком Run PAL2NAL - 2 окна, в первое необходимо ввести 4 выравнивание белковых последовательностей , во второе - обе последовательности ДНК. Здесь можно ознакомиться с настройками по умолчанию.

Результаты, полученные с помощью PAL2NAL: выравнивание в формате FASTA и Codon with Amino acid а так же выравнивание с подсчетом КА и KS (с заданными параметрами ):
PAL2NAL output
#------------------------------------------------------------------------#
#  WARNING: A6AGN0|A6AGN0_VIBCH pepAlnPos 1: M does not correspond to ttg
#------------------------------------------------------------------------#

CLUSTAL W multiple sequence alignment

swissprot|P09373|PFLB_ECOLI    atgtccgagcttaatgaaaagttagccacagcctgggaaggttttaccaaaggtgactgg
A6AGN0|A6AGN0_VIBCH            aggtatgtcatggcagagcaatttgctaaagcttgggaaggttttgcggcaggtgactgg

swissprot|P09373|PFLB_ECOLI    cagaatgaagtaaacgtccgtgacttcattcagaaaaactacactccgtacgagggtgac
A6AGN0|A6AGN0_VIBCH            caaaacgaagttaacgttcgtgattttattcaaaagaactacacaccgtacgaaggcgac

swissprot|P09373|PFLB_ECOLI    gagtccttcctggctggcgctactgaagcgaccaccaccctgtgggacaaagtaatggaa
A6AGN0|A6AGN0_VIBCH            gaatctttcctagtctcagaaactgaagcgaccaacaagctttgggctaaagtaatggaa

swissprot|P09373|PFLB_ECOLI    ggcgttaaactggaaaaccgcactcacgcgccagttgactttgacaccgctgttgcttcc
A6AGN0|A6AGN0_VIBCH            ggtatcagacaggaaaattcaactcacgctcctgttgacttcgacacttctcttatctct

swissprot|P09373|PFLB_ECOLI    accatcacctctcacgacgctggctacatcaacaagcagcttgagaaaatcgttggtctg
A6AGN0|A6AGN0_VIBCH            accatcacagctcacgacgctggctacatcaacaaagatcttgaaaagatcgttggtcta

swissprot|P09373|PFLB_ECOLI    cagactgaagctccgctgaaacgtgctcttatcccgttcggtggtatcaaaatgatcgaa
A6AGN0|A6AGN0_VIBCH            caaaccgatgctccactgaaacgtgcaatcatccctaacggtggtatccgtatggtagaa

swissprot|P09373|PFLB_ECOLI    ggttcctgcaaagcgtacaaccgcgaactggatccgatgatcaaaaaaatcttcactgaa
A6AGN0|A6AGN0_VIBCH            ggttcatgcaaagcatatggtcgtgaactggatccacaagtttcaaaaatctactctgaa

swissprot|P09373|PFLB_ECOLI    taccgtaaaactcacaaccagggcgtgttcgacgtttacactccggacatcctgcgttgc
A6AGN0|A6AGN0_VIBCH            taccgcaaaacgcacaacgcaggtgtattcgacatctacactccagaaattctggcttgt

swissprot|P09373|PFLB_ECOLI    cgtaaatctggtgttctgaccggtctgccagatgcatatggccgtggccgtatcatcggt
A6AGN0|A6AGN0_VIBCH            cgtaaatctggcgttctgactggtcttccagatgcttacggccgtggtcgtatcatcggt

swissprot|P09373|PFLB_ECOLI    gactaccgtcgcgttgcgctgtacggtatcgactacctgatgaaagacaaactggcacag
A6AGN0|A6AGN0_VIBCH            gactaccgtcgtgtagctctgtacggtatcgacttcctgatgaaagacaaactggctcag

swissprot|P09373|PFLB_ECOLI    ttcacttctctgcaggctgatctggaaaacggcgtaaacctggaacagactatccgtctg
A6AGN0|A6AGN0_VIBCH            ttcaagtctctgcaggaaaaatttgaaaacggcgaagatctgcaaatgaccatgcaactg

swissprot|P09373|PFLB_ECOLI    cgcgaagaaatcgctgaacagcaccgcgctctgggtcagatgaaagaaatggctgcgaaa
A6AGN0|A6AGN0_VIBCH            cgtgaagaaattgcagaacaacaccgtgcgcttggccaaatgaaacagatggctgcgaaa

swissprot|P09373|PFLB_ECOLI    tacggctacgacatctctggtccggctaccaacgctcaggaagctatccagtggacttac
A6AGN0|A6AGN0_VIBCH            tacggttacgatatttctcgcccagctgaaacggcacaagaagcaatccaatggacttac

swissprot|P09373|PFLB_ECOLI    ttcggctacctggctgctgttaagtctcagaacggtgctgcaatgtccttcggtcgtacc
A6AGN0|A6AGN0_VIBCH            ttcggctacctagcggcagtgaaatctcaaaacggtgctgcaatgtctcttggccgtacc

swissprot|P09373|PFLB_ECOLI    tccaccttcctggatgtgtacatcgaacgtgacctgaaagctggcaagatcaccgaacaa
A6AGN0|A6AGN0_VIBCH            tctactttcttggacgtgtacattgagcgcgacatgaaagccggcaagatcacggaagtt

swissprot|P09373|PFLB_ECOLI    gaagcgcaggaaatggttgaccacctggtcatgaaactgcgtatggttcgcttcctgcgt
A6AGN0|A6AGN0_VIBCH            gaagcgcaagaaatgatcgaccacttcgtcatgaagctgcgtatggttcgtttcctacgt

swissprot|P09373|PFLB_ECOLI    actccggaatacgatgaactgttctctggcgacccgatctgggcaaccgaatctatcggt
A6AGN0|A6AGN0_VIBCH            actcctgagtacgatgagctgttctctggtgacccaatttgggcaaccgaatctatgggt

swissprot|P09373|PFLB_ECOLI    ggtatgggcctcgacggtcgtaccctggttaccaaaaacagcttccgtttcctgaacacc
A6AGN0|A6AGN0_VIBCH            ggtatgggtctggacggtcgtacgctggtaacacgtactaacttccgcttcctgaattca

swissprot|P09373|PFLB_ECOLI    ctgtacaccatgggtccgtctccggaaccgaacatgaccattctgtggtctgaaaaactg
A6AGN0|A6AGN0_VIBCH            ctgtacaccatgggtccatctccagagccaaacatcactgtcctgtggtcagagcaactg

swissprot|P09373|PFLB_ECOLI    ccgctgaacttcaagaaattcgccgctaaagtgtccatcgacacctcttctctgcagtat
A6AGN0|A6AGN0_VIBCH            cctgaaggcttcaagaagttctgtgcgaaagtgtctatcgatacctcgtctatccagtac

swissprot|P09373|PFLB_ECOLI    gagaacgatgacctgatgcgtccggacttcaacaacgatgactacgctattgcttgctgc
A6AGN0|A6AGN0_VIBCH            gaaaacgatgacttgatgcgtcctgacttcaacaatgatgactacgctatcgcatgttgt

swissprot|P09373|PFLB_ECOLI    gtaagcccgatgatcgttggtaaacaaatgcagttcttcggtgcgcgtgcaaacctggcg
A6AGN0|A6AGN0_VIBCH            gtatcaccaatggttattggtaaacacatgcagttcttcggtgctcgcgctaaccttgct

swissprot|P09373|PFLB_ECOLI    aaaaccatgctgtacgcaatcaacggcggcgttgacgaaaaactgaaaatgcaggttggt
A6AGN0|A6AGN0_VIBCH            aaaacgctgctgtatgtaatcaacggtggtgtggatgagaaactgaaaatccaagtgggt

swissprot|P09373|PFLB_ECOLI    ccgaagtctgaaccgatcaaaggcgatgtcctgaactatgatgaagtgatggagcgcatg
A6AGN0|A6AGN0_VIBCH            ccaaaaatgcctaagatcaccgacgaagtgctcgacttcgacgatgtatggggcaagctg

swissprot|P09373|PFLB_ECOLI    gatcacttcatggactggctggctaaacagtacatcactgcactgaacatcatccactac
A6AGN0|A6AGN0_VIBCH            gatcacttcatgggttggctggcaacacaatacgtcactgcactgaatgccatccactac

swissprot|P09373|PFLB_ECOLI    atgcacgacaagtacagctacgaagcctctctgatggcgctgcacgaccgtgacgttatc
A6AGN0|A6AGN0_VIBCH            atgcatgacaagtacagctacgaagcggctctaatggcgctgcatgaccgtgatgtacgt

swissprot|P09373|PFLB_ECOLI    cgcaccatggcgtgtggtatcgctggtctgtccgttgctgctgactccctgtctgcaatc
A6AGN0|A6AGN0_VIBCH            cgtactatggcgtgtggtatcgcaggtctgtctgtagcggctgactcactgtctgctatc

swissprot|P09373|PFLB_ECOLI    aaatatgcgaaagttaaaccgattcgtgacgaagacggtctggctatcgacttcgaaatc
A6AGN0|A6AGN0_VIBCH            aagtacgcgaaagtaaaaccaattcgtgacgaagatggtgtagctatcgattttgaaatc

swissprot|P09373|PFLB_ECOLI    gaaggcgaatacccgcagtttggtaacaatgatccgcgtgtagatgacctggctgttgac
A6AGN0|A6AGN0_VIBCH            gaaggcgactatccaaaattcggtaacaacgattcacgcgttgatgacatcgcctgtgaa

swissprot|P09373|PFLB_ECOLI    ctggtagaacgtttcatgaagaaaattcagaaactgcacacctaccgtgacgctatcccg
A6AGN0|A6AGN0_VIBCH            ctggttgagcgtttcatgaacaaaattcgttcactgaaaacttaccgtaacgcagtacca

swissprot|P09373|PFLB_ECOLI    actcagtctgttctgaccatcacttctaacgttgtgtatggtaagaaaacgggtaacacc
A6AGN0|A6AGN0_VIBCH            actcagtctatcctgactatcacgtcaaacgtggtatacggtaagaagacaggtaacaca

swissprot|P09373|PFLB_ECOLI    ccagacggtcgtcgtgctggcgcgccgttcggaccgggtgctaacccgatgcacggtcgt
A6AGN0|A6AGN0_VIBCH            ccagacggtcgtcgtgcaggtgcgccatttgcaccgggtgcaaacccaatgcacggtcgt

swissprot|P09373|PFLB_ECOLI    gaccagaaaggtgcagtagcctctctgacttccgttgctaaactgccgtttgcttacgct
A6AGN0|A6AGN0_VIBCH            gacgagaaaggtgcggtagcgtctctgacttcagtcggtaaactgccatttgctcacgcg

swissprot|P09373|PFLB_ECOLI    aaagatggtatctcctacaccttctctatcgttccgaacgcactgggtaaagacgacgaa
A6AGN0|A6AGN0_VIBCH            aaagacggtatctcttataccttctctatcgtgccaaatgcactgggtaaagatgagaac

swissprot|P09373|PFLB_ECOLI    gttcgtaagaccaacctggctggtctgatggatggttacttccaccacgaagcatccatc
A6AGN0|A6AGN0_VIBCH            tcacagcgtgcgaacctagctggcttgatggacggttacttccaccacgaagcaggcatc

swissprot|P09373|PFLB_ECOLI    gaaggtggtcagcacctgaacgttaacgtgatgaaccgtgaaatgctgctcgacgcgatg
A6AGN0|A6AGN0_VIBCH            gagggtggtcaacacctgaacgttaacgttctgaaccgtgacactctgcttgatgcagtt

swissprot|P09373|PFLB_ECOLI    gaaaacccggaaaaatatccgcagctgaccatccgtgtatctggctacgcagtacgtttc
A6AGN0|A6AGN0_VIBCH            aagcatccagaaaagtacccacaactgactatccgtgtatctggatacgcagtgcgcttt

swissprot|P09373|PFLB_ECOLI    aactcgctgactaaagaacagcagcaggacgttattactcgtaccttcactcaatctatg
A6AGN0|A6AGN0_VIBCH            aactctctgactgctgaacagcaacaagacgttatcgctcgtactttcactgaatcgcta




Synonymous (KS) and non-synonymous (KA) substitution rates calcualted by codeml in the PAML package: 
 KS = 1.0044 
 KA = 0.1105 
 KA/KS = 0.1100 
You can see the parameters used in codeml to calculate these values. 
If you use these values, please cite the following peper: 
 Goldman, N. and Yang, Z. 1994. A codon-based model of nucleotide substitution for protein-coding DNA sequences. Molecular Biology and Evolution 11:725-736.
Значение KA/KS < 1, следовательно, мы имеем дело со стабилизирующим отбором.
Подробный отчет находится в файле Protocol1

4 семестр
на главную


© Sandra