На главную страницу

Третий семестр


Блок №1

Оценить давление отбора на ген заданного белка TIG_ECOLI (работа с веб-сервером PAL2NAL)

Мой белок TIG_ECOLI, его последовательность

Ген tig, его последовательность


Был проведён поиск ортологов моего белка в нескольких организмах, а именно, в синегнойной палочке (Pseudomonas aeruginosa) и чумной палочке (Yersinia pestis), так как поиск не в одном из организмов не дал результатов с ID около 60-80%, то пришлось выбирать между наиболее подходящими находками.

В результате был найден ортолог с ID 86% и схожей аннотацией в UniProt.

Соответствующее выравнивание:


Length=434

 Score =  753 bits (1944),  Expect = 0.0, Method: Compositional matrix adjust.
 Identities = 371/430 (86%), Positives = 396/430 (92%), Gaps = 0/430 (0%)

Query  1    MQVSVETTQGLGRRVTITIAADSIETAVKSELVNVAKKVRIDGFRKGKVPMNIVAQRYGA  60
            MQVSVETTQGLGRRVTIT+AADSIE AVKSELV  AK VRIDGFRKG VPMNIV QRYGA
Sbjct  1    MQVSVETTQGLGRRVTITVAADSIEKAVKSELVKAAKNVRIDGFRKGHVPMNIVEQRYGA  60

Query  61   SVRQDVLGDLMSRNFIDAIIKEKINPAGAPTYVPGEYKLGEDFTYSVEFEVYPEVELQGL  120
            SVRQDVLGDLM RNF+DAIIKEKINPAGAP YVPGEYK GEDFTYSVEFEVYPEVEL+ L
Sbjct  61   SVRQDVLGDLMQRNFVDAIIKEKINPAGAPNYVPGEYKQGEDFTYSVEFEVYPEVELKDL  120

Query  121  EAIEVEKPIVEVTDADVDGMLDTLRKQQATWKEKDGAVEAEDRVTIDFTGSVDGEEFEGG  180
            E+IEVEKP+VEV DADVD ML+TLRKQQATWKE D A  AEDR T+DFTGS+DGEEFEGG
Sbjct  121  ESIEVEKPVVEVNDADVDTMLETLRKQQATWKETDAAATAEDRATLDFTGSIDGEEFEGG  180

Query  181  KASDFVLAMGQGRMIPGFEDGIKGHKAGEEFTIDVTFPEEYHAENLKGKAAKFAINLKKV  240
            KA+DFVLAMGQGRMIPGFE+G+ GHKAGEEFTIDV FPE+YHAENLKGK+AKFAI LKKV
Sbjct  181  KATDFVLAMGQGRMIPGFEEGVIGHKAGEEFTIDVNFPEDYHAENLKGKSAKFAIVLKKV  240

Query  241  EERELPELTAEFIKRFGVEDGSVEGLRAEVRKNMERELKSAIRNRVKSQAIEGLVKANDI  300
            E RELPELT EFIKRFGV DGS+ GLRAEVRKNMERELK A+RNRVK+QAI+GLV AN+I
Sbjct  241  EVRELPELTEEFIKRFGVADGSLAGLRAEVRKNMERELKGAVRNRVKTQAIDGLVSANNI  300

Query  301  DVPAALIDSEIDVLRRQAAQRFGGNEKQALELPRELFEEQAKRRVVVGLLLGEVIRTNEL  360
            DVP AL+D EIDVLRRQAAQRFGGNEKQA ELPRELFEEQAKRRVVVGLLLGEVI  +EL
Sbjct  301  DVPTALVDGEIDVLRRQAAQRFGGNEKQAAELPRELFEEQAKRRVVVGLLLGEVISQHEL  360

Query  361  KADEERVKGLIEEMASAYEDPKEVIEFYSKNKELMDNMRNVALEEQAVEAVLAKAKVTEK  420
            KADE+RVK LIEEMASAYEDP+EVIEFYSKNKELM+NMRNVALEEQAVE +LAKAKVTEK
Sbjct  361  KADEDRVKALIEEMASAYEDPQEVIEFYSKNKELMNNMRNVALEEQAVETLLAKAKVTEK  420

Query  421  ETTFNELMNQ  430
             TTF+ELMNQ
Sbjct  421  PTTFSELMNQ  430

Последовательность белка

Последовательность его гена


2. Построение выравниваний. С помощью программы needle были построены попарные белковое и нуклеотидное выравнивания с параметрами по умолчанию.

ID белкового выравнивания 85.5%, нуклеотидного - 81.0%

Гэпов в белковом выравнивании - 0.5%, в нуклеотидном - 2.3%


Хотя долу гэпов (2,3%) можно считать небольшой, при построении нуклеотидного выравнивания я попробовала изменить параметры needle, в результате было получено выравнивания с ID- 80.8, и долей гэпов - 0.6% .

Полученное нуклеотидное выравнивание

3. Построение нуклеотидного выравнивания с разбивкой на кодоны.

Программа PAL2NAL.


Это программа, преобразующая множественное выравнивание последовательностей белков и соответствующих ДНК (или мРНК) в кодоновое выравнивание. Программа автоматически устанавливает соответствующее выравнивание с разбивкой на кодоны даже если поданный на вход последовательность ДНК имеет несоответствия с входной белковой последовательностью, или содержит UTRs,полиадениновые хвосты. Таким образом, с помощью данной программы можно также анализировать последовательности псевдогенов. Полученное выравнивание может быть в дальнейшем использовано для подсчёта числа синонимичных (Кs) и несинонимичных (Ka) замен на 1 сайт.

С помощью PAL2NAL было получено выравнивание сравниваемых генов с разбивкой на кодоны.
                              M   Q   V   S   V   E   T   T   Q   G   L   G   R   R   V   T   I   T   I   A
swissprot|P0A850|TIG_ECOLI    atg caa gtt tca gtt gaa acc act caa ggc ctt ggc cgc cgt gta acg att act atc gct
                              M   Q   V   S   V   E   T   T   Q   G   L   G   R   R   V   T   I   T   V   A
swissprot|Q8ZC64|TIG_YERPE    atg caa gtt tct gtt gaa acc act caa ggc ctt ggc cgc cgt gta aca att act gtt gct

                              A   D   S   I   E   T   A   V   K   S   E   L   V   N   V   A   K   K   V   R
swissprot|P0A850|TIG_ECOLI    gct gac agc atc gag acc gct gtt aaa agc gag ctg gtc aac gtt gcg aaa aaa gta cgt
                              A   D   S   I   E   K   A   V   K   S   E   L   V   K   A   A   K   N   V   R
swissprot|Q8ZC64|TIG_YERPE    gct gac agc att gag aaa gca gta aaa agt gaa tta gtt aaa gcc gct aaa aat gtt cgt

                              I   D   G   F   R   K   G   K   V   P   M   N   I   V   A   Q   R   Y   G   A
swissprot|P0A850|TIG_ECOLI    att gac ggc ttc cgc aaa ggc aaa gtg cca atg aat atc gtt gct cag cgt tat ggc gcg
                              I   D   G   F   R   K   G   H   V   P   M   N   I   V   E   Q   R   Y   G   A
swissprot|Q8ZC64|TIG_YERPE    atc gac ggt ttc cgc aaa ggc cat gtg ccg atg aat atc gtt gaa cag cgt tac ggc gcc

                              S   V   R   Q   D   V   L   G   D   L   M   S   R   N   F   I   D   A   I   I
swissprot|P0A850|TIG_ECOLI    tct gta cgc cag gac gtt ctg ggt gac ctg atg agc cgt aac ttc att gac gcc atc att
                              S   V   R   Q   D   V   L   G   D   L   M   Q   R   N   F   V   D   A   I   I
swissprot|Q8ZC64|TIG_YERPE    tca gta cgt caa gat gta ctg ggt gat ctg atg caa cgt aat ttc gtt gat gcg atc atc

                              K   E   K   I   N   P   A   G   A   P   T   Y   V   P   G   E   Y   K   L   G
swissprot|P0A850|TIG_ECOLI    aaa gaa aaa atc aat ccg gct ggc gca ccg act tat gtt ccg ggc gaa tac aag ctg ggt
                              K   E   K   I   N   P   A   G   A   P   N   Y   V   P   G   E   Y   K   Q   G
swissprot|Q8ZC64|TIG_YERPE    aaa gaa aaa atc aat cca gct ggc gcg cca aac tac gtg ccc ggt gag tat aag cag ggt

                              E   D   F   T   Y   S   V   E   F   E   V   Y   P   E   V   E   L   Q   G   L
swissprot|P0A850|TIG_ECOLI    gaa gac ttc act tac tct gta gag ttt gaa gtt tat ccg gaa gtt gaa ctc gag ggt ctg
                              E   D   F   T   Y   S   V   E   F   E   V   Y   P   E   V   E   L   K   D   L
swissprot|Q8ZC64|TIG_YERPE    gaa gat ttt act tat tct gtc gag ttc gaa gtg tat cca gaa gtg gaa ctg aaa gat ctg

                              E   A   I   E   V   E   K   P   I   V   E   V   T   D   A   D   V   D   G   M
swissprot|P0A850|TIG_ECOLI    gaa gcg atc gaa gtt gaa aaa ccg atc gtt gaa gtg acc gac gct gac gtt gac ggc atg
                              E   S   I   E   V   E   K   P   V   V   E   V   N   D   A   D   V   D   T   M
swissprot|Q8ZC64|TIG_YERPE    gaa agc att gaa gtt gag aag cca gtt gtt gaa gtt aac gac gct gac gtt gat acc atg

                              L   D   T   L   R   K   Q   Q   A   T   W   K   E   K   D   G   A   V   E   A
swissprot|P0A850|TIG_ECOLI    ctg gat act ctg cgt aaa cag cag gcg acc tgg aaa gaa aaa gac ggc gct gtt gaa gca
                              L   E   T   L   R   K   Q   Q   A   T   W   K   E   T   D   A   A   A   T   A
swissprot|Q8ZC64|TIG_YERPE    ctg gaa aca ctg cgt aag caa caa gct acc tgg aaa gaa acc gac gct gca gca acg gct

                              E   D   R   V   T   I   D   F   T   G   S   V   D   G   E   E   F   E   G   G
swissprot|P0A850|TIG_ECOLI    gaa gac cgc gta acc atc gac ttc acc ggt tct gta gac ggc gaa gag ttc gaa ggc ggt
                              E   D   R   A   T   L   D   F   T   G   S   I   D   G   E   E   F   E   G   G
swissprot|Q8ZC64|TIG_YERPE    gaa gac cgc gcg act ctg gat ttc acc ggc tct atc gat ggt gaa gaa ttt gaa ggc ggt

                              K   A   S   D   F   V   L   A   M   G   Q   G   R   M   I   P   G   F   E   D
swissprot|P0A850|TIG_ECOLI    aaa gcg tct gat ttc gta ctg gcg atg ggc cag ggt cgt atg atc ccg ggc ttt gaa gac
                              K   A   T   D   F   V   L   A   M   G   Q   G   R   M   I   P   G   F   E   E
swissprot|Q8ZC64|TIG_YERPE    aaa gcg act gat ttc gtg ctg gca atg ggg cag ggc cgt atg atc cct ggt ttc gaa gaa

                              G   I   K   G   H   K   A   G   E   E   F   T   I   D   V   T   F   P   E   E
swissprot|P0A850|TIG_ECOLI    ggt atc aaa ggc cac aaa gct ggc gaa gag ttc acc atc gac gtg acc ttc ccg gaa gaa
                              G   V   I   G   H   K   A   G   E   E   F   T   I   D   V   N   F   P   E   D
swissprot|Q8ZC64|TIG_YERPE    ggt gtt atc ggc cac aag gcc ggt gaa gaa ttc acc atc gac gta aac ttc cca gaa gat

                              Y   H   A   E   N   L   K   G   K   A   A   K   F   A   I   N   L   K   K   V
swissprot|P0A850|TIG_ECOLI    tac cac gca gaa aac ctg aaa ggt aaa gca gcg aaa ttc gct atc aac ctg aag aaa gtt
                              Y   H   A   E   N   L   K   G   K   S   A   K   F   A   I   V   L   K   K   V
swissprot|Q8ZC64|TIG_YERPE    tac cac gca gaa aat ctg aaa ggt aaa tca gct aaa ttc gcc atc gtg ctg aag aaa gtt

                              E   E   R   E   L   P   E   L   T   A   E   F   I   K   R   F   G   V   E   D
swissprot|P0A850|TIG_ECOLI    gaa gag cgt gaa ctg ccg gaa ctg act gca gaa ttc atc aaa cgt ttc ggc gtt gaa gat
                              E   V   R   E   L   P   E   L   T   E   E   F   I   K   R   F   G   V   A   D
swissprot|Q8ZC64|TIG_YERPE    gaa gtt cgc gaa ctg cca gaa ctg act gaa gaa ttt atc aaa cgt ttt ggt gtt gct gat

                              G   S   V   E   G   L   R   A   E   V   R   K   N   M   E   R   E   L   K   S
swissprot|P0A850|TIG_ECOLI    ggt tcc gta gaa ggt ctg cgc gct gaa gtg cgt aaa aac atg gag cgc gag ctg aga gcg
                              G   S   L   A   G   L   R   A   E   V   R   K   N   M   E   R   E   L   K   G
swissprot|Q8ZC64|TIG_YERPE    ggt tca ttg gca ggt ctg cgt gct gaa gtg cgt aaa aat atg gaa cgt gag ctg aaa ggc

                              A   I   R   N   R   V   K   S   Q   A   I   E   G   L   V   K   A   N   D   I
swissprot|P0A850|TIG_ECOLI    cca tcc gta acc gcg tta agt tct cag gcg atc gaa ggt ctg gta aaa gct aac gac atc
                              A   V   R   N   R   V   K   T   Q   A   I   D   G   L   V   S   A   N   N   I
swissprot|Q8ZC64|TIG_YERPE    gcg gtg cgt aac cgt gtt aaa act cag gca atc gac ggc ttg gtc agc gct aac aat atc

                              D   V   P   A   A   L   I   D   S   E   I   D   V   L   R   R   Q   A   A   Q
swissprot|P0A850|TIG_ECOLI    gac gta ccg gct gcg ctg atc gac agc gaa atc gac gtt ctg cgt cgc cag gct gca cag
                              D   V   P   T   A   L   V   D   G   E   I   D   V   L   R   R   Q   A   A   Q
swissprot|Q8ZC64|TIG_YERPE    gac gtt cca acg gca ctg gtt gat ggc gaa att gat gtt ctg cgt cgt cag gct gca cag

                              R   F   G   G   N   E   K   Q   A   L   E   L   P   R   E   L   F   E   E   Q
swissprot|P0A850|TIG_ECOLI    cgt ttc ggt ggc aac gaa aaa caa gct ctg gaa ctg ccg cgc gaa ctg ttc gaa gaa cag
                              R   F   G   G   N   E   K   Q   A   A   E   L   P   R   E   L   F   E   E   Q
swissprot|Q8ZC64|TIG_YERPE    cgt ttt ggt ggc aac gag aaa caa gct gct gaa ctg cca cgc gaa ctg ttc gaa gaa caa

                              A   K   R   R   V   V   V   G   L   L   L   G   E   V   I   R   T   N   E   L
swissprot|P0A850|TIG_ECOLI    gct aaa cgc cgc gta gtt gtt ggc ctg ctg ctg ggc gaa gtt atc cgc acc aac gag ctg
                              A   K   R   R   V   V   V   G   L   L   L   G   E   V   I   S   Q   H   E   L
swissprot|Q8ZC64|TIG_YERPE    gct aag cgc cgt gtc gtt gtt ggt ctg ctg ttg ggc gaa gtg atc agc cag cat gag ctg

                              K   A   D   E   E   R   V   K   G   L   I   E   E   M   A   S   A   Y   E   D
swissprot|P0A850|TIG_ECOLI    aaa gct gac gaa gag cgc gtg aaa ggc ctg atc gaa gag atg gct tct gcg tac gaa gat
                              K   A   D   E   D   R   V   K   A   L   I   E   E   M   A   S   A   Y   E   D
swissprot|Q8ZC64|TIG_YERPE    aaa gca gat gaa gat cgt gtt aag gct ctg atc gaa gaa atg gca tct gct tac gaa gat

                              P   K   E   V   I   E   F   Y   S   K   N   K   E   L   M   D   N   M   R   N
swissprot|P0A850|TIG_ECOLI    ccg aaa gaa gtt atc gag ttc tac agc aaa aac aaa gaa ctg atg gac aac atg cgc aat
                              P   Q   E   V   I   E   F   Y   S   K   N   K   E   L   M   N   N   M   R   N
swissprot|Q8ZC64|TIG_YERPE    cca caa gaa gtg att gag ttc tac agc aag aat aaa gag ctg atg aat aat atg cgt aat

                              V   A   L   E   E   Q   A   V   E   A   V   L   A   K   A   K   V   T   E   K
swissprot|P0A850|TIG_ECOLI    gtt gct ctg gaa gaa cag gct gtt gaa gct gta ctg gcg aaa gcg aaa gtg act gaa aaa
                              V   A   L   E   E   Q   A   V   E   T   L   L   A   K   A   K   V   T   E   K
swissprot|Q8ZC64|TIG_YERPE    gtt gct ctg gaa gag cag gca gtg gaa acg ctg ctg gct aaa gcc aaa gta act gaa aaa

                              E   T   T   F   N   E   L   M   N   Q   Q   A
swissprot|P0A850|TIG_ECOLI    gaa acc act ttc aac gag ctg atg aac cag cag gcg
                              P   T   T   F   S   E   L   M   N   Q   T   T   A   A
swissprot|Q8ZC64|TIG_YERPE    cca acg act ttc agt gag ctg atg aat cag acc act


Сравнивая данное выравнивание с полученным ранее нуклеотидным, видно, что выравнивание, полученное программой PAL2NAL лучше.

4. С помощью PAL2NAL были получены значения Ka/Ks для сравниваемых генов


Для этого в пункте "Remove gaps, inframe stop codons" отмечаем "Yes" и далее в "Calculate KS and KA" тоже отмечаем "Yes". В "Output format" выбираем "FASTA"

KS = 1.0240 
KA = 0.0988 
KA/KS = 0.0965 
На основании полученных данных (KA/KS = 0.0965 <1) можно сделать вывод о том, что в данном случае отбор стабилизирующий.