| Московский Государственный Университет имени М.В.Ломоносова Факультет Биоинженерии и Биоинформатики Учебный сайт Сеферяна Мелика |
|---|
|
Полезные ссылки |
Программа BLASTP.I. Поиск гипотетических гомологов белка RISA_ECOLI в разных БД.
Данный белок удалось найти во всех трех банках данных. Параметры выравнивания изучаемого белка с самим собой при поиске по разным БД никак не отличаются (кроме Evalue - оно различно для разных БД, так как зависит от количества информации, содержащейся в них). Самый большой по объему банк данных - nr (некурируемый), затем SwissProt (курируемый), и самый маленький - PDB (3D-структура). Число потенциальных гомологов уменьшается в этом ряду. Худшие находки не совпадают, так как БД по которым производился поиск совершенно необязательно должны содержать в себе одну и ту же последовательность. То есть не каждую последовательность аннотируют и тем более находят для нее третичную структуру. Из этих "худших" находок лучшей, несомненно является LUXP_PHOLE, так как Evalue = 7e-16 позволяет нам сделать вывод о его гомологии с RISA_ECOLI. Не могу не упомянуть одну очень интересную находку, а именно LUXY_VIBFI - Желтый флуоресцентный белок бактерии Vibrio fischeri. Evalue = 2e-17 (!). Поэтому вывод такой: гомологи не всегда выполняют сходные функции. II. Поиск гипотетических гомологов изучаемого белка с фильтром по таксонам.Первый полученный гомолог (с Evalue < 0.001) - RISA_MYCTU был найден среди организмов таксона Actinobacteria.
III. Поиск белка по его фрагменту.>seq2 GHLLSGHVFGTAEIFLIKENRДанный фрагмент относится к белку RISA_CHLPN.
Выравнивание, построенное программой BLASTP (Query = RISA_CHLPN, Sbjct = RISA_ECOLI): Фрагмент выровненный в пробном выравнивании помечен (*)
Score = 164 bits (414), Expect = 3e-40, Method: Compositional matrix adjust.
Identities = 93/201 (46%), Positives = 128/201 (63%), Gaps = 5/201 (2%)
Query 1 MFSGIIQELGEVCFFEAQGNGLSLGIKSTPLFVTPLVTGDSVAVDGVCLTLTSCNESKIF 60
MF+GI+Q ++ + + N + ++ + L TG SVA +G CLT+T N + +
Sbjct 1 MFTGIVQGTAKLVSIDEKPNFRTHVVELPDHMLDGLETGASVAHNGCCLTVTEINGNHVS 60
************** ****** *
Query 61 FDVIPETLACTTLGEKRCSDQVNLEAALKMGDSIGGHLLSGHVFGTAEI--FLIKEN--R 116
FD++ ETL T LG+ + D VN+E A K D IGGHL+SGH+ TAE+ L EN +
Sbjct 61 FDLMKETLRITNLGDLKVGDWVNVERAAKFSDEIGGHLMSGHIMTTAEVAKILTSENNRQ 120
Query 117 YYFR-GSKELSQYLFEKGFIAIDGISLTLVSVDSDTFSVGLIPETLQRTTLGKKREGERV 175
+F+ +L +Y+ KGFI IDGISLT+ V F V LIPETL+RTTLGKK+ G RV
Sbjct 121 IWFKVQDSQLMKYILYKGFIGIDGISLTVGEVTPTRFCVHLIPETLERTTLGKKKLGARV 180
Query 176 NIEIDMSTKIQVDTVKRILAS 196
NIEID T+ VDTV+R+LA+
Sbjct 181 NIEIDPQTQAVVDTVERVLAA 201
Сравним его с полученными вручную выравниваниями:
Query 95 GHLLSGHVFGTAEI--FLIKEN--R 116
GHL+SGH+ TAE+ L EN +
Sbjct 95 GHLMSGHIMTTAEVAKILTSENNRQ 120
IV. Сравнение выравниваний, выданных программой BLASTP, с оптимальными глобальным и локальным выравниваниями.В построенных выравниваниях штраф за создание гэпа был 11, за удлинение - 1.1) Оптимальное глобальное выравнивание последовательностей белков RISA_CHLPN и RISA_ECOLI.
#=======================================
#
# Aligned_sequences: 2
# 1: RISA_CHLPN
# 2: RISA_ECOLI
# Matrix: EBLOSUM62
# Gap_penalty: 11.0
# Extend_penalty: 1.0
#
# Length: 213
# Identity: 93/213 (43.7%)
# Similarity: 128/213 (60.1%)
# Gaps: 13/213 ( 6.1%)
# Score: 407.0
#
#
#=======================================
RISA_CHLPN 1 MFSGIIQELGEVCFFEAQGNGLSLGIKSTPLFVTPLVTGDSVAVDGVCLT 50
||:||:|...::...:.:.|..:..::.....:..|.||.|||.:|.|||
RISA_ECOLI 1 MFTGIVQGTAKLVSIDEKPNFRTHVVELPDHMLDGLETGASVAHNGCCLT 50
RISA_CHLPN 51 LTSCNESKIFFDVIPETLACTTLGEKRCSDQVNLEAALKMGDSIGGHLLS 100
:|..|.:.:.||::.|||..|.||:.:..|.||:|.|.|..|.|||||:|
RISA_ECOLI 51 VTEINGNHVSFDLMKETLRITNLGDLKVGDWVNVERAAKFSDEIGGHLMS 100
RISA_CHLPN 101 GHVFGTAEI--FLIKEN--RYYFR-GSKELSQYLFEKGFIAIDGISLTLV 145
||:..|||: .|..|| :.:|: ...:|.:|:..||||.|||||||:.
RISA_ECOLI 101 GHIMTTAEVAKILTSENNRQIWFKVQDSQLMKYILYKGFIGIDGISLTVG 150
RISA_CHLPN 146 SVDSDTFSVGLIPETLQRTTLGKKREGERVNIEIDMSTKIQVDTVKRILA 195
.|....|.|.||||||:|||||||:.|.|||||||..|:..||||:|:||
RISA_ECOLI 151 EVTPTRFCVHLIPETLERTTLGKKKLGARVNIEIDPQTQAVVDTVERVLA 200
RISA_CHLPN 196 SSGKD-------- 200
:....
RISA_ECOLI 201 ARENAMNQPGTEA 213
2) Оптимальное локальное выравнивание последовательностей белков RISA_CHLPN и RISA_ECOLI.
#=======================================
#
# Aligned_sequences: 2
# 1: RISA_CHLPN
# 2: RISA_ECOLI
# Matrix: EBLOSUM62
# Gap_penalty: 11.0
# Extend_penalty: 1.0
#
# Length: 201
# Identity: 93/201 (46.3%)
# Similarity: 128/201 (63.7%)
# Gaps: 5/201 ( 2.5%)
# Score: 412.0
#
#
#=======================================
RISA_CHLPN 1 MFSGIIQELGEVCFFEAQGNGLSLGIKSTPLFVTPLVTGDSVAVDGVCLT 50
||:||:|...::...:.:.|..:..::.....:..|.||.|||.:|.|||
RISA_ECOLI 1 MFTGIVQGTAKLVSIDEKPNFRTHVVELPDHMLDGLETGASVAHNGCCLT 50
RISA_CHLPN 51 LTSCNESKIFFDVIPETLACTTLGEKRCSDQVNLEAALKMGDSIGGHLLS 100
:|..|.:.:.||::.|||..|.||:.:..|.||:|.|.|..|.|||||:|
RISA_ECOLI 51 VTEINGNHVSFDLMKETLRITNLGDLKVGDWVNVERAAKFSDEIGGHLMS 100
RISA_CHLPN 101 GHVFGTAEI--FLIKEN--RYYFR-GSKELSQYLFEKGFIAIDGISLTLV 145
||:..|||: .|..|| :.:|: ...:|.:|:..||||.|||||||:.
RISA_ECOLI 101 GHIMTTAEVAKILTSENNRQIWFKVQDSQLMKYILYKGFIGIDGISLTVG 150
RISA_CHLPN 146 SVDSDTFSVGLIPETLQRTTLGKKREGERVNIEIDMSTKIQVDTVKRILA 195
.|....|.|.||||||:|||||||:.|.|||||||..|:..||||:|:||
RISA_ECOLI 151 EVTPTRFCVHLIPETLERTTLGKKKLGARVNIEIDPQTQAVVDTVERVLA 200
RISA_CHLPN 196 S 196
:
RISA_ECOLI 201 A 201
3) Выравнивание, полученное программой BLASTP:
Score = 164 bits (414), Expect = 3e-40, Method: Compositional matrix adjust.
Identities = 93/201 (46%), Positives = 128/201 (63%), Gaps = 5/201 (2%)
Query 1 MFSGIIQELGEVCFFEAQGNGLSLGIKSTPLFVTPLVTGDSVAVDGVCLTLTSCNESKIF 60
MF+GI+Q ++ + + N + ++ + L TG SVA +G CLT+T N + +
Sbjct 1 MFTGIVQGTAKLVSIDEKPNFRTHVVELPDHMLDGLETGASVAHNGCCLTVTEINGNHVS 60
************** ****** *
Query 61 FDVIPETLACTTLGEKRCSDQVNLEAALKMGDSIGGHLLSGHVFGTAEI--FLIKEN--R 116
FD++ ETL T LG+ + D VN+E A K D IGGHL+SGH+ TAE+ L EN +
Sbjct 61 FDLMKETLRITNLGDLKVGDWVNVERAAKFSDEIGGHLMSGHIMTTAEVAKILTSENNRQ 120
Query 117 YYFR-GSKELSQYLFEKGFIAIDGISLTLVSVDSDTFSVGLIPETLQRTTLGKKREGERV 175
+F+ +L +Y+ KGFI IDGISLT+ V F V LIPETL+RTTLGKK+ G RV
Sbjct 121 IWFKVQDSQLMKYILYKGFIGIDGISLTVGEVTPTRFCVHLIPETLERTTLGKKKLGARV 180
Query 176 NIEIDMSTKIQVDTVKRILAS 196
NIEID T+ VDTV+R+LA+
Sbjct 181 NIEIDPQTQAVVDTVERVLAA 201
Локальное выравнивание абсолютно точно совпадает с построенным BLASTP, а глобальное содержит его в себе без каких либо изменений. Замечу, что для идентичных выравниваний, полученных с помощью BLASTP и water получились разные значения веса выравнивания, хотя штрафы за гэпы были одинаковыми. Вероятно это связано с отличиями в алгоритмах этих программ относительно учета этих штрафов. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||