Московский Государственный Университет имени М.В.Ломоносова Факультет Биоинженерии и Биоинформатики Учебный сайт Сеферяна Мелика |
---|
Полезные ссылки |
Программа BLASTP.I. Поиск гипотетических гомологов белка RISA_ECOLI в разных БД.
Данный белок удалось найти во всех трех банках данных. Параметры выравнивания изучаемого белка с самим собой при поиске по разным БД никак не отличаются (кроме Evalue - оно различно для разных БД, так как зависит от количества информации, содержащейся в них). Самый большой по объему банк данных - nr (некурируемый), затем SwissProt (курируемый), и самый маленький - PDB (3D-структура). Число потенциальных гомологов уменьшается в этом ряду. Худшие находки не совпадают, так как БД по которым производился поиск совершенно необязательно должны содержать в себе одну и ту же последовательность. То есть не каждую последовательность аннотируют и тем более находят для нее третичную структуру. Из этих "худших" находок лучшей, несомненно является LUXP_PHOLE, так как Evalue = 7e-16 позволяет нам сделать вывод о его гомологии с RISA_ECOLI. Не могу не упомянуть одну очень интересную находку, а именно LUXY_VIBFI - Желтый флуоресцентный белок бактерии Vibrio fischeri. Evalue = 2e-17 (!). Поэтому вывод такой: гомологи не всегда выполняют сходные функции. II. Поиск гипотетических гомологов изучаемого белка с фильтром по таксонам.Первый полученный гомолог (с Evalue < 0.001) - RISA_MYCTU был найден среди организмов таксона Actinobacteria.
III. Поиск белка по его фрагменту.>seq2 GHLLSGHVFGTAEIFLIKENRДанный фрагмент относится к белку RISA_CHLPN.
Выравнивание, построенное программой BLASTP (Query = RISA_CHLPN, Sbjct = RISA_ECOLI): Фрагмент выровненный в пробном выравнивании помечен (*) Score = 164 bits (414), Expect = 3e-40, Method: Compositional matrix adjust. Identities = 93/201 (46%), Positives = 128/201 (63%), Gaps = 5/201 (2%) Query 1 MFSGIIQELGEVCFFEAQGNGLSLGIKSTPLFVTPLVTGDSVAVDGVCLTLTSCNESKIF 60 MF+GI+Q ++ + + N + ++ + L TG SVA +G CLT+T N + + Sbjct 1 MFTGIVQGTAKLVSIDEKPNFRTHVVELPDHMLDGLETGASVAHNGCCLTVTEINGNHVS 60 ************** ****** * Query 61 FDVIPETLACTTLGEKRCSDQVNLEAALKMGDSIGGHLLSGHVFGTAEI--FLIKEN--R 116 FD++ ETL T LG+ + D VN+E A K D IGGHL+SGH+ TAE+ L EN + Sbjct 61 FDLMKETLRITNLGDLKVGDWVNVERAAKFSDEIGGHLMSGHIMTTAEVAKILTSENNRQ 120 Query 117 YYFR-GSKELSQYLFEKGFIAIDGISLTLVSVDSDTFSVGLIPETLQRTTLGKKREGERV 175 +F+ +L +Y+ KGFI IDGISLT+ V F V LIPETL+RTTLGKK+ G RV Sbjct 121 IWFKVQDSQLMKYILYKGFIGIDGISLTVGEVTPTRFCVHLIPETLERTTLGKKKLGARV 180 Query 176 NIEIDMSTKIQVDTVKRILAS 196 NIEID T+ VDTV+R+LA+ Sbjct 181 NIEIDPQTQAVVDTVERVLAA 201Сравним его с полученными вручную выравниваниями: Query 95 GHLLSGHVFGTAEI--FLIKEN--R 116 GHL+SGH+ TAE+ L EN + Sbjct 95 GHLMSGHIMTTAEVAKILTSENNRQ 120 IV. Сравнение выравниваний, выданных программой BLASTP, с оптимальными глобальным и локальным выравниваниями.В построенных выравниваниях штраф за создание гэпа был 11, за удлинение - 1.1) Оптимальное глобальное выравнивание последовательностей белков RISA_CHLPN и RISA_ECOLI. #======================================= # # Aligned_sequences: 2 # 1: RISA_CHLPN # 2: RISA_ECOLI # Matrix: EBLOSUM62 # Gap_penalty: 11.0 # Extend_penalty: 1.0 # # Length: 213 # Identity: 93/213 (43.7%) # Similarity: 128/213 (60.1%) # Gaps: 13/213 ( 6.1%) # Score: 407.0 # # #======================================= RISA_CHLPN 1 MFSGIIQELGEVCFFEAQGNGLSLGIKSTPLFVTPLVTGDSVAVDGVCLT 50 ||:||:|...::...:.:.|..:..::.....:..|.||.|||.:|.||| RISA_ECOLI 1 MFTGIVQGTAKLVSIDEKPNFRTHVVELPDHMLDGLETGASVAHNGCCLT 50 RISA_CHLPN 51 LTSCNESKIFFDVIPETLACTTLGEKRCSDQVNLEAALKMGDSIGGHLLS 100 :|..|.:.:.||::.|||..|.||:.:..|.||:|.|.|..|.|||||:| RISA_ECOLI 51 VTEINGNHVSFDLMKETLRITNLGDLKVGDWVNVERAAKFSDEIGGHLMS 100 RISA_CHLPN 101 GHVFGTAEI--FLIKEN--RYYFR-GSKELSQYLFEKGFIAIDGISLTLV 145 ||:..|||: .|..|| :.:|: ...:|.:|:..||||.|||||||:. RISA_ECOLI 101 GHIMTTAEVAKILTSENNRQIWFKVQDSQLMKYILYKGFIGIDGISLTVG 150 RISA_CHLPN 146 SVDSDTFSVGLIPETLQRTTLGKKREGERVNIEIDMSTKIQVDTVKRILA 195 .|....|.|.||||||:|||||||:.|.|||||||..|:..||||:|:|| RISA_ECOLI 151 EVTPTRFCVHLIPETLERTTLGKKKLGARVNIEIDPQTQAVVDTVERVLA 200 RISA_CHLPN 196 SSGKD-------- 200 :.... RISA_ECOLI 201 ARENAMNQPGTEA 2132) Оптимальное локальное выравнивание последовательностей белков RISA_CHLPN и RISA_ECOLI. #======================================= # # Aligned_sequences: 2 # 1: RISA_CHLPN # 2: RISA_ECOLI # Matrix: EBLOSUM62 # Gap_penalty: 11.0 # Extend_penalty: 1.0 # # Length: 201 # Identity: 93/201 (46.3%) # Similarity: 128/201 (63.7%) # Gaps: 5/201 ( 2.5%) # Score: 412.0 # # #======================================= RISA_CHLPN 1 MFSGIIQELGEVCFFEAQGNGLSLGIKSTPLFVTPLVTGDSVAVDGVCLT 50 ||:||:|...::...:.:.|..:..::.....:..|.||.|||.:|.||| RISA_ECOLI 1 MFTGIVQGTAKLVSIDEKPNFRTHVVELPDHMLDGLETGASVAHNGCCLT 50 RISA_CHLPN 51 LTSCNESKIFFDVIPETLACTTLGEKRCSDQVNLEAALKMGDSIGGHLLS 100 :|..|.:.:.||::.|||..|.||:.:..|.||:|.|.|..|.|||||:| RISA_ECOLI 51 VTEINGNHVSFDLMKETLRITNLGDLKVGDWVNVERAAKFSDEIGGHLMS 100 RISA_CHLPN 101 GHVFGTAEI--FLIKEN--RYYFR-GSKELSQYLFEKGFIAIDGISLTLV 145 ||:..|||: .|..|| :.:|: ...:|.:|:..||||.|||||||:. RISA_ECOLI 101 GHIMTTAEVAKILTSENNRQIWFKVQDSQLMKYILYKGFIGIDGISLTVG 150 RISA_CHLPN 146 SVDSDTFSVGLIPETLQRTTLGKKREGERVNIEIDMSTKIQVDTVKRILA 195 .|....|.|.||||||:|||||||:.|.|||||||..|:..||||:|:|| RISA_ECOLI 151 EVTPTRFCVHLIPETLERTTLGKKKLGARVNIEIDPQTQAVVDTVERVLA 200 RISA_CHLPN 196 S 196 : RISA_ECOLI 201 A 2013) Выравнивание, полученное программой BLASTP: Score = 164 bits (414), Expect = 3e-40, Method: Compositional matrix adjust. Identities = 93/201 (46%), Positives = 128/201 (63%), Gaps = 5/201 (2%) Query 1 MFSGIIQELGEVCFFEAQGNGLSLGIKSTPLFVTPLVTGDSVAVDGVCLTLTSCNESKIF 60 MF+GI+Q ++ + + N + ++ + L TG SVA +G CLT+T N + + Sbjct 1 MFTGIVQGTAKLVSIDEKPNFRTHVVELPDHMLDGLETGASVAHNGCCLTVTEINGNHVS 60 ************** ****** * Query 61 FDVIPETLACTTLGEKRCSDQVNLEAALKMGDSIGGHLLSGHVFGTAEI--FLIKEN--R 116 FD++ ETL T LG+ + D VN+E A K D IGGHL+SGH+ TAE+ L EN + Sbjct 61 FDLMKETLRITNLGDLKVGDWVNVERAAKFSDEIGGHLMSGHIMTTAEVAKILTSENNRQ 120 Query 117 YYFR-GSKELSQYLFEKGFIAIDGISLTLVSVDSDTFSVGLIPETLQRTTLGKKREGERV 175 +F+ +L +Y+ KGFI IDGISLT+ V F V LIPETL+RTTLGKK+ G RV Sbjct 121 IWFKVQDSQLMKYILYKGFIGIDGISLTVGEVTPTRFCVHLIPETLERTTLGKKKLGARV 180 Query 176 NIEIDMSTKIQVDTVKRILAS 196 NIEID T+ VDTV+R+LA+ Sbjct 181 NIEIDPQTQAVVDTVERVLAA 201
Локальное выравнивание абсолютно точно совпадает с построенным BLASTP, а глобальное содержит его в себе без каких либо изменений. Замечу, что для идентичных выравниваний, полученных с помощью BLASTP и water получились разные значения веса выравнивания, хотя штрафы за гэпы были одинаковыми. Вероятно это связано с отличиями в алгоритмах этих программ относительно учета этих штрафов. |