| Поиск по БД Swiss-Prot | Поиск по БД PDB | Поиск по БД "nr" | |
| 1. Лучшая находка (в принципе должна соответствовать заданному белку) | |||
| Идентификатор БД | PSTS_ECOLI | 2ABH | NP_418184 |
| E-value | 0.0 | 0.0 | 0.0 |
| Вес (в битах) | 697 | 647 | 697 |
| % идентичности | 100 | 100 | 100 |
| Найдены ли другие белки с теми же значениями E-value и веса в битах? Если найдены, то укажите общее число и приведите один идентификатор (любой, но желательно Swiss-Prot ID) |
не найдены | не найдены с точно таким весом, но еще 9 с E-value=0.0(идентификатор psts_Ecoli, вес 643) | не найдены с точно таким весом, но еще 25 с E-value=0.0(идентификатор YP_691097, вес 696) |
| Сколько хороших кандидатов в гомологи найдено? (число находок в списке описаний, Descriptions, с E-value<=1*10-10) | 14 | 12 | 547 |
| 2. "Худшая" находка (последняя в выдаче с E-value<=1.0) | |||
| Номер находки в списке описаний (Descriptions) | 27 | 16 | 879 |
| Идентификатор БД | PHBP_HUMAN | 2CAP | YP_001785723 |
| E-value | 0.095 | 0.012 | 0.99 |
| Вес (в битах) | 37.7 | 36.6 | 38.5 |
| % идентичности | 29 | 28 | 25 |
| % сходства | 40 | 39 | 40 |
| Длина выравнивания | 175 | 168 | 238 |
| Координаты выравнивания (номера первых и последних а.о.) | 29-180 | 29-174 | 33-251 |
| % гэпов | 21 | 22 | 18 |
Первое, в выравнивании не участвует сигнальный пептид;
Второе, есть замена аланина 197 на триптофан, которая в последовательность этого белка в других банках не внесена.
Поиск по таксону Homo sapiens не дал результатов
Таксон: Archaea
Гипотетический гомолог
Таксон: Actinobacteria
Гипотетический гомолог
Таксон: Alteromonadales
Гипотетический гомолог не найден
Таксон: Vibrionaceae
В БД Swiss-Prot поиск результатов не дал
| Поиск по фрагменту | Поиск по полной последовательности |
|
| АС лучшей находки | Q58421 | Q58421 |
| E-value | 4*10-18 | 0.0 |
| Вес (в битах) | 88 | 788 |
| Найдены ли другие белки с теми же значениями E-value и веса в битах? |
нет | нет |
Краткий комментарий
Различия между результатами поиска по фрагменту последовательности и по полной последовательности заключаются,
как можно заметить по данным из таблицы, в разнице E-value и веса, что основано на том, что фрагмент последовательности
значительно короче самой последовательности, что делает невозможным даже при полном совпадении сказать, что это одна и та же последовательность или ее гомолог.
В задании на странице Пробные выравнивания был дан фрагмент неизвестного белка. Теперь мы можем с помощью поиска по Swiss-Prot
определить последовательность белка и сам белок.
В результате определили, что фрагмент взят из белка PSTS_METJA (идентификатор PSTS_METJA, код доступа Q58421), его последовательность в fasta-формате.
PSTS_ECOLI 33 GATFPAPVYAKWADTYQKETGN-KVNYQGIGSSGGVKQIIANTVDFGASDAPLSD---EK 88
GATFP KW + YQK N K+ Y+G GS G + D G +D P+ + +K
PSTS_METJA 58 GATFPKYQIQKWIEDYQKTHPNVKIEYEGGGSGYGQEAFAKGLTDIGRTDPPVKESMWKK 117
PSTS_ECOLI 89 LAQEG--LFQFPTVIGGVVLAVNIPGLKSGELVLDGKTLGDIYLGKIKKWDDEAIAKLNP 146
G QFP ++G VV+ NIP + L L L DI+LGKI+ WDDE I K+NP
PSTS_METJA 118 FLSTGDQPLQFPEIVGAVVVTYNIPEIGDKTLKLSRDVLADIFLGKIEYWDDERIKKINP 177
PSTS_ECOLI 147 GL--KLPSQNIAVVRRADGSGTSFVFTSYLAKVNEEWKNNVGTGSTVKWPI-----GLGG 199
+ KLP + I VV R+D SGT+ +FT+YL+ +++EW VG G TV WP G+ G
PSTS_METJA 178 EIADKLPHEKIIVVHRSDASGTTAIFTTYLSLISKEWAEKVGAGKTVNWPTDNIGRGVAG 237
PSTS_ECOLI 200 KGNDGIAAFVQRLPGAIGYVEYAYAKQNNLAYTKLISADGKPVSPTEENFANAAKGADWS 259
KGN G+ A V+ P + Y E +YA + L L + +GK V PT+E A S
PSTS_METJA 238 KGNPGVVAIVKSTPYTVAYTELSYAIEQKLPVAALENKNGKFVKPTDETIKAAVSAVKAS 297
PSTS_ECOLI 260 -----KTFAQDL---TNQKGEDAWPITSTTFILIHKDQK----KPEQGTEVLKFFDWAYK 307
+ + +DL + G++A+PI + T +L+ +++ PE+ + F W
PSTS_METJA 298 IPNPTEGYKEDLKQMLDAPGDNAYPIVAFTHLLVWENKNGKHYSPEKAKAIKDFLTWVLT 357
PSTS_ECOLI 308 TGAKQANDLD-YASLPDSV 325
G K + Y LP+ V
PSTS_METJA 358 EGQKPEHLAPGYVGLPEDV 376
В прошлом задании с помощью GeneDoc были сравнены фрагменты 218-245 белка PSTS_METJA и фрагмент 185-209 белка PSTS_ECOLI. Это выравнивание совпало с одним из сделанных мною выравниваний, точнее со вторым. Отсюда можно сделать вывод, что несмотря на одинаковый вес выравнивание то лучше, где открытий гэпов меньше.
Оптимальное глобальное выравнивание
10 20
PSTS_E MK---------VMRTTVATVVAATLSMSAFSVF----------------A
: .. .: .. : . :. .
PSTS_M MNDTTQPTKGDAVKKILALILGLCLIVPVISIAGCVGGGNSQPSNNEKPS
10 20 30 40 50
30 40 50 60 70
PSTS_E EASLTGAGATFPAPVYAKWADTYQKETGN-KVNYQGIGSSGGVKQIIANT
. ::::: :: . ::: : :. :.: :: : .
PSTS_M TIIIRTTGATFPKYQIQKWIEDYQKTHPNVKIEYEGGGSGYGQEAFAKGL
60 70 80 90 100
80 90 100 110
PSTS_E VDFGASDAPLSD---EKLAQEG--LFQFPTVIGGVVLAVNIPGLKSGELV
: : .: :. . .: : ::: ..: ::. ::: . :
PSTS_M TDIGRTDPPVKESMWKKFLSTGDQPLQFPEIVGAVVVTYNIPEIGDKTLK
110 120 130 140 150
120 130 140 150 160
PSTS_E LDGKTLGDIYLGKIKKWDDEAIAKLNPGL--KLPSQNIAVVRRADGSGTS
: : ::.::::. :::: : :.:: . ::: . : :: :.: :::.
PSTS_M LSRDVLADIFLGKIEYWDDERIKKINPEIADKLPHEKIIVVHRSDASGTT
160 170 180 190 200
170 180 190 200 210
PSTS_E FVFTSYLAKVNEEWKNNVGTGSTVKWPI-----GLGGKGNDGIAAFVQRL
.::.::. ...:: :: : :: :: :. :::: :. : :.
PSTS_M AIFTTYLSLISKEWAEKVGAGKTVNWPTDNIGRGVAGKGNPGVVAIVKST
210 220 230 240 250
220 230 240 250
PSTS_E PGAIGYVEYAYAKQNNLAYTKLISADGKPVSPTEENFANAAKGADWS---
: . : : .:: . : : . .:: : ::.: : :
PSTS_M PYTVAYTELSYAIEQKLPVAALENKNGKFVKPTDETIKAAVSAVKASIPN
260 270 280 290 300
260 270 280 290 300
PSTS_E --KTFAQDLTNQ---KGEDAWPITSTTFILIHKDQK----KPEQGTEVLK
. . .:: :..:.:: . : .:. ... ::. .
PSTS_M PTEGYKEDLKQMLDAPGDNAYPIVAFTHLLVWENKNGKHYSPEKAKAIKD
310 320 330 340 350
310 320 330 340
PSTS_E FFDWAYKTGAKQANDLD-YASLPDSVVEQVRAAWKTNIKDSSGKPLY
: : : : . : ::. : . . ::.
PSTS_M FLTWVLTEGQKPEHLAPGYVGLPEDVAK-IGLNAVNMIKE-------
360 370 380
Оптимальное локальное выравнивание
40 50 60 70 80
PSTS_E GATFPAPVYAKWADTYQKETGN-KVNYQGIGSSGGVKQIIANTVDFGASD
::::: :: . ::: : :. :.: :: : . : : .:
PSTS_M GATFPKYQIQKWIEDYQKTHPNVKIEYEGGGSGYGQEAFAKGLTDIGRTD
60 70 80 90 100
90 100 110 120
PSTS_E APLSD---EKLAQEG--LFQFPTVIGGVVLAVNIPGLKSGELVLDGKTLG
:. . .: : ::: ..: ::. ::: . : : :
PSTS_M PPVKESMWKKFLSTGDQPLQFPEIVGAVVVTYNIPEIGDKTLKLSRDVLA
110 120 130 140 150
130 140 150 160 170
PSTS_E DIYLGKIKKWDDEAIAKLNPGL--KLPSQNIAVVRRADGSGTSFVFTSYL
::.::::. :::: : :.:: . ::: . : :: :.: :::. .::.::
PSTS_M DIFLGKIEYWDDERIKKINPEIADKLPHEKIIVVHRSDASGTTAIFTTYL
160 170 180 190 200
180 190 200 210
PSTS_E AKVNEEWKNNVGTGSTVKWPI-----GLGGKGNDGIAAFVQRLPGAIGYV
. ...:: :: : :: :: :. :::: :. : :. : . :
PSTS_M SLISKEWAEKVGAGKTVNWPTDNIGRGVAGKGNPGVVAIVKSTPYTVAYT
210 220 230 240 250
220 230 240 250 260
PSTS_E EYAYAKQNNLAYTKLISADGKPVSPTEENFANAAKGADWS-----KTFAQ
: .:: . : : . .:: : ::.: : : . . .
PSTS_M ELSYAIEQKLPVAALENKNGKFVKPTDETIKAAVSAVKASIPNPTEGYKE
260 270 280 290 300
270 280 290 300
PSTS_E DLTNQ---KGEDAWPITSTTFILIHKDQK----KPEQGTEVLKFFDWAYK
:: :..:.:: . : .:. ... ::. . : :
PSTS_M DLKQMLDAPGDNAYPIVAFTHLLVWENKNGKHYSPEKAKAIKDFLTWVLT
310 320 330 340 350
310 320
PSTS_E TGAKQANDLD-YASLPDSVVE
: : . : ::. : .
PSTS_M EGQKPEHLAPGYVGLPEDVAK
360 370
| Выравнивание, выданное BLASTP | Оптимальное глобальное выравнивание, Stretcher | Оптимальное локальное выравнивание, Matcher | |
| Вес | 431 | 431 | 487 |
| Длина | 319 | 397 | 321 |
| Идентичность, % | 35 | 30.2 | 35.5 |
| Сходство, % | 51 | 45.8 | 51.4 |
Результаты выравниваний очень похожи, несмотря на такое различие, показанное в таблице.