|
Программа BLASTP 1 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Таблица 1. Результаты поиска гипотетических гомологов белка OTC1_ECOLI
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Лучшая находка во всех трех БД соответствовала искомому белку. Во всех трех случаях E-value оказалось одинаковым и равным нулю. Тем не менее вес выравнивания совпал только в SwissProt и nd, в PDB он оказался чуть меньше, так как в файле PDB, соответствующем нашему белку, не быд учтен инициирующий аминокислотный остаток метионин, в отличие от последовательностей в SwissProt и nd. Поэтому выравнивание оказалось короче на единицу. Количество хороших гомологов в разных БД сильно отличается. Самое большое количество результатов - в банке nd, поскольку его объем наибольший: он включает в себя и SwissProt, и PDB, и несколько других БД, поэтому поиск проводился в самых широких масштабах. Меньше всего гомологов обнаружилось в PDB, этот банк содержит информацию о третичных структурах белков, и его объем сравнительно небольшой, т.к. обнаружение третичной структуры - довольно сложный процесс, кроме того, не все белки ее имеют. "Худшие" находки во всех банках также различны, что обусловлено, опять-таки, размерами БД , то есть возможностью сравнения нашего белка с как можно большим числом последовательностей (например, для "худшей" находки в PDB значение E-value на 9 порядков меньше, чем в двух других БД). При подсчете E-value объем банка учитывается. Выберем лучшую находку из "худших". Если считать лучшей находку с минимальным E-value, то, конечно, это будет находка в банке PDB. Для этой находки также максимален вес выравнивания и его длина. А вот процент идентичности больше в SwissProt, но всего лишь на 1%. Тем не менее в выравнивании в PDB наибольший процент гэпов. |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2 Поиск гипотетических гомологов изучаемого белка с фильтром по таксонам |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| При поиске гомологов исследуемого белка в организме Homo sapiens по БД SwissProt было обнаружено два белка, из них меньшее значение E-value имеет белок, описанный в следующей таблице: |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Таблица 2. Свойства выравнивания белка OTC1_ECOLI с его гипотетическим
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Идентификатор БД | P00480 |
| E-value | 1e-50 |
| Вес (в битах) | 197 |
| % идентичности | 37% |
| % сходства | 55% |
| Длина выравнивания | 328 |
| Координаты выравнивания (номера первых и последних а.о.) | В заданном белке 7-333, в найденном 40-343 |
| % гэпов | 7% |
>seq2 ENFGKLEGITLVYCGDGR
| Поиск по фрагменту | Поиск по полной последовательности |
|
| АС лучшей находки | P65606 | P65606 |
| E-value | 6e-10 | 0 |
| Вес (в битах) | 60.9 | 697 |
| Найдены ли другие белки с теми же значениями E-value и веса в битах? |
да, найден один белок (см. выше), его AC: Q8RP83 | не найдены |
Query 5 FQGRSFLAEKDFSREEFEYLIDFSAHLKDLKKRGVPHHYLEGKNIALLFEKTSTRTRAAF 64
F + FL DF+ E L+ +A LK KK G L GKNIAL+FEK STRTR +F
Sbjct 4 FYHKHFLKLLDFTPAELNSLLQLAAKLKADKKSGKEEAKLTGKNIALIFEKDSTRTRCSF 63
Query 65 TTAAIDLGAHPEYLGANDIQLGKKESTEDTAKVLGRMFDGIEFRGFSQRMVEELAEFSGV 124
AA D GA YLG + Q+G KES +DTA+VLGRM+DGI++RG+ Q +VE LAE++ V
Sbjct 64 EVAAYDQGARVTYLGPSGSQIGHKESIKDTARVLGRMYDGIQYRGYGQEIVETLAEYASV 123
Query 125 PVWNGLTDEWHPTQMLADYLTIKENF-GK-LEGITLVYCGDGRNNVANSLLVAGTLMGVN 182
PVWNGLT+E+HPTQ+LAD LT++E+ GK +TLVY GD RNN+ NS+L A L G++
Sbjct 124 PVWNGLTNEFHPTQLLADLLTMQEHLPGKAFNEMTLVYAGDARNNMGNSMLEAAALTGLD 183
Query 183 VHIFSPKELFPAEEIVKLAEEYAKESGAHVLVTDNVDEAVKGADVFYTDVWVSMGE-EDK 241
+ + +P+ +P +V A+++G ++ +T++V + V+GAD YTDVWVSMGE ++K
Sbjct 184 LRLVAPQACWPEAALVTECRALAQQNGGNITLTEDVAKGVEGADFIYTDVWVSMGEAKEK 243
Query 242 FKERVELLQPYQVNMELIKKANNDNLIFLHCLPAFHDTNTVYGKDVAEKFGVK-EMEVTD 300
+ ER+ LL+ YQVN ++++ N + FLHCLPAFHD T GK +AE+FG+ MEVTD
Sbjct 244 WAERIALLREYQVNSKMMQLTGNPEVKFLHCLPAFHDDQTTLGKKMAEEFGLHGGMEVTD 303
Query 301 EVFRSKYARHFDQAENRMHTIKAVMAATL 329
EVF S + FDQAENRMHTIKAVM ATL
Sbjct 304 EVFESAASIVFDQAENRMHTIKAVMVATL 332
OTCC2_STRA5 1 MTQVFQGRSFLAEKDFSREEFEYLIDFSAHLKDLKKRGVPHHYLEGKNIA 50
...|..:.||...||:..|...|:..:|.||..||.|.....|.|||||
OTC1_ECOLI 1 -MSGFYHKHFLKLLDFTPAELNSLLQLAAKLKADKKSGKEEAKLTGKNIA 49
OTCC2_STRA5 51 LLFEKTSTRTRAAFTTAAIDLGAHPEYLGANDIQLGKKESTEDTAKVLGR 100
|:|||.|||||.:|..||.|.||...|||.:..|:|.|||.:|||:||||
OTC1_ECOLI 50 LIFEKDSTRTRCSFEVAAYDQGARVTYLGPSGSQIGHKESIKDTARVLGR 99
OTCC2_STRA5 101 MFDGIEFRGFSQRMVEELAEFSGVPVWNGLTDEWHPTQMLADYLTIKENF 150
|:|||::||:.|.:||.|||::.||||||||:|:||||:|||.||::|:.
OTC1_ECOLI 100 MYDGIQYRGYGQEIVETLAEYASVPVWNGLTNEFHPTQLLADLLTMQEHL 149
OTCC2_STRA5 151 -GK-LEGITLVYCGDGRNNVANSLLVAGTLMGVNVHIFSPKELFPAEEIV 198
|| ...:||||.||.|||:.||:|.|..|.|:::.:.:|:..:|...:|
OTC1_ECOLI 150 PGKAFNEMTLVYAGDARNNMGNSMLEAAALTGLDLRLVAPQACWPEAALV 199
OTCC2_STRA5 199 KLAEEYAKESGAHVLVTDNVDEAVKGADVFYTDVWVSMGE-EDKFKERVE 247
......|:::|.::.:|::|.:.|:|||..|||||||||| ::|:.||:.
OTC1_ECOLI 200 TECRALAQQNGGNITLTEDVAKGVEGADFIYTDVWVSMGEAKEKWAERIA 249
OTCC2_STRA5 248 LLQPYQVNMELIKKANNDNLIFLHCLPAFHDTNTVYGKDVAEKFGVK-EM 296
||:.||||.::::...|..:.||||||||||..|..||.:||:||:. .|
OTC1_ECOLI 250 LLREYQVNSKMMQLTGNPEVKFLHCLPAFHDDQTTLGKKMAEEFGLHGGM 299
OTCC2_STRA5 297 EVTDEVFRSKYARHFDQAENRMHTIKAVMAATLGNLFIPKV 337
|||||||.|..:..|||||||||||||||.|||..
OTC1_ECOLI 300 EVTDEVFESAASIVFDQAENRMHTIKAVMVATLSK------ 334OTCC2_STRA5 5 FQGRSFLAEKDFSREEFEYLIDFSAHLKDLKKRGVPHHYLEGKNIALLFE 54
|..:.||...||:..|...|:..:|.||..||.|.....|.||||||:||
OTC1_ECOLI 4 FYHKHFLKLLDFTPAELNSLLQLAAKLKADKKSGKEEAKLTGKNIALIFE 53
OTCC2_STRA5 55 KTSTRTRAAFTTAAIDLGAHPEYLGANDIQLGKKESTEDTAKVLGRMFDG 104
|.|||||.:|..||.|.||...|||.:..|:|.|||.:|||:|||||:||
OTC1_ECOLI 54 KDSTRTRCSFEVAAYDQGARVTYLGPSGSQIGHKESIKDTARVLGRMYDG 103
OTCC2_STRA5 105 IEFRGFSQRMVEELAEFSGVPVWNGLTDEWHPTQMLADYLTIKENF-GK- 152
|::||:.|.:||.|||::.||||||||:|:||||:|||.||::|:. ||
OTC1_ECOLI 104 IQYRGYGQEIVETLAEYASVPVWNGLTNEFHPTQLLADLLTMQEHLPGKA 153
OTCC2_STRA5 153 LEGITLVYCGDGRNNVANSLLVAGTLMGVNVHIFSPKELFPAEEIVKLAE 202
...:||||.||.|||:.||:|.|..|.|:::.:.:|:..:|...:|....
OTC1_ECOLI 154 FNEMTLVYAGDARNNMGNSMLEAAALTGLDLRLVAPQACWPEAALVTECR 203
OTCC2_STRA5 203 EYAKESGAHVLVTDNVDEAVKGADVFYTDVWVSMGE-EDKFKERVELLQP 251
..|:::|.::.:|::|.:.|:|||..|||||||||| ::|:.||:.||:.
OTC1_ECOLI 204 ALAQQNGGNITLTEDVAKGVEGADFIYTDVWVSMGEAKEKWAERIALLRE 253
OTCC2_STRA5 252 YQVNMELIKKANNDNLIFLHCLPAFHDTNTVYGKDVAEKFGVK-EMEVTD 300
||||.::::...|..:.||||||||||..|..||.:||:||:. .|||||
OTC1_ECOLI 254 YQVNSKMMQLTGNPEVKFLHCLPAFHDDQTTLGKKMAEEFGLHGGMEVTD 303
OTCC2_STRA5 301 EVFRSKYARHFDQAENRMHTIKAVMAATL 329
|||.|..:..|||||||||||||||.|||
OTC1_ECOLI 304 EVFESAASIVFDQAENRMHTIKAVMVATL 332| Выравнивание, построенное в needle | Выравнивание, построенное в water | Выравнивание, построенное в BLASTP | |
| Вес выравнивания | 842 | 846 | 866 |
| Длина выравнивания | 341 | 329 | 329 |
| Гэпы | 11/341 | 4/329 | 4/329 |