На мой запрос BLAST выдал список, содержащий 38 гомологов. Причем первый пункт списка (gi|71159288|sp|P0A9R1|DHAS_SHIFL) подаразумевает 3 белка: P0A9R1|DHAS_SHIFL, P0A9Q9|DHAS_ECOLI (мой белок), P0A9R0|DHAS_ECO57, видимо имеющие одинаковые последовательности.
Счет (Score) для всех троих - 746 bits
E-value - 0.0
При поиске в PDB было найдено 26 гомологов. Первая находка в общем списке значится как gi|16974917|pdb|1GL3|B
Score | Query |
Subject |
Identity |
|
1GL3 (A,B) | 746 bits | 1-367 |
1-367 | 100% |
1BRM (A,B,C) | 746 bits | 1-367 |
1-367 | 100% |
Глаза мозолит цветастая картинка перед списком находок. Каждая находка на ней обозначенна горизонтальной линией, демонстрирующей начало и конец выравнивания в находке (Subject), сверху - шакала, она же - последовательность запроса (Query). Тыкаешь линию и переходишь ниже, к выраниванию.
ID каждой находки - ссылка на страничку с описанием этого белка, с которой, в свою очередь, можно попасть еще много куда.
Мой белок в выдаче имеется, 3-м в списке, с двумя аналогичными. Первая находка в списке - тот самый гомолог DHAS_ECOLI, использованный при поиске.
Score | E-value |
Query | Subject |
Identity | |
P0A9R1|DHAS_SHIFL P0A9Q9|DHAS_ECOLI (мой белок) P0A9R0|DHAS_ECO57 |
559 bits | 6e-159 |
1-369 | 1-366 | 266/369 (72%) |
Всего найдено 12 гомологов. Мой белок в списке результатов значится 2-м, его опередил белок с таким же Score и Identity, но меньшим E-value (3e-06 vs. 4e-06 у моего). Процент совпадений довольно высок, количество найденных гомологов на 1-2 меньше, чем если искать используя более длинные участки. Если увеличивать размер "вырезки" голичество находок с хорошим счетом, что при Query
Length=232, что при Query
Length=112 остается в равным 13-ти. После этих находок наблюдается резкое уменьшение схожести:
#13 DHAS_AZOVI Score = 268 bits Identities = 142/242 (58%)
Если сравнивать найденное, то становится видно что в Top 13 входит всегда одни и теже белки, кроме DHAS_BORPE, который в случае с крайне маленьким кусочком не находится из-за того что именно в этом месте у DHAS_ECOLI и DHAS_BORPE большие различия:
#14 DHAS_SHESP Score = 63.5 bits Identities = 65/236 (27%)
(ILDI+R V + LP ++FGVPL G+L - выравнивание)
Это доказывает что можно искать гомологов по участку последовательности.
Top 13 результатов поиска по кускам разной длины (DHAS_ECOL6 48.9 3e-06 - PROT Score E-Value):
Query Length=26 Top 12 (больше просто нету) |
Query Length=112 |
Query Length=232 |
Query Length=367 (целиком) Top 13 |
DHAS_ECOL6 48.9 3e-06 DHAS_SHIFL 48.9 4e-06 DHAS_SALTI 47.4 1e-05 DHAS_ACTPL 39.7 0.002 DHAS_NEIMB 35.8 0.028 DHAS_NEIMA 35.8 0.031 DHAS_HAEIN 35.4 0.043 DHAS_BUCAP 33.9 0.13 DHAS_BUCAI 32.7 0.23 DHAS_AZOVI 32.7 0.27 DHAS_PSEAE 31.2 0.69 DHAS_BUCBP 30.8 1.1 | DHAS_ECOL6 219 2e-57 DHAS_SHIFL 218 2e-57 DHAS_SALTI 208 3e-54 DHAS_HAEIN 172 2e-43 DHAS_ACTPL 166 1e-41 DHAS_PSEAE 160 1e-39 DHAS_AZOVI 157 9e-39 DHAS_BORPE 147 5e-36 DHAS_BUCAI 143 9e-35 DHAS_BUCBP 142 2e-34 DHAS_NEIMA 142 2e-34 DHAS_NEIMB 142 3e-34 DHAS_BUCAP 136 2e-32 | DHAS_SHIFL 459 4e-129 DHAS_ECOL6 457 1e-128 DHAS_SALTI 439 4e-123 DHAS_ACTPL 340 2e-93 DHAS_HAEIN 333 2e-91 DHAS_PSEAE 315 6e-86 DHAS_NEIMA 307 2e-83 DHAS_BUCAI 306 3e-83 DHAS_NEIMB 299 5e-81 DHAS_BUCBP 296 2e-80 DHAS_BUCAP 295 7e-80 DHAS_BORPE 287 2e-77 DHAS_AZOVI 268 1e-71 | DHAS_SHIFL 746 0.0 DHAS_ECOL6 744 0.0 DHAS_SALTI 719 0.0 DHAS_HAEIN 559 5e-159 DHAS_PSEAE 535 7e-152 DHAS_BUCAI 517 3e-146 DHAS_BUCBP 513 3e-145 DHAS_NEIMA 502 7e-142 DHAS_NEIMB 496 5e-140 DHAS_BUCAP 488 1e-137 DHAS_BORPE 484 2e-136 DHAS_AZOVI 481 1e-135 DHAS_ACTPL 441 2e-123 |
Результаты поиска по короткой последовательности:
Score | E-value |
Query | Subject |
Identity | ||
#2 | P0A9R1|DHAS_SHIFL P0A9Q9|DHAS_ECOLI (мой белок) P0A9R0|DHAS_ECO57 |
48.9 bits | 4e-06 |
1-26 | 197-226 | 26/30 (86%) |
Score | E-value |
Query | Subject |
Identity | ||
#4 |
P0A9Q9|DHAS_ECOLI |
1412 | e-141 |
? | ? | 72% |
Вцелом интерфейс Ебиай ближе к идеалу: основные настройки прямо на странице запроса, результаты структурированны в таблицу, ect. Но все выглядит перегруженным, настройки бы надо структурировать, а не выдавать всем скопом, таблица с результатами плохо воспринимается, вообщем NCBI выглядит приятней и не требует постоянно свой e-mail писать. А по делу - выдает он схожие незначительно отличающиеся результаты, но Score считает в каких-то других единицах (не в bits).
Страница запроса Пастеровского Института радует своей простотой, но не радует результатом: blast2: the server is too busy. Try again later.