Сравнение матриц аминокислотных замен
Таблица N1. Результаты поиска гипотетических гомологов изучаемого белка (SCO1_BACSU).
|
Поиск по Swiss-Prot |
Поиск по PDB |
Поиск по "nr" |
1. Лучшая находка (с последовательностью исходного белка)
|
Accession |
P54178 |
1XZO_A |
YP_006630375.1 |
E-value |
1e-140 |
8e-126 |
3e-139 |
Вес (в битах) |
397 |
356 |
398 |
Процент идентичности |
100% |
99% |
100% |
2. Число находок с E-value < 10–10 |
3-4(четвертый результат равен 1e-10) |
3 |
796 |
3. "Худшая из удовлетворительных" находка (последняя в выдаче с E-value < 1)
|
Номер находки в списке описаний |
39 |
21 |
3664 |
Accession |
Q5F6X5 |
2OBI_A |
WP_002155378.1 |
E-value |
0.94 |
0.80 |
0.99 |
Вес (в битах) |
33.5 |
30.0 |
37.7 |
% идентичности |
25% |
26% |
24% |
% сходства |
40% |
46% |
43% |
Длина выравнивания |
122 |
92 |
157 |
Координаты выравнивания (от-до, в запросе и в находке) |
57 to 163 271 to 377 |
32 to 118 27 to 114 |
35 to 188 13 to 155 |
Число гэпов |
30 |
9 |
17 |
Искомый белок удалось найти и в "nr", и в Swiss-Prot. К сожалению, в PDB удалось найти только очень похожий белок (Идентичность равна 99%).
В PDB число явных гомологов меньше, чем в Swiss-Prot, а в Swiss-Prot число явных гомологов меньше, чем в nr. Объясняется это просто. PDB является базой данных для 3D структур белков.
В nr хранятся предполагаемые белки, которых в разы больше подтвержденных.
Номер последней находки Swiss prot: 59.PDB: 39 .nr: 4218.
Лимит был задан значением E-value.
Таблица N2.Лучшая находка в наиболее далеких таксонах (Здесь - Eukaryota).
|
Поиск по Swiss-Prot |
Поиск по PDB |
Поиск по "nr" |
1. Лучшая находка (с последовательностью исходного белка)
|
Номер находки в списке описаний |
1 |
1 |
1 |
Accession |
Q9ZCW7.1 |
2GGT_A |
XP_640724.1 |
E-value |
5e-17 |
4e-08 |
2e-09 |
Вес (в битах) |
56.2 |
49.7 |
62.8 |
% идентичности |
31% |
29% |
31% |
% сходства |
55% |
47% |
53% |
Длина выравнивания |
155 |
146 |
156 |
Координаты выравнивания (от-до, в запросе и в находке) |
34 to 171 52 to 189 |
34 to 173 5 to 144 |
34 to 185 156 to 303 |
Число гэпов |
10 |
12 |
12 |
BLAST двух последовательностей.
Были составлены две карты локального сходства изучаемого белка и его гомолога Q9ZCW7.1.
Был использован разный порог E-value (один равен 10, другой - 0.01)
Карта локального сходства с порогом E-value, равным 10.
Query 34 PFTFQNQDGKNVSLESLKGEVWLADFIFTNCETICPPMTAHMTDLQKKLKAENIDVRIIS 93
PF +Q+G+ + + L+G + L F FT+C ICP +T++ + L ID+ +
Sbjct 52 PFELIDQNGEIFNSDKLRGHLSLIYFGFTSCPDICPTSLNKITNIVEILHQNKIDIIPVF 111
Query 94 FSVDPENDKPKQLKKFAANYPLSFDNWDFLTGYSQSEIEEFA--LKSFKAIVKKPEGEDQ 151
+VDP+ D P+ LK++ N+ F + LTG ++ +I++ K F A V + +DQ
Sbjct 112 ITVDPKRDTPEVLKEYIKNFHPKFIS---LTG-NEHQIKDVTDKFKVFYARVNS-DNDDQ 166
Query 152 --VIHQSSF-YLVGPDGKVLKDY 171
+I SSF YL+ +G+ +K +
Sbjct 167 NYMIDHSSFTYLIDKNGRYMKHF 189
Парное выравние двух последовательностей с порогом E-value, равным 10.
Скачать выравнивание можно по ссылке: SCO1homolog10.fasta
Карта локального сходства с порогом E-value, равным 0.01.
Рисунок 1. Парное выравнивание двух последовательностей с порогом E-value, равным 0.01.
Скачать выравнивание можно по ссылке: SCO1homolog001.fasta
|