Задание 1.
Таблица 1. Результаты поиска гипотетических гомологов белка ENDOA_BACSU
|
Поиск по БД Swiss-Prot |
Поиск по БД PDB |
Поиск по БД "nr" |
1. Лучшая находка |
Accession |
P96622.1 |
1NE8_A |
NP_388347.1 |
E-value |
2e-61 |
3e-62 |
6e-60 |
Вес (в битах) |
233 |
232 |
233 |
Процент идентичности |
100% |
100% |
100% |
2. Сколько хороших кандидатов в гомологи найдено?
(число находок в списке описаний с E-value < 1E-10)
| 9 |
1 |
455 |
3.
"Худшая из хороших" находка (последняя в выдаче с E-value < 1)
|
Номер находки в списке описаний |
11 |
19 |
937 |
Accession |
P0AE71.1 |
1BA0_A |
YP_002909907.1 |
E-value |
7e-04 |
0.99 |
0.98 |
Вес (в битах) |
42.4 |
28.1 |
37 |
% идентичности |
32% |
38% |
32% |
% сходства |
49% |
48% |
42% |
Длина выравнивания |
78 |
58 |
107 |
Координаты выравнивания (от-до, в запросе и в находке) |
6-83(ENDOA_BACSU) 10-81 (MAZF_ECO57) |
16-66(ENDOA_BACSU) 17-72 |
4-108(ENDOA_BACSU) 8-112 |
Число гэпов
| 6 |
9 |
4 |
Белок удалось найти во всех базах. Число явных гомологов меньше всего в PDB, что можно объяснить, возможно, тем, что не для всех белков построены структуры.
В nr данные о белках поступают со всех возможных банков, поэтому поиск обширнее и, соответственно, больше находок.
В Swiss-Prot было найдено 24 белка, E-value последнего 8,9, таким образом, в данном случае количество находок было ограничено их наличием в базе.
В PDB было найдено 52 белка, E-value последнего 9,3, как и в предыдущем случае количество находок было ограничено их наличием в базе.
В "nr" первоначально количество находок было ограничено параметрами, в списке была сотня гомологов с E-value последнего 3e-41, при изменении настроек обнаружилось 1009 белков с E-value последнего 9,7.
Задание 2.
Поиск гипотетических гомологов изучаемого белка с фильтром по таксонам
К сожалению, при поиске по таксонам наиболее близким белком оказался Q81SV3.1(Y1542_BACAN), с E-Value - 0,18. При этом поиск был проведен по Bacillus anthracis. Таксономия организма
белка Y1542_BACAN:Bacteria; Firmicutes; Bacillales; Bacillaceae; Bacillus; Bacillus cereus group.
Номер находки в списке описаний |
1 |
Accession |
Q81SV3.1 |
E-value |
0,18 |
Вес (в битах) |
25,8 |
% идентичности |
29%/td>
|
% сходства |
48% |
Длина выравнивания |
79 |
Координаты выравнивания (от-до, в запросе и в находке) |
28-105(ENDOA_BACSU) 97-165 (Y1542_BACAN) |
Число гэпов
| 11 |
Задание 3.
Локальные выравнивания, выполненные программами BLAST и water, одинаковы. В соответствии с этим, одинаковы их длина, вес, проценты сходства и идентичности, кол-во гэпов. Глобальное выравнивание (needle) имеет с локальными одинаково выровненный участок (28-105 по ENDOA_BACSU), то есть отличается только выравниванием концевых участков, невошедших в локальные.
При этом длинна белка ENDOA_BACSU значительно меньше, чем Y1542_BACAN, отсюда большое количкство гэпов, меньший вес, проценты идентичности и сходства. К тому же, выравнивания концевых участков достаточно подозрительны, по ним нельзя судить о гомологичности этих белков.
Выравнивание BLAST
1: ENDOA_BACSU
2: Y1542_BACAN
Matrix: EBLOSUM62
Gap_penalty: 11.0
Extend_penalty: 1.0
Score = 25.8 bits (55), Expect = 3e-04, Method: Compositional matrix adjust.
Identities = 23/79 (29%), Positives = 38/79 (48%), Gaps = 11/79 (14%)
Query 28 LVIQNDIGNRFSPTAIVAAITAQIQKAKLPTHVEIDAK-RYGFERDSVILLEQIRTIDKQ 86
+ IQ + + F VA + + LP H+E++ K R ER L E + + ++
Sbjct 97 IYIQLNFKSSFQNANYVAVLE---ENPYLPKHIEVNEKDRLLAER---FLEESVFSFRRE 150
Query 87 RLTDKITHLDDEMMDKVDE 105
RL +I DE +DK D+
Sbjct 151 RLLKQI----DEALDKQDK 165
Локальное выравнивание (water)
1: ENDOA_BACSU
2: Y1542_BACAN
Matrix: EBLOSUM62
Gap_penalty: 11.0
Extend_penalty: 1.0
Length: 79
Identity: 23/79 (29.1%)
Similarity: 38/79 (48.1%)
Gaps: 11/79 (13.9%)
Score: 55.0
=======================================
NDOA_BACSU 28 LVIQNDIGNRFSPTAIVAAITAQIQKAKLPTHVEIDAK-RYGFERDSVIL 76
:.||.:..:.|.....||.:. :...||.|:|::.| |...|| .|
1542_BACAN 97 IYIQLNFKSSFQNANYVAVLE---ENPYLPKHIEVNEKDRLLAER---FL 140
NDOA_BACSU 77 LEQIRTIDKQRLTDKITHLDDEMMDKVDE 105
.|.:.:..::||..:| ||.:||.|:
1542_BACAN 141 EESVFSFRRERLLKQI----DEALDKQDK 165
Глобальное выравнивание (needle)
1: ENDOA_BACSU
2: Y1542_BACAN
Matrix: EBLOSUM62
Gap_penalty: 11.0
Extend_penalty: 1.0
Length: 190
Identity: 28/190 (14.7%)
Similarity: 50/190 (26.3%)
Gaps: 86/190 (45.3%)
Score: 33.0
=======================================
ENDOA_BACSU 0 -------------------------------------------------- 0
Y1542_BACAN 1 MNTPVSVNEKKDFVKWFLNNYQLKQRECVWILNYLMSHDQLMHKVHFVEH 50
ENDOA_BACSU 1 ------------MIVKRGDVYFADLSPVVGSEQGGVRPV-------LVIQ 31
..||....:|...:.:....:.....: :.||
Y1542_BACAN 51 AKYCPRGLVMSANCVKDTPFHFFKQNVMTTDAEKSFHDIRLNRDEDIYIQ 100
ENDOA_BACSU 32 NDIGNRFSPTAIVAAITAQIQKAKLPTHVEIDAK-RYGFERDSVILLEQI 80
.:..:.|.....||.:. :...||.|:|::.| |...|| .|.|.:
Y1542_BACAN 101 LNFKSSFQNANYVAVLE---ENPYLPKHIEVNEKDRLLAER---FLEESV 144
ENDOA_BACSU 81 RTIDKQRLTDKITHLDDEMMDKVDE----ALQISLALIDF 116
.:..::||..:| ||.:||.|: .|...|.::
Y1542_BACAN 145 FSFRRERLLKQI----DEALDKQDKEAFHRLTAELKML-- 178
|