Кол-во | E-value лучшей находки | Название лучшей находки (ID ) | Процент идентичности | Длина выравнивания | |
Всего находок | 117 | 5*10-82 | LGB1_LUPLU | 100% | 154 |
В бактериях (Bacteria) | 36 | 1*10-6 | HMP_RHIME | 29% | 117 |
В Escherichia coli K-12 | 0 | ||||
В животных(Metazoa) | 26 | 2*10-6 | NGB_BRARE | 25% | 141 |
В человеке | 3 | 5,8 | CRNL1_HUMAN | 28% | 78 |
Номер итерации
|
Бактерии
|
Животные
|
Характеристика лучшей находки среди белков
|
|||||||||
Escherichia coli, K-12
|
Homo sapiens sapiens
|
|||||||||||
Кол-во
|
Новые
|
Кол-во
|
Новые
|
Название
|
E-value
|
Процент идентичности
|
Длина выравнивания
|
Название
|
E-value
|
% идентичности
|
Длина выравнивания
|
|
1
|
21(36) | 21+ | 5(26) | 5+ | - | CRNL1_HUMAN | 5,8 | 28% | 78 а.о. | |||
2
|
38(50) | 17+ | 332 | 327+ | HMP_ECOLI | 1*10-29 | 20% | 148 а.о. | NGB_HUMAN | 2*10-19 | 21% | 143 а.о. |
3
|
38(47) | - | 879(890) | 547+ | HMP_ECOLI | 6*10-28 | 20% | 148 а.о. | HBG2_HUMAN | 8*10-45 | 18% | 150 а.о. |
4
|
- | - | 884(896) | 5+ | HMP_ECOLI | 2*10-22 | 20% | 143 а.о. | HBE_HUMAN | 5*10-54 | 17% | 154 а.о. |
5
|
- | - | 884(894) | - | HMP_ECOLI | 2*10-22 | 20% | 143 а.о. | HBE_HUMAN | 5*10-54 | 17% | 154 а.о. |
PSI-BLAST можно использовать для поиска далеких гомологов белка. Начиная со второй итерации, поиск осуществляется с использованием профиля PSSM, который составлен по результату множественному выравниванию ранее найденных последовательностей.
Первая итерация - поиск предположительных близких гомологов белка, т.е. он аналогичен действиям BLASTp (при тех же параметрах).
В результате второго упражнения удалось найти далекие гомологи белка леггемоглобина 1 из различных таксонов. Так характерная функция связывания с кислородом есть у флавогемопротеинов, гемоглобинов, нейрогемоглобинов, миоглобинов.
После каждой итерации (кроме последней) менялось количество найденных последовательностей, E-value лучшей находки, процент идентичности, иногда и сама лучшая находка.
Целью упражнения стояло найти самые далёкие гомологи, из далеких таксонов. Выбрав какой-то определённый таксон, мы получим профиль, который будет учитывать особенности гомологов из данного таксона. В такой выборке будут найдены дальние гомологи именно из таксона, в то время как в выборке без фильтрации эти дальние гомологи могут быть и не выявлены. Поэтому выбирать какой-то один таксон не очень целесообразно.
По данным UniProt в лучших находках с гемом контактируют следующие аминокислотные остатки :
У гомолога, найденного у человека HBE_HUMAN: 63 и 92 остатки (гистидины).
LGB1_LUPLU: 63 и 97 остатки (гистидины)
HBG2_HUMAN: 63 и 92 остатки (гистидины)
NGB_HUMAN: 64 и 96 остатки (гистидины)
У гомолога, найденного у кишечной палочки HMP_ECOLI: 85 остаток (гистидин)
За а контакт с гемом ответственен именно гистидин.
В приведенных белках на примерно одном и том же месте стоит один и тот же остаток.
То есть, мы видим общность в строении белков в плане связывания с кислородом.
Программа PSI-BLAST позволяет нам получить матрицу профиля PSSM. Если ввести матрицу, полученную на каком-либо этапе итерации и на основе какого-либо банка, в соответствующее поле на странице запроса PSI-BLAST и производить поиск в том же банке, то можно получить соответствующую выборку белков. С помощью матрицы можно вести поиск в других банках данных. Матрицы PSSM :