BLAST

Назад
Предыдущее занятие
BLAST (Basic Local Alignment Search Tool) – программы, ищущие гомологи белка по их первичной структуре. BLAST также может применяться и для поиска родственных нуклеиновых кислот. В данном задании будет использоваться дополненная интерфейсом версия blastp.
Я провёл поиск гомологов данного мне для работы белка YokD_BacSu (ID:O32003). В приведённой ниже сводной таблице я исключил сам белок из результатов поиска.

Табл.1 Результаты поиска гипотетических гомологов белка YokD_BacSu

  Поиск по Swiss-Prot Поиск по PDB Поиск по "nr"

1. Лучшая находка

Accession P29810.1 3IJW_A YP_003598306.1
E-value 3x10-41 2x10-98 1x10-113
Bit score 148 293 338
Identities 30%(84/280) 53% (138/259) 64% (167/262)
Query-Subject length ratio 272/281 272/264 272/264

2. Число находок с E-value < 10–10

8 5 493

3. Последняя находка с E-value < 1

Номер находки в списке описаний 12 6 594
Accession Q2NCT7.1 3SMA ZP_14182363.1
E-value 0.30 2x10-68 0.94
Bit-score 35.4 217.0 37.0
Identtities 33% (27/83) 45% (115/257) 30% (22/73)
Similarity 44% (37/83) 60% (156/257) 52% (38/73)
Query cover 27% 93% 25%
Координаты выравнивания (от-до, в запросе и в находке соотв.) 192-266, 148-230 13-265, 23-277 1-69, 1-73
Gaps 9% (8/83) 2% (6/257) 5% (4/73)
Query-Subject length ratio 272/266 272/286 272/79


Во всех трёх поисках были найдены исходные белки, хотя при поиске в nr он был спрятан в списке альтернативных последовательностей первой находки.
Стандартными ограничителями установлены количество находок не более сотни и E-value не более 10. В первых двух запросах эти ограничения не мешали поиску гипотетических гомологов, однако при поиске в nr в связи с большим объёмом выдачи мне пришлось ограничить E-value до 1, а количество результатов до 1000, так как при стандартных ограничителях последним был сотый результат с E-value 2х-92.
При поиске в PDB было меньше всего находок, поскольку трёхмерная структура исследована лишь у небольшой доли известных белков. Больше всего находок было обнаружено при поиске в nr, поскольку это объединение многих других БД, в том числе PDB и SwissProt.

При поиске гомологов исследуемого белка среди эукариот не было найдено ни одного убедительно схожего белка.
При поиске в н/ц.Eukaryota применялась только БД nr, поскольку поиск по SwissProt для эукариот не дал удовлетворительных результатов. Представленный белок EKJ70874.1 является лишь гипотетическим

Табл.2 Результаты поиска лучшего гомолога белка YokD_BacSu c ограничениями по таксонам

н/ц.Eukaryota отд.Actinobacteria отд.Actinobacteria
Accession EKJ70874.1 P29809.1 ZP_06916264.1
Organism Fusarium pseudograminearum CS3096 (аскомицет) Streptomyces fradiae Streptomyces sviceus
E-value 3x10-81 2x10-42 5x10-76
Identity 46% 32% 45%
Bit-score 237 148 240
Query-Subject length ratio 272/267 272/286 272/285
Gaps 0% (2/253) 7% (21/277) 2% (7/258)
БД nr SwissProt nr

При выравнивании оказалось, что гипотетический белок является мутантом части белка с отсечёнными концами (12 АО с N-конца и 7 с C-конца), а внутри выравнивания всего 2 гэпа. Помимо множества участков идентичности одного, двух или трёх АО есть два участка идентичности длиной в 4 АО и по одному участку идентичности в 5 АО, 9 и даже 10 АО.

фиг.1: Dot matrix view (карта локального сходства) для выравнивания белков O32003 и EKJ70874.1
При выравнивании последовательностей через BLAST параметры поиска теряют своё значение. Например, можно менять параметр E-value и карта локального сходства для последовательностей не изменится.
Следующее занятие

© Галкин Федор