BLAST

Поиск гипотетических гомологов изучаемого белка в разных банках

Будут рассматриваться три банка данных Swiss-Prot (аннотированные последовательности, которым можно доверять, однако удачных находок может быть мало, так как таких последовательностей не так много), "nr" (все, или очень многие, последовательности, бывают повторяющиеся, бывают предсказанные, но не существующие в реальности) и PDB (в нем хранятся структуры белков, по объему меньше, чем Swiss-Prot).

При изменении стандартных параметров поиска были получены гипотетические гомологи исследуемого белка, результаты представлены в таблице 1.
Поиск по Swiss-Prot Поиск по PDB Поиск по "nr"
Число находок, лимитированное значением E-value 20 13 1514
1. Лучшая находка (в принципе должна соответствовать заданному белку)
Accession P42979.1 2GTA_A NP_390131.1
E-value 2e-77 1e-72 1e-75
Вес (в битах) 230 215 230
Процент идентичности 100% 95% 100%
2. Сколько хороших кандидатов в гомологи найдено? (число находок в списке описаний с E-value < 1e-10) 1 1 585
3. "Худшая из удовлетворительных" находка (последняя в выдаче с E-value < 1)
Номер находки в списке описаний 9 6 1017
Accession P0AEY4.1 1VMG_A YP_007219036.1
E-value 0.45 0.62 0.99
Вес (в битах) 32.3 28.5 36.6
% идентичности 39% 32% 35%
% сходства 52% 45% 50%
Длина выравнивания 46 74 69
Координаты выравнивания (от-до, в запросе и в находке) 54-99 и 181-226 21-88 и 25-88 31-99 и 388-444
Число гэпов 0 16 12

Таблица 1. Результаты поиска гипотетических гомологов белка YPJD_BACSU

Коментарии:

Исходный белок удалось найти в банке Swiss-Prot и "nr", а его структуру - в PDB

Число явных гомологов (E-value < 1e-10) очень сильно различается при поиске по разным базам данных, так при поиске в Swiss-Prot и PDB было получено только одно значение, когда в банке "nr", который включает в себя все белковые последовательности из всевозможных источников (по замыслу), было найдено 585 кандидатов в гомологи…

Предельный размер выдачи результатов был изначально высок, кроме того пришлось еще увеличить его, чтобы получить “худшую из удовлетворительных" находку по банку данных "nr". Так что число находок в моем случае было лимитировано значением E-value во всех случаях (например, по банку Swiss-Prot наибольшее значение E-value=9)

Поиск гипотетических гомологов изучаемого белка с фильтром по таксонам

Банк Swiss-Prot: В царстве Eukaryota белок с наиболее близким, но неудовлетворяющим запросу значением E-value=0,021 оказалася белок коровы домашней, в отделе Actinobacteria есть находки со значениями 0,003. Далее по мере приближения к Bacillus subtilis значения превосходят 0,003. Таким образом, не удалось найти подходящий гомолог из банка Swiss-Prot.

Банк "nr”: в царстве Eukaryota не нашлось ни одного гипотетического гомолога (критерий: E-value<0,001), но в отделе Actinobacteria одна находка подошла. В таблице 2 представлены некоторые параметры этого гомолога.
Гипотетический гомолог белка из отдела Actinobacteria
Организм Bacteria; Actinobacteria; Candidatus Microthrix.
Accession WP_012223451.1
E-value 3e-04
Вес (в битах) 41.2
% идентичности 36%
% сходства 51%
Длина выравнивания 89
Координаты выравнивания (от-до, в запросе и в находке) 6-94 и 3-80
Число гэпов 11

Таблица 2. Результаты поиска гипотетических гомологов белка YPJD_BACSU в отделе Actinobacteria.

BLAST двух последовательностей

С помощью программы BLAST было сделано парное выравнивание исследуемого белка и его гомолога из отдела Actinobacteria. На рисунках 1 и 2 представлены карты локального сходства при разных порогах E-value. Белки гомологичны, поэтому карты при разных значениях не различаются.

Рисунок 1. Карта локального сходства с E-value=10. Рисунок 2. E-value=0.01.

Источники:

Дата последнего изменения: 26/04/2013. Сайт kodomo © Trushina Nataliya