Будут рассматриваться три банка данных Swiss-Prot (аннотированные последовательности, которым можно доверять, однако удачных находок может быть мало, так как таких последовательностей не так много), "nr" (все, или очень многие, последовательности, бывают повторяющиеся, бывают предсказанные, но не существующие в реальности) и PDB (в нем хранятся структуры белков, по объему меньше, чем Swiss-Prot).
При изменении стандартных параметров поиска были получены гипотетические гомологи исследуемого белка, результаты представлены в таблице 1.
Поиск по Swiss-Prot | Поиск по PDB | Поиск по "nr" | |
Число находок, лимитированное значением E-value | 20 | 13 | 1514 |
1. Лучшая находка (в принципе должна соответствовать заданному белку) | |||
Accession | P42979.1 | 2GTA_A | NP_390131.1 |
E-value | 2e-77 | 1e-72 | 1e-75 |
Вес (в битах) | 230 | 215 | 230 |
Процент идентичности | 100% | 95% | 100% |
2. Сколько хороших кандидатов в гомологи найдено? (число находок в списке описаний с E-value < 1e-10) | 1 | 1 | 585 |
3. "Худшая из удовлетворительных" находка (последняя в выдаче с E-value < 1) | |||
Номер находки в списке описаний | 9 | 6 | 1017 |
Accession | P0AEY4.1 | 1VMG_A | YP_007219036.1 |
E-value | 0.45 | 0.62 | 0.99 |
Вес (в битах) | 32.3 | 28.5 | 36.6 |
% идентичности | 39% | 32% | 35% |
% сходства | 52% | 45% | 50% |
Длина выравнивания | 46 | 74 | 69 |
Координаты выравнивания (от-до, в запросе и в находке) | 54-99 и 181-226 | 21-88 и 25-88 | 31-99 и 388-444 |
Число гэпов | 0 | 16 | 12 |
Таблица 1. Результаты поиска гипотетических гомологов белка YPJD_BACSU
Коментарии:
Исходный белок удалось найти в банке Swiss-Prot и "nr", а его структуру - в PDB
Число явных гомологов (E-value < 1e-10) очень сильно различается при поиске по разным базам данных, так при поиске в Swiss-Prot и PDB было получено только одно значение, когда в банке "nr", который включает в себя все белковые последовательности из всевозможных источников (по замыслу), было найдено 585 кандидатов в гомологи…
Предельный размер выдачи результатов был изначально высок, кроме того пришлось еще увеличить его, чтобы получить “худшую из удовлетворительных" находку по банку данных "nr". Так что число находок в моем случае было лимитировано значением E-value во всех случаях (например, по банку Swiss-Prot наибольшее значение E-value=9)
Банк Swiss-Prot: В царстве Eukaryota белок с наиболее близким, но неудовлетворяющим запросу значением E-value=0,021 оказалася белок коровы домашней, в отделе Actinobacteria есть находки со значениями 0,003. Далее по мере приближения к Bacillus subtilis значения превосходят 0,003. Таким образом, не удалось найти подходящий гомолог из банка Swiss-Prot.
Банк "nr”: в царстве Eukaryota не нашлось ни одного гипотетического гомолога (критерий: E-value<0,001), но в отделе Actinobacteria одна находка подошла. В таблице 2 представлены некоторые параметры этого гомолога.
Гипотетический гомолог белка из отдела Actinobacteria | |
Организм | Bacteria; Actinobacteria; Candidatus Microthrix. |
Accession | WP_012223451.1 |
E-value | 3e-04 |
Вес (в битах) | 41.2 |
% идентичности | 36% |
% сходства | 51% |
Длина выравнивания | 89 |
Координаты выравнивания (от-до, в запросе и в находке) | 6-94 и 3-80 |
Число гэпов | 11 |
Таблица 2. Результаты поиска гипотетических гомологов белка YPJD_BACSU в отделе Actinobacteria.
С помощью программы BLAST было сделано парное выравнивание исследуемого белка и его гомолога из отдела Actinobacteria. На рисунках 1 и 2 представлены карты локального сходства при разных порогах E-value. Белки гомологичны, поэтому карты при разных значениях не различаются.
Рисунок 1. Карта локального сходства с E-value=10. | Рисунок 2. E-value=0.01. |
Источники: