Главная Семестры Проекты Обо мне

Программа BLAST

1.Поиск гипотетических гомологов изучаемого белка в разных банках

Лучшая находка, как и ожидалось, совпала с заданным для поиска белком. Поэтому будем рассматривать поисковую выдачу сервиса, начиная со второй находки.
Искомая информация Поиск по Swiss-Prot Поиск по PDB Поиск по nr
1. Лучшая находка
Accession A7Z7A9.1 3PQC_A YP_004878299.1
E-value 2e-134 2e-41 6e-140
Вес (в битах)/td> 381 141 399
Процент идентичности 94% 40% 99%
2. Число хороших кандидатов в гомологи (E-value < 1e-10)
11 11 57
3. "Худшая из удовлетворительных" находка (последняя с E-value < 1)
Номер находки в списке описаний 93 34 94
Accession A9KHA0.1 3GEH_A YP_004325616.1
E-value 1e-60 0.72 1e-93
Вес (в битах) 194 30.4 281
Процент идентичности 51% 24% 70%
Процент сходства 89% 63% 94%
Длина выравнивания 174 123 183
Координаты выравнивания В запросе: 19 - 193.
В находке: 19 - 193.
В запросе: 26 - 149.
В находке: 227 - 345.
В запросе: 6 - 189.
В находке: 8 - 191.
Число гэпов 0 11 0


Мне удалось найти исходный белок в Swiss-Prot и "nr", а его структуру в PDB.

Так как nr включает все белковые последовательности, то число явных гомологов при использовании nr больше, чем при поиске в других базах данных (Swiss-Prot, PDB).

Всего нахдок в Swiss-Prot - 1605 (E-value самой последней находки - 10.0), PDB - 68 (E-value самой последней находки 9.6), nr - 10950 (E-value самой последней находки 10.0).

Заданный по умолчанию предельный размер выдачи - 100, следовательно, в PDB число находок лимитирвано значением E-value, а в nr и Swiss-Prot заданным по умолчанию предельным размером выдачи (т.к. если выбрать, например, размер выдачи - 20000, то число находок равно 10950 в nr, а в Swiss-Prot - 1605).


2.Поиск гипотетических гомологов изучаемого белка с фильтром по таксонам

Задача — для изучаемого белка 'B. subtilis' найти лучшего гомолога в организмах таксона, филогенетически как можно более далекого.
Я решила поискать в другом царстве (т.е. Eukaryota).
И это оказался белок, взятый из Arabidopsis thaliana (Резуховидка Таля, справа Вы можете увидеть этот милый цветок:))
Искомая информация Значение
Номер находки в списке описаний 1
Accession O81004.2
E-value 1e-36
Вес (в битах) 126
Процент идентичности 38%
Процент сходства 93%
Длина выравнивания 300
Координаты выравнивания В запросе: 2 - 184
В находке: 99 - 286
Число гэпов 5


3.Сравнение выравниваний, выданных программой BLASTP, с оптимальными глобальным и локальным выравниваниями

Для сравнения используем выравнивание BLASTp последовательностей моего белка и белка, полученого при выполнении предыдущего задания.


Функция веса, использованная при построении:
матрица весов замен - BLOSUM62;
штраф за создание гэпа - 11;
штаф за удлинение гэпа - 1.

Программа needle пакета EMBOSS (полное оптимальное выравнивание):

Полученный файл можно увидеть тут.


Программа water пакета EMBOSS (оптимальноe частичноe выравниваниe):

Полученный файл можно увидеть тут.


Признак сравнения BLASTp needle (оптимальное полное) water (оптимальное локальное)
Вес 316 313 318
Процент идентичности 38% 24% 37.8%
Процент сходства 93% 36.7% 56.4%
Число гэпов 5 105 5
Длина выравнивания 300 300 188
Координаты выравнивания В запросе: 2 - 184.
В находке: 99 - 286.
В запросе: 0 - 195.
В находке: 1 - 300.
В запросе: 2 - 184.
В находке: 99 - 286.

Вес оптимального частичного выравнивния немного больше,чем оптимального полного.
Выравнивания почти полностью отличаются друг от друга.
©Melnichuk Anastasia