Занятие 7. BLAST




Поиск гипотетических гомологов изучаемого белка в разных банках

Результаты поиска гипотетических гомологов белка PTHP_BACSU

  Поиск по БД Swiss-Prot Поиск по БД PDB Поиск по БД "nr"
1. Лучшая находка (в принципе должна соответствовать заданному белку)
Accession P08877.3 2FEP_S NP_389273
E-value 2e-44 5e-45 5e-43
Вес (в битах) 177 175 177
Процент идентичности 100% 99% 100%
2. Сколько хороших кандидатов в гомологи найдено?
(число находок в списке описаний с E-value < 1E-10)
28 29 438
3. "Худшая из удовлетворительных" находка (последняя в выдаче с E-value < 1)
Номер находки в списке описаний 55 33 1000
Accession Q8FFD8.1 3CCD_A ZP_08148112
E-value 0.075 3e-09 4e-08
Вес (в битах) 35.8 56.6 61.6
% идентичности 30 33 39
% сходства 54 59 60
Длина выравнивания 74 81 77
Координаты выравнивания (от-до, в запросе и в находке) 12-82
12-84
1-81
1-81
1-77
1-77
Число гэпов 4 0 0

Исходный белок удалось найти в Swiss-Prot и "nr", а его структуру в PDB
Число явных гомологов (E-value < 1e-10) сильно отличается от остальных в банке Non-redundant protein sequences(nr), что прежде всего обусловлено тем, что этот банк - "виртуальный" и включает в себя все белковые последовательности из всевозможных источников (в первую очередь Swiss-Prot и аннотации кодирующих участков генов в GenBank), поэтому и подобных находок в нем значительно больше, чем в банках Swiss-Prot и PDB (Protein Data Bank proteins)
Всего находок 1000. E-value самой последней находки: 4e-08. Число находок лимитировано значением Max target sequences - предельным размером выдачи

Поиск гипотетических гомологов изучаемого белка с фильтром по таксонам

При исследовании проверялись следующие таксоны:
- Eukaryota (другое царство)
Гипотетического гомолога с критерием: E-value<0,001 не было найдено, лучшая находка имела E-value=5.8
- Actinobacteria (другой отдел того же царства бактерий);
- Clostridia (другой класс того же отдела Firmicutes)
Гипотетического гомолога с критерием, удовлетворяющим условию не было найдено, лучшая находка имела E-value=3.5
- Lactobacillales (другой порядок того же класса Bacilli)
- Listeriaceae (другое семейство того же порядка Bacillales)
- Geobacillus (другой род того же семейства Bacillaceae)
- Bacillus anthracis (другой вид того же рода)
Гипотетического гомолога с критерием, удовлетворяющим условию не было найдено, лучшая находка имела E-value=1.7

Результаты поиска гипотетических гомологов

Таксон Номер находки
в списке описаний
Accession E-value Вес
(в битах)
% идентичности % сходства Длина
выравнивания
Координаты выравнивания
(от-до, в запросе и в находке)
Число гэпов
Actinobacteria (taxid:201174) 1 O50515 8e-07 47.4 35 54 91 1-88
1-88
6
Lactobacillales (taxid:186826) 1 O07125 2e-34 138 73 89 88 1-88
1-88
0
Listeriaceae (taxid:186820) 1 P0A438 8e-29 117 64 76 88 1-88
1-88
0
Geobacillus (taxid:129337) 1 P42013 6e-29 117 70 85 88 1-88
1-88
0

При поиске гипотетического гомолога главным критерием было значение E-value<0,001. В результате лучшая находка найдена по таксону Lactobacillales (другой порядок того же класса Bacilli) с E-value=2e-34 в порядке приближения к изучаемому белку Bacillus subtilis(E-value=2e-44).

Сравнение выравниваний, выданных программой BLASTP, с оптимальными глобальным и локальным выравниваниями

Тип выравнивания Score Длина выравнивания % идентичности % сходства Программа выравнивания
Выравнивание, выданное BLASTP 335 88 73 89 blastp
Оптимальное частичное выравнивание 335.0 88 72.7 88.6 water
Оптимальное полное выравнивание 335.0 88 72.7 88.6 needle

При поиске выравниваний и соответственно их веса была использована матрица BLOSUM62: gap costs: existence - 11, extension - 1 (шртаф за создание гэпа - 11, за удлинение гэпа - 1). В результате сравнения самих выравниваний не было найдено никаких отличительных особенностей, к тому же их вес и длина выравнивания одинаковы, а число гэпов =0. Что касается отличающегося процента идентичности и сходства, то в данном случае в программе Blastp его просто округлили до целых.


©Андреянова Екатерина