Учебная страница курса биоинформатики,
год поступления 2012
Занятие 7. BLAST
Ваша рабочая директория — H:\term2\block2\pr7.
Отчёт должен появиться на вашем веб-сайте к следующему занятию (3 апреля для группы 102, 5 апреля для группы 101).
Обязательные задания
При выполнении упражнений пользуйтесь web-интерфейсом к BLASTP на сервере NCBI: http://blast.ncbi.nlm.nih.gov/, далее в разделе Basic BLAST переходите по гиперссылке protein blast. Не забывайте указывать нужный банк для поиска!
На сайте NCBI доступны разнообразные учебники по BLAST. См. также веб-курс по BLAST.
1. Поиск гипотетических гомологов изучаемого белка в разных банках
Подайте на вход программе BLASTP код доступа изучаемого белка, проведите поиск гомологов в банке Swiss-Prot и заполните первый столбец таблички. Затем проведите поиск по банкам PDB (Protein Data Bank proteins) и "nr" (Non-redundant protein sequences) и заполните остальные столбцы.
Внимание: для этого надо изменять значение параметра database, по умолчанию стоит банк "nr".
Таблица 1. Результаты поиска гипотетических гомологов белка XXXX_BACSU
(html таблица для копирования)
|
Поиск по Swiss-Prot |
Поиск по PDB |
Поиск по "nr" |
1. Лучшая находка (в принципе должна соответствовать заданному белку) |
|||
Accession |
|
|
|
E-value |
|
|
|
Вес (в битах) |
|
|
|
Процент идентичности |
|
|
|
2. Сколько хороших кандидатов в гомологи найдено? (число находок в списке описаний с E-value < 1e-10) |
|
|
|
3. "Худшая из удовлетворительных" находка (последняя в выдаче с E-value < 1) |
|||
Номер находки в списке описаний |
|
|
|
Accession |
|
|
|
E-value |
|
|
|
Вес (в битах) |
|
|
|
% идентичности |
|
|
|
% сходства |
|
|
|
Длина выравнивания |
|
|
|
Координаты выравнивания (от-до, в запросе и в находке) |
|
|
|
Число гэпов |
|
|
|
В кратком комментарии к таблице
- ответьте, удалось ли найти исходный белок в Swiss-Prot и "nr", а его структуру в PDB?
сравните число явных гомологов (E-value < 1e-10) при поиске по разным БД и поясните возможные причины различий;
- Сколько всего находок и каков E-value самой последней находки? Чем в вашем случае было лимитировано число находок: значением E-value или заданным по умолчанию предельным размером выдачи?
2. Поиск гипотетических гомологов изучаемого белка с фильтром по таксонам
Ваша задача — для изучаемого белка 'B. subtilis' найти лучшего гомолога в организмах таксона, филогенетически как можно более далекого.
Для исследования предлагаются следующие таксоны:
'Eukaryota' (другое царство);
'Actinobacteria' (другой отдел того же царства бактерий);
'Clostridia' (другой класс того же отдела Firmicutes);
'Lactobacillales' (другой порядок того же класса Bacilli);
'Listeriaceae' (другое семейство того же порядка Bacillales);
'Geobacillus' (другой род того же семейства Bacillaceae);
'Bacillus anthracis' (другой вид того же рода).
Проверяйте на наличие гипотетического гомолога (критерий: E-value<0,001) в порядке приближения к 'Bacillus subtilis'. Как только найден первый такой гомолог, прекращайте поиск. Опишите результаты поиска по той же схеме, по которой описывали "худшую из удовлетворительных" находку в табл. 1.
3. BLAST двух последовательностей
С помощью программы BLAST сделайте парное выравнивание своего белка и его гомолога, найденного в упражнении 2. Сохраните и вставьте в отчёт карту локального сходства в двух видах: с порогом на E-value, равному 10 (т.е. по умолчанию) и с порогом на E-value, ранвному одной сотой.
4. (* – дополнительно) Сравнение результатов поиска с различными матрицами BLOSUM
Повторите упражнение 2, выбрав вместо BLOSUM62 другую матрицу серии BLOSUM (на выбор – либо BLOSUM45, либо BLOSUM90). Отметьте, какую новую матрицу вы использовали. Изменились ли результаты поиска по сравнению со стандартной матрицей? Если да, то почему?
5. (* – дополнительно) Сравнение различных интерфейсов программы BLAST
Программа BLAST установлена не только на сервере NCBI, который упоминался выше, но также на серверах EMBL-EBI и UniProt. Все эти сервисы используют одну и ту же программу, но разные веб-интерфейсы к ней. Проведите поиск гомологов на серверах EMBL-EBI и uniProt и опишите в отчете, что и почему вам в них понравилось или не понравилось по сравнению друг с другом и с уже знакомым вам интерфейсом сервера NCBI.