Учебный сайт Ивановой Софьи | |||||
Главная | Первый семестр | Второй семестр | Ссылки | Обо мне | Контакты |
Практикум 11. BLAST. | ||||||
Для выполнения заданий был взят белок, с которым я работала ранее, - аргининосукцинат-синтетаза археи Picrophilus torridus DSM 9790. Идентификаторы данного белка в базах данных:
Задание 1. Поиск сходных последовательностей в базах данных Refseq_protein и Swiss-prot. Ссылка на search strategy в БД RefSeq Ссылка на search strategy в БД Swiss-prot Поиск по БД RefSeq дал 8946 находок, по БД Swiss-prot - 569 находок. С результатами поиска по RefSeq было сложно работать из-за большого объема находок, поэтому я выполняла последующие задания с находками по Swiss-prot.
Задание 2. Поиск сходных последовательностей среди белков из определенной таксономической группы. Был произведен поиск среди архей в БД Swiss-prot. Было получено 56 находок. Это больше, чем число находок архейных белков из поиска по всем таксонам - 35 шт. (см. п.1). Но примерно у половины E-value > 0.001, то есть такие находки не могут считаться гомологами. Ссылка на search strategy в БД Swiss-prot Для одной из находок, которая также находилась в п.1, нужно было сравнить, одинаковое ли получилось выравнивание, совпадает ли score, не изменилось ли E-value. Я искала две из найденных последовательностей по их идентификаторам в находках из пункта 1 (поиск по всем таксонам). Score совпадает, E-value изменилось, стало меньше. Score совпадает, потому что не изменилась матрица и последовательности. E-value изменилось (уменьшилось), потому что изменилось количество результатов (уменьшилось), и, соответственно, размер банка. (Чем больше банк, тем больше E-value). Задание 3. Карта локального сходства для одной из находок. Было выполнено выравнивание двух последовательностей: функция Align two sequences на странице, где запускается поиск по базе данных. Была выбрана последовательность аргининосукцинат-синтазы из Klebsiella pneumoniae subsp. pneumoniae MGH 78578 (ID A6TEJ0.1). Полученное выравнивание:
Карта локального сходства: Сплошные участки графика соответствуют сходным фрагментам выравнивания без гэпов. Из наиболее длинных консервативных участков присутствует SGGLDTS (9-15 в query), который встречается в большей части находок. Вероятно, это функционально важный участок, возможно, принадлежащий активному центру. Задание 4. Использование BLAST для поиска в своей базе данных. Требовалось создать базу данных из случайных последовательностей и испрользовать BLAST для поиска в ней своего белка. В качестве базы данных было использовано множественное выравнивание 10 из практикума 8.
Выдача программа для лучшей находки:
Score лучшей находки на порядок меньше, чем при поиске в больших базах данных в предыдущих заданиях. E-value велик, несмотря на малый размер БД. Несомненно, эти данные свидетельствуют об отсутствии гомологии между последовательностями, что неудивительно. Query cover = 33/396 = 8.3%
|