BLAST

Меню

На главную

Второй семестр

Задание 1

Для нахождения гомологов белка 3-dehydroquinate dehydratase (YP_144620) был использован BLAST на сайте NCBI. В запросе было изменено максимальное число находок со 100 до 500, чтобы E-value самой худшей находки выходил за формальные границы, внутри которых находки можно назвать гомологичными query. (E-value < 1e-3 и не менее 70% Query cover). С запросом можно ознакомиться по этой ссылке . В таблице 1 приведены три находки: самая лучшая, из середины и самая плохая. Всего 295 находок.

Таблица 1. Результаты поиска в BLASTP

Находка Длина Bit score Indentities Positives E-value Изображение выравнивания
Лучшая
3-dehydroquinate dehydratase Thermus thermophilus HB27 (Q72IZ2.1)
149 765 100% 100% 2e-103
Из середины
3-dehydroquinate dehydratase Meyerozyma guilliermondii ATCC 6260 (A5DAY6.2)
142 282 43% 61% 1e-30
Худшая
threonine-protein kinase Dictyostelium discoideum (Q54PX0.1)
51 65 18% 27% 9.6

Среди находок большинство белков пренадлежит бактериям. Также есть гомологи среди белков аскомицетов и базидиомицетов. Белки с плохим E-value и в следствие этого негомологичные квери пренадлежат рыбам и приматам. На рисунке 1 изображено графическое представление результатов поиска. Для того, чтобы в нем не было лишних находок, установлен порог максимального E-value 0.001.

Рис.4 Графическое представление результатов поиска.

Задание 2.

Требовалось провести поиск по определенному таксону, например, bacteria. Ссылка на запрос Т.к. уменьшилась база последовательностей, то и уменьшилось число находок и их E-value. Для лучшей находки из прошлого запроса E-value уменьшилось до 9e-104. Кроме E-value ничего больше не изменилось (огранизм, название белка, score, indentities, positives), поэтому это точно та же находка.

Задание 3.

Карту локального сходства построила для последовательности белка 3-dehydroquinate dehydratase Shewanella baltica OS195 из середины. На рисунке 2 представлена карта локального сходства. Гэпы в выравнивании (рис.3) соответствуют разрывам на графике локального сходства.

Рис. 2 Карта локального сходства последовательностей белков 3-dehydroquinate dehydratase двух бактерий: Thermus thermophilus HB27 и Shewanella baltica OS195

Рис 3. Парное выравнивнивание этих же последовательностей

Задание 4.

С помощью команды makeblastdb была создана база данных из последовательностей белков из множественного выравнивания 8 прктикума. Командой blastp найдены последовательности похожие на белок моей бактерии 3-dehydroquinate dehydratase Thermus thermophilus HB8. Для лучшей находки Bit score 28, E-value 1.0, 29% одинаковых и 39% схожих позиций. (Рис.3) Находки случайны, потому что даже у лучшей E-value очень большое, в 1000 раз больше теоретически максимального и в 1017 раз больше максимального E-value для гомологов из первого задания. E-value такой большой, потому что короткое выравнивание и мало совпадающих колонок.

Рис.3 Парное выравнивание моего белка и лучшей находки из моей базы данных.


© Корзина Анастасия, 2015