Меню
На главную Второй семестр |
Задание 1Для нахождения гомологов белка 3-dehydroquinate dehydratase (YP_144620) был использован BLAST на сайте NCBI. В запросе было изменено максимальное число находок со 100 до 500, чтобы E-value самой худшей находки выходил за формальные границы, внутри которых находки можно назвать гомологичными query. (E-value < 1e-3 и не менее 70% Query cover). С запросом можно ознакомиться по этой ссылке . В таблице 1 приведены три находки: самая лучшая, из середины и самая плохая. Всего 295 находок. |
Таблица 1. Результаты поиска в BLASTP
Среди находок большинство белков пренадлежит бактериям. Также есть гомологи среди белков аскомицетов и базидиомицетов. Белки с плохим E-value и в следствие этого негомологичные квери пренадлежат рыбам и приматам. На рисунке 1 изображено графическое представление результатов поиска. Для того, чтобы в нем не было лишних находок, установлен порог максимального E-value 0.001. Рис.4 Графическое представление результатов поиска. Задание 2.Требовалось провести поиск по определенному таксону, например, bacteria. Ссылка на запрос Т.к. уменьшилась база последовательностей, то и уменьшилось число находок и их E-value. Для лучшей находки из прошлого запроса E-value уменьшилось до 9e-104. Кроме E-value ничего больше не изменилось (огранизм, название белка, score, indentities, positives), поэтому это точно та же находка.Задание 3.Карту локального сходства построила для последовательности белка 3-dehydroquinate dehydratase Shewanella baltica OS195 из середины. На рисунке 2 представлена карта локального сходства. Гэпы в выравнивании (рис.3) соответствуют разрывам на графике локального сходства.
Задание 4.С помощью команды makeblastdb была создана база данных из последовательностей белков из множественного выравнивания 8 прктикума. Командой blastp найдены последовательности похожие на белок моей бактерии 3-dehydroquinate dehydratase Thermus thermophilus HB8. Для лучшей находки Bit score 28, E-value 1.0, 29% одинаковых и 39% схожих позиций. (Рис.3) Находки случайны, потому что даже у лучшей E-value очень большое, в 1000 раз больше теоретически максимального и в 1017 раз больше максимального E-value для гомологов из первого задания. E-value такой большой, потому что короткое выравнивание и мало совпадающих колонок.Рис.3 Парное выравнивание моего белка и лучшей находки из моей базы данных. |
© Корзина Анастасия, 2015