|
|
||||||||||||||||||||
BLAST Задание 1. Сходные последовательности в базе данных Refseq_protein. Параметры запуска 1 Всего по данному запросу было найдено 14 660 последовательностей. Находки относятся к геномам надцарства Bacteria, типам Firmicutes, Spirochaetia, Proteobacteria, Actinobacteria, Planctomycetes и Bacteroidetes. Также в числе находох по организмам есть одна бактерия(bacterium MS4), для которой классификация отстствует. Информация о трех выравниваниях: наилучшем(при сортировке по E-value стоит первым в списке), среднем (из середины) и наихудшем(из конца списка), содержится в таблице ниже. На рисунках 1, 2, 3 соответственно представлены выравнивания, построенные blast'ом с данными последовательностями.
Рис.1 Рис.2 Рис.3 Задание 2. Сходные последовательности таксономической группы Параметры запроса Все найденные белки принадлежат бактериям, так что я решила найти последовательности, принадлежащие классу Spirochaetia. (надцарство Bacteria, тип Spirochaetes). Выбранная мною находка - MULTISPECIES: tRNA nucleotidyltransferase/poly(A) polymerase family protein [Leptospira]. (ссылка) Score для обоих случаев совпадает (130). E-value различно: в списке со всеми последовательностями равно 6e-33, в списке по таксону - 6e-35.Выравнивания совпадают (Рис.4) Рис.4 Значение E-value рассчитывается по формуле E = m*n*2^(-S), где S - bit score, а m*n - эффективное пространство(площадь) поиска, которое меняется при задании других параметров, т.е. завивсит от других последовательностей. Задание 3. Карта локального сходства Параметры запроса Выравнивание Я выбрала последовательность из предыдущего пункта. По сравнению с находкой совпадал bit score и % Ident, E-value отличалось. Собственно карта представлена на рисунке ниже: Задание 4. Поиск в своей базе данных. Выравнивание 1 Выравнивание 2 В выравнивании 1 присутствовала последовательность, с которой мы сравнивали при запуске программы - поэтому в результате программа выдала просто совпадение 2 последовательностей (выравнивания совпадают, score = 291, E-value = 1e-105). После удаления данной последовательности из выравниваня (получилось выравнивание 2), программа выдала "no hits found". |