BLAST
|
|||||||||||||||||||||||||||||||
Второй семестр
Главный сайт |
Задание 1 В BLAST была загружена последовательность моего белка, и алгоритм был запущен с такими параметрами. Из 14611 находок было взято три - лучшая, худшая и из середины.
Выравнивание с НАД-дегидрогеназой. ![]() Выравнивание с ФАД-зависимая оксидредуктазой. ![]() Выравнивание с глицерол-3-фосфат дегидрогеназой. ![]() Всего было найдено 11266 гомологичных последовательностей (E-value > 0.001, покрытие больше 70%). Ниже представленны 100 из них в графическом представлении. ![]() Задание 2 Был проведен новый поиск, в котором остались только альфа-протеобактерии. Результатов оказалось всего лишь 2544. В процессе сравнения результатов обнаружилось, что некоторые белки попали в результат несколько раз, причем полученные выравнивания сильно отличаются в перделах даже одного поиска. Для сравнения поисков был выбран белок, встречающийся однократно в каждом поиске - N-acetylglucosamine-1-phosphate uridyltransferase [Rhizobium sp. JGI 0001002-C21]. Отличается только E-value - 2.1 в общем поиске против 0.16 в поиске по альфа-протеобактериям. Для другого белка (putative glycerol-3-phosphate dehydrogenase [Sphingobium japonicum]) E-value в общем поиске составил 1e-06, а в поиске по альфа-протеобактериям - 9e-08. Уменьшение E-value связано с тем, что белков альфа-протеобактерий сильно меньше, а с уменьшением базы данных падает и E-value (легче найти последовательность с большим счетом в миллионе случайных, чем в тысяче). Задание 3 Для этого поиска была построена карта локального сходства. На ней отображены все элементы соответствующего выравнивания. ![]() ![]() Задание 4 На основе выравнивания была построена база данных, с которой был сравнен белок. Лучшая находка имеет bit score равный 20.4, E-value = 0.89, 38% совпадений и 58% сходств. О гомологии я бы не стал говорить, так как покрытие составляет всего 7.5%. ![]() |
||||||||||||||||||||||||||||||
Сайт находится в стадии разработки © 2014 Рюмин Константин |