BLAST

Второй семестр Главный сайт



Задание 1

В BLAST была загружена последовательность моего белка, 
и алгоритм был запущен с такими параметрами. Из
14611 находок было взято три - лучшая, худшая и из середины.

					
Данные о найденных белках.
Белок Длина выравнивания Bit score Идентичных Функционально сходных E-value
НАД-дегидрогеназа (худший) 54 38.5 22(41%) 33(61%) 10.0
ФАД-зависимая оксидредуктаза ("средний") 485 169 162(33%) 232(47%) 2e-42
Глицерол-3-фосфат дегидрогеназа (лучший) 501 780 400(80%) 438(87%) 0.0
Выравнивание с НАД-дегидрогеназой.
Выравнивание с ФАД-зависимая оксидредуктазой.
Выравнивание с глицерол-3-фосфат дегидрогеназой.
Всего было найдено 11266 гомологичных последовательностей (E-value > 0.001, покрытие больше 70%). Ниже представленны 100
из них в графическом представлении.
					

Задание 2

Был проведен новый поиск, в котором остались только альфа-протеобактерии. Результатов оказалось всего лишь 2544. 
В процессе сравнения результатов обнаружилось, что некоторые белки попали в результат несколько раз, причем полученные выравнивания сильно 
отличаются в перделах даже одного поиска. Для сравнения поисков был выбран белок, встречающийся однократно в каждом поиске - 
N-acetylglucosamine-1-phosphate uridyltransferase [Rhizobium sp. JGI 0001002-C21]. Отличается только E-value - 2.1 в общем поиске 
против 0.16 в поиске по альфа-протеобактериям.
Для другого белка (putative glycerol-3-phosphate dehydrogenase [Sphingobium japonicum])  E-value в общем поиске составил 1e-06, а в поиске
по альфа-протеобактериям - 9e-08. Уменьшение E-value связано с тем, что белков альфа-протеобактерий сильно меньше, а с уменьшением базы данных
падает и E-value (легче найти последовательность с большим счетом в миллионе случайных, чем в тысяче).
					

Задание 3


Для этого поиска 
была построена карта локального сходства. На ней отображены все элементы соответствующего выравнивания.
					

Задание 4

На основе выравнивания была построена база данных, с которой был сравнен белок.
Лучшая находка имеет bit score равный 20.4, E-value = 0.89, 38% совпадений и 58% сходств. О гомологии я бы не стал говорить, так как покрытие 
составляет всего 7.5%. 

Сайт находится в стадии разработки


© 2014 Рюмин Константин