Kodomo

Пользователь

На главную

Назад

Практикум 11

Мой белок

Задание 1

Условия поиска

Получилось 437 находок: 367 принадлежат археям (Formating options -> archaea -> Reformat); 70 - бактериям

Таблица 1. Сравнение находок.

Находка

Белок

Организм

Длина выравнивания

Bit-score

Identities

Positives

E-value

Лучшая

hypothetical protein

Vulcanisaeta moutnovskia

422

871

100%

100%

0.0

Из середины

hypothetical protein

euryarchaeote SCGC AAA261-E04

412

122

28%

46%

1e-27

Худшая

primosomal protein N'

Pseudomonas putida

29

38.5

52%

62%

10

Сами выравнивания:

Рис 1. Лучшее

http://kodomo.fbb.msu.ru/~vladislaw_aesc/term2/blasts/best.png

Рис 2. Из середины

http://kodomo.fbb.msu.ru/~vladislaw_aesc/term2/blasts/mid.png

Рис 3. Худшее

http://kodomo.fbb.msu.ru/~vladislaw_aesc/term2/blasts/worst.png

В качестве критерия гомологичности я приму E-value = 0,001 и Query cover = 80%. Тогда белок имеет 261 гомолога. Что интересно, если попросить бласт отсортировать находки по query cover, те что >80% сортируются нормально, а остальные идут вразнобой, поэтому я и взял 80% как условный критерий.

Бласт дает графическое изображение только до 94% QC.

Рис 4. Графическое изображение находок.

http://kodomo.fbb.msu.ru/~vladislaw_aesc/term2/blasts/graph.png

Задание 2

Взял hypothetical protein [alpha proteobacterium SCGC AB-629-F11], он бактериальный. Запустил бласт для бактерии. Среди списка белков нашел его же ( по идентификатору WP_018036287.1). Выравнивания совпадают. Score и остальные параметры совпадают. Только E-value отличается(уменьшился с 6e-14 до 4e-14). Объясняется это тем, что второй банк меньше, а значит и случайность находки меньше.

Задание 3

Выбрал последовательность hypothetical protein [Vulcanisaeta distributa]. Query cover 100%

Рис 5. Карта локального сходства

http://kodomo.fbb.msu.ru/~vladislaw_aesc/term2/blasts/loc.png

Особенности полученного выравнивания:

1. Query cover - 100%. То есть последовательности полностью гомологичны, что видно на рисунке 6.

Рис 6. Парное выравнивание

http://kodomo.fbb.msu.ru/~vladislaw_aesc/term2/blasts/loc2.png

Задание 4

Взял Седьмое выравнивание из 8 практикума, удалил гепы, проиндексировал командой makeblastdb. Затем запустил выравнивания с помощью blastp. Что получилось можно увидеть на рисунке 7 или в отдельном файле. Красным выделено лучшее.

Рис 7. Работа blastp

http://kodomo.fbb.msu.ru/~vladislaw_aesc/term2/blasts/balal.png

Находка

Длина выравнивания

Bit-score

Identities

Positives

E-value

HALON

27

18.9

41%

44%

0.71

Хоть и процент идентичных и сходных остатков не меньше чем у тех последовательностей, что я назвал гомологами в п.1, эти гомологами считать нельзя, потомку что длина этих выравниваний в десятки раз меньше того, что выдавал бласт, как, собственно, и Bit score, а E-value при этом очень большой ( хотя при уменьшении базы во 2 задании Е-value уменьшался), а значит полученные совпадения вероятнее всего случайны.