Знакомство с BLAST

Задание 1. Нахождение гомологов моего белка(Краситель-обесцвечивающей пероксидазы Tfu_3078) в БД Swissprot

Описание параметров, включая Algorithm parameters, которые я использовали при запуске сервиса BLAST.

Полная таблица находок по заданным параметрам в BLAST

Далее из этой таблице мною были выбраны 6 последовательностей: 4 предположительно гомологичные(с хорошим покрытием и низким E-value) и 2 предположительно негомологичные( с E-value 0.001 и 4.1 ).Более того, я старалась выбирать разнообразные по названиям белки.

Картиночка Рис.1 Множественное выравнивание 6-ти белков, построенное с помощью Jalview

Из полученного множественного выравнивания нельзя сказать, что все белки в нём гомологичны друг другу. Поэтому я решила убрать из него 2 последовательности, гомологичность которых изначально ставилась под сомнение.

PIKCHA Рис.2 Множественное выравнивание гомологичных белков, построенное с помощью Jalview Подтверждение гомологичности всех последовательностей:

Задание 2. Объяснение карт сходства двух белков

Для выполнения данного задания я выбрала два идентификатора записи Uniprot из разных групп:K1VG04_TRIAC и A0A163IMY9_DIDRA.

Далее я построила карту локального сходства, отметив опцию Align two or more sequences.

PIKCHA Рис.3 Карта локального сходства

Между двумя белками программа BLAST построила 5 локальных выравниваний. Четыре из которых можно считать случайными из-за высокого значения E-value. То есть далее я буду рассматривать только первое локальное выравнивание (самая длинная полоса на Рис.3).

PIKCHA Рис.4 Достоверное локальное выравнивание (первое) Выводы, сделанные из карты сходства(Рис.3) и локального выравнивания(Рис.4):

Задание 3. Игры с BLAST

Для игры с BLAST я взяла последовательность, которая точно не кодирует белок: "WE ARE PLAYING with BLAST". Выполняя поиск первый раз, я оставила все параметры по умолчанию, кроме базы данных. Я искала гомологов для моей фразы среди последовательностей базы данных Swiss-Prot. По моему запросу было найдено 7 последовательностей. Самый низкий E-value составил 0.041, что недостаточно для того, чтобы говорить о гомологичности. Получается, BLAST не проведёшь, E-value говорит нам о том, что все произведённые выравнивания с высокой вероятностью являются случайными.

PIKCHA Наиболее удачное выравнивание с E-value 0.041 и высоким процентом идентичности/схожести, разве что короткое

К сожалению, изменение параметров BLAST для воображаемого белка не приводило ни к каим изменениям находок. Это довольно-таки странно. Но как уж есть.

Для дальнейшей игры я использовала последовательности своего белка(DYP_THEFY) в Swiss-Prot.

При первом запуске я вновь пользовалась параметрами по умолчанию, изменив лишь базу данных. Этот поиск был произведен для того, чтобы в дальнейшем поле изменений параметров полученные данные было с чем сравнивать. Итак, во время первого запуска мне посчастливилось найти 13 белков (12 из них - предположительные гомологи)

Посмотрим, как изменится их количество, если выставить word size, равный 2-ум. Думаю, число находок должно уменьшиться, ведь при уменьшении этого параметра алгоритм BLAST, если можно так сказать, становитяс строже. Однако ,к моему удивлению, напротив, программа выдала большее число находок - 25 (тем не менее по прежнему только у 12-ти из них хорошие значения E-value)

Далее я попробовала изменить матрицу весов замен на BLOSUM90 с более высоким порогом кластеризации. В результате я получила примерно те же выравнивания, но с чуть большим весом. Таким образм, изменение данного параметра не влечёт за собой появление новых выравниваний.