Практикум 12.

Практикум 12 включает работу с NCBI BLAST — инструментом для поиска последовательностей, сходных с заданной.

BLAST

Database - параметр устанавливает базу данных для поиска последовательностей. Например, swissprot или pdb.
Exclude - можно исключить что-нибудь из результата поиска.
Max target sequences - верхнее ограничение размера выдачи.
Matrix - выбор матрицы для подсчёта веса выравнивания.
Word size - размер «затравки» локального выравнивания.
XLSX-таблица находок. Для поиска гомологичных белков было взято 6 последовательностей выравнивание в FASTA формате
Белки являются гомологичными, так как обладают участком с большой плотностью консервативных позиций, длиной более 6 позиций, начинающийся и заканчивающийся абсолютно консервативными позициями.

Карта сходства

Для построения карты сходства были выбраны 2 белка: A0A258HI86_9MICO и A0A0D2WL23_CAPO3.

мое фото

Из карты локального сходства двух аминокислотных последовательностей A0A258HI86_9MICO и A0A0D2WL23_CAPO3 мы можем сделать вывод, что у последовательности
A0A258HI86_9MICO (Query_151191) относительно последовательности A0A0D2WL23_CAPO3 (Query_151189) произошла одна большая дупликация и пять инсерций.

Игры с BLAST

В поиск была введена последовательность, полученная случайным набором по клавиатуре "symccmdvymfmkdvmdfmbvdfbvfdmkyaghaynavmmdvmrspmebrsdovininrfnwenfnqeyfnqwf".
Поиск велся по нереензированным поседовательностям. Со стандартными значениями не нашлось ничего, после изменения Max target sequences на 20 000,
Expect threshold на 100, а Word size на 2 нашлось 50 последовательностей с E-value от 11 до 90 и процентом покрытия до 71%.
При изменении Max target sequences меняется только число полученных последовательностей. При изменении Expect threshold с 10 до 100 число найденых последовательностей увеличивается за счёт неродственных последовательностей.
При изменении Word size с 6 до 2 время работы и количество находок увеличились, также возросли E-value. Если изменить штрафы за гэпы на 6/2 вместо 11/1, то количество результатов растёт, как и максимальное значение E-value.
Если установить матрицу очков на BLOSUM90 вместо BLOSUM62, то количество результатов сократится, а значение E-value вырастет.