Параметры blast

Query subrange - диапазон данной последовательности, по которому будет сделано выравнивание
Database - можно выбрать базу данных, в которой будут искаться последовательности
Organism - можно указать организмы, по которым будут искаться последовательности для выравнивания
Max target sequences - максимальное число последовательностей в выдаче
Max matches in a query range - ограничивает число находок бласт в одной последовательности из банка
Short queries - уменьшает длину слова, применяется для более аккуратного поиска, когда введенная последовательсть очень короткая
Expected threshold - порог E-value
Word size - размер слова при разбивании последовательностей
Matrix - по какой матрице замен считается вес выравнивания
Gap costs - размер штрафа за гэп
Compositional adjustments - борьба с участками малой сложности

В качестве белка для первого задания была выбрана А субъединица АТФ синтазы. Полную таблицу находок можно скачать по этой ссылке, а файл в формате fasta, содержащий гомологичные последовательности по этой.
выравнивание
На изображении выше представлено множественное выравнивание гомологичных последовательностей (такой вывод можно сделать исходя из того, что они имеют большой процент на 100% консервативных позиций).

Карта локального сходства последовательностей

выравнивание

Начало последовательности, расположенной по вертикали, совпадает с концом последовательсти, расположенной по горизонтали. В середине также находятся участки, совпадающие с разными участками второй последовательности. Конец же последовтельности, расположенной по вертикали (начиная с ~300), совпадает с началом (до ~250) второй последовательности.

Игры с blast

При поиске по белку из первого задания я сначала изменила word size на 2 (число находок в целом не изменилось, но увеличилось количесво последовательностей со значением e-value, близким к нулю), изменение матрицы замен привело к крайне похожему результату.
Поиск по случайной последовательнсти, которая точно не кодирует белок, со стандартными параметрами, не дал ни одного результата. Последовательность длиной 250 а.о. была сгенерирована здесь.
При поиске по рандомной последовательности из 30 а.о. бласт выдал множество результатов с минимальными e-value 1.3. Но далее его значение очень быстро возрастало, и уже к 15 находке превысело 100.