Изначально я выбрала домашнюю лошадь (Equus caballus), но из-за объёма её генома в итоге поменяла организм на Arabidopsis thaliana.
Сборка RefSeq: GCF_000001735.4
В задании требуется найти в геноме выбранного эукариота ген, кодирующий δ-субъединицу АТФ-синтазы
Последовательность белка, аннотированная как нужный ген была найдена с помощью текстового поиска. Её идентификатор: NP_196849.1
Идентификатор нуклеотидной записи, к которой относится ген: NC_003076.8
FASTA-файл нуклеотидной последовательностью
В задании требовалось выбрать для своего организма далёкое семейство из четырёх представленных. Так как мой организм является растением, можно было выбрать любой таксон. Выбранный таксон: Собачьи (Canidae)
Использованная база данных: RefSeq Genomes
Число сборок, входящих в таксон: 8
Длина слова: 5
Остальные параметры по умолчанию

Однако, если проводить поиск по blastn, то blast не выдаёт результаты. Это показывает, что tblastn больше подходит для поиска гомологичных белков у отдалённых организмов. Чтобы решить проблему, я выбрала самую хорошую по E-value, покрытию и Per.Identity находку и использовала её для поиска в семействе Canidae с помощью алгоритма blastn
NC_135621.1 (28986859-28986308) - находка, по которой проводился поиск.

На локальном компьютере с помощью BLAST+ была проиндексирована последовательность моего организма для последующей работы локального BLAST. Используемая команда:
makeblastdb -in GCF_000001735.4_TAIR10.1_genomic.fna -dbtype nucl -out anya.fna
-dbtype - указываем тип последовательности
После этого мы скачали последовательности рРНК (16S и 23S) Escherichia coli и провели локальный поиск BLAST по полученной базе данных по методу blastn
Команда для выполнения (16S): blastn -task blastn -query ./16s.fa -db ./anya.fna -outfmt 7 -evalue 0.005 -out 16sblast_anya
Алгоритм выдал 12 хитов.
Команда для выполнения (23S): blastn -task blastn -query ./23s.fa -db ./anya.fna -outfmt 7 -evalue 0.005 -out 23sblast_anya
Алгоритм выдал 25 хитов

Для выполнения задания были выбраны два разных штамма кишечной палочки: Escherichia coli K-12 MG1655, Escherichia coli O157:H7 Sakai.
Диагональ посередине это большие консервативные блоки, сохранившиеся между штаммами. Много мелких делеций. Возможно есть транслокация в начале генома
На карте BLASTN по всей площади графика есть большое количество мелких локальных совпадений. Это ожидаемо, так как blastn находит короткие участки гомологии. На главной диагонали видна линия сходства между двумя штаммами