В файле *.gbff я нашла нужную последовательность: δ-субъединица АТФ-синтазы. Индификатор белка: XP_022903973.1 (ATP synthase subunit delta, mitochondrial [Onthophagus taurus].)
Нуклеотидная последовательность гена db_xref="GeneID:111416236" (/gene="LOC111416236"). NW_019280607.
Жуки калоеды (Onthophagus taurus) относятся к первичноротым, поэтому рассмотрим находки по фрагментам ДНК вторичноротых : Кошечки (Felidae).
1. Я осуществила поиск BLAST через сайт NCBI по последовательностях геномов из выбранного таксона для последовательности гена δ-субъединицы АТФ-синтазы, использовала базу данных RefSeq Genome Database (15 сборок) и все параметры были использованы по-умолчанию. Сначала я выбрала метод blastn. Мне хотелось получить и варианты с не очень высоким процентом совпадения. По моему запросу было найдено 0 результатов, думаю, это связано с тем, что генетический код обладает вырожденностью, да и в целом, жуки и кошечки относятся к отдаленным друг от друга таксонам.
2.Я выбрала tblastn, с помощью которого я искала белковые гомологи по выбраному таксону. Параметры оставила те же (blastn), кроме word_size (тут брала word_size=2). Я получила 15 находок, у большинства процент идентичности около 75%. Результат интересный и неожиданный, так как токсоны далеки друг от друга.
Выдача tblastn.1.Команда для индексации генома:
makeblastdb -in GCF_910591885.1_iyBomTerr1.2_genomic.fna -dbtype nucl
2. 16S и 23S являются двумя из трех рРНК образющих основу рибосом прокариот (у эукариот это 18S и 28S). Для поиска гомологов 16S и 23S рРНК я выбрала программу blastn, так как она как раз нужна для поиска некодирующих белок последовательностей.
blastn -task blastn -query 16S.fasta -db GCF_000648695.1_Otau_2.0_genomic.fna -out 16Stable.out -word_size 7 -outfmt 7
blastn -task blastn -query 23S.fasta -db GCF_000648695.1_Otau_2.0_genomic.fna -out 23Stable.out -word_size 7 -outfmt 7
В результате для 16S 26 хитов, и для 23S 59 хитов.