Идентификатор белка и его последовательность:
>XP_003398518.1 ATP synthase subunit delta, mitochondrial [Bombus terrestris]
MATIARNLRPYLKYIRNQKRTFADAPVSNEMKFTLAGANQVFYDESVVKQVDVPSFSGSFGILPKHVPTLAVLKPGVVTVYEEDGAVKKVFVSSGTVTINENNSVQILAEEAHPLENLDGTAARELLSKAQQQLSSASSEQDKAEAAIAVEVAEALVQAVQ
Идентификатор нуклеотидной записи, к которой относится ген, кодирующий данный белок, - NC_063278.
Последовательность небольшой окрестности гена:
>XM_003398470.4 PREDICTED: Bombus terrestris ATP synthase subunit delta, mitochondrial (LOC100645765), mRNA
AACGCCATCGTTTGAGCATAATAGAAACCTTGTCATCTGTATTACTTGGTACTATGTATATGTATTAATTGGTTTGGATTTCGTCTGCCTGCTTGCAGTGACTGATACCAATTTCTACTTACATCTTCAATAATTATCATAACTATATTAAAATGGCTACTATCGCACGCAATCTACGCCCTTATTTAAAATATATTCGTAATCAAAAAAGAACTTTCGCCGATGCACCCGTTAGCAATGAAATGAAGTTTACATTGGCTGGGGCTAATCAGGTATTTTATGATGAAAGTGTGGTTAAACAAGTAGATGTACCATCATTTTCTGGTTCTTTTGGTATTTTACCAAAACATGTTCCTACCTTGGCTGTATTGAAACCAGGCGTAGTCACAGTATATGAAGAAGATGGGGCAGTCAAAAAAGTTTTTGTTTCTTCAGGGACAGTTACTATAAATGAAAACAACAGCGTACAGATTTTAGCGGAAGAAGCTCATCCCCTGGAAAATCTTGATGGGACTGCAGCTAGAGAACTTCTTAGTAAAGCTCAGCAACAGCTTTCATCTGCATCATCGGAACAAGATAAAGCTGAAGCAGCGATTGCCGTTGAAGTTGCAGAAGCTTTAGTACAAGCTGTGCAGTAAACATTGTGCAACCATTGTGTATATATTAAAATATCATTCTGTATAACATTAAATCCTTAGGCAATATA
Земляной шмель относится к первичноротым, поэтому в качестве достаточно удаленного таксона я выбрала семейство Кошачьи (Felidae). Я я выполнила поиск BLAST через сайт NCBI по последовательностям геномов из выбранного таксона для последовательности гена δ-субъединицы АТФ-синтазы земляного шмеля. Я использовала базу данных RefSeq Genome Database. В ней имеется 15 сборок, входящих в семейство Felidae. Сначала мною был выбран метод blastn, чтобы получить, в том числе, варианты с не очень высоким процентом совпадения. По моему запросу было найдено 0 результатов, как я и ожидала, потому что земляной шмель и семейство Кошачьи находятся далеко друг от друга на дереве родства таксонов.
Затем я выбрала инструмент tblastn, так как мне известна белковая последовательность и мне было интересно найти по ней гомологи. Далее я ввела те же параметры, что и при поиске с помощью blastn, а остальные настройки оставила по умолчанию. Я получила 15 не совпадающих друг с другом находок, каждая с процентом идентичности 57.69%. Ожидала 0 находок из-за неродственности организмов. Таблица результатов запроса
Для индексации последовательности генома я воспользовалась следующей командой:
makeblastdb -in GCF_910591885.1_iyBomTerr1.2_genomic.fna -dbtype nucl
Далее я осуществила локальный поиск BLAST по 16S и 23S рРНК Escherichia coli.
образует малую субъединицу бактериальной рибосомы;
связывается с последовательностью Шайна-Дальгарно, что важно для инициации трансляции;
структурная функция.
Основные функции 23S rRNA:
образует большую субъединицу бактериальной рибосомы;
обладает пептидилтрансферазной активностью;
структурная функция.
Я решила использовать blastn, поскольку поиск проводился по не кодирующим белок нуклеотидным последовательностям, и организмы не близкородственные. Я выбрала E-value 0.05, так как при более высоких значениях полученные результаты не будут иметь смысла, а также outfmt 7, чтобы получить результаты в виде таблицы с комментариям.
Использованные команды:
blastn -task blastn -query 16S.fasta -db GCF_910591885.1_iyBomTerr1.2_genomic.fna -out 16s_rRNA_blastn.txt -outfmt 7 -evalue 0.0001 -word_size 11
blastn -task blastn -query 23S.fasta -db GCF_910591885.1_iyBomTerr1.2_genomic.fna -out 23s_rRNA_blastn.txt -outfmt 7 -evalue 0.0001 -word_size 11
Скорее всего, для каждой рРНК было найдено по несколько гомологов, так как у эукариот есть ещё митохондриальные рибосомы 70S помимо основных рибосом типа 80S. Вероятно, в силу гомологии 16S рРНК выравнивается на 18S рРНК, а 23S рРНК - на 28S рРНК. Аннотация совпадает с ожидаемой исходя из результатов поиска. Ссылки на файлы: