Практикум №8

Поиск в геноме эукариота гена, кодирующего δ-субъединицу АТФ-синтазы

Идентификатор белка и его последовательность:

>XP_003398518.1 ATP synthase subunit delta, mitochondrial [Bombus terrestris]

MATIARNLRPYLKYIRNQKRTFADAPVSNEMKFTLAGANQVFYDESVVKQVDVPSFSGSFGILPKHVPTLAVLKPGVVTVYEEDGAVKKVFVSSGTVTINENNSVQILAEEAHPLENLDGTAARELLSKAQQQLSSASSEQDKAEAAIAVEVAEALVQAVQ

Идентификатор нуклеотидной записи, к которой относится ген, кодирующий данный белок, - NC_063278.

Последовательность небольшой окрестности гена:

>XM_003398470.4 PREDICTED: Bombus terrestris ATP synthase subunit delta, mitochondrial (LOC100645765), mRNA

AACGCCATCGTTTGAGCATAATAGAAACCTTGTCATCTGTATTACTTGGTACTATGTATATGTATTAATTGGTTTGGATTTCGTCTGCCTGCTTGCAGTGACTGATACCAATTTCTACTTACATCTTCAATAATTATCATAACTATATTAAAATGGCTACTATCGCACGCAATCTACGCCCTTATTTAAAATATATTCGTAATCAAAAAAGAACTTTCGCCGATGCACCCGTTAGCAATGAAATGAAGTTTACATTGGCTGGGGCTAATCAGGTATTTTATGATGAAAGTGTGGTTAAACAAGTAGATGTACCATCATTTTCTGGTTCTTTTGGTATTTTACCAAAACATGTTCCTACCTTGGCTGTATTGAAACCAGGCGTAGTCACAGTATATGAAGAAGATGGGGCAGTCAAAAAAGTTTTTGTTTCTTCAGGGACAGTTACTATAAATGAAAACAACAGCGTACAGATTTTAGCGGAAGAAGCTCATCCCCTGGAAAATCTTGATGGGACTGCAGCTAGAGAACTTCTTAGTAAAGCTCAGCAACAGCTTTCATCTGCATCATCGGAACAAGATAAAGCTGAAGCAGCGATTGCCGTTGAAGTTGCAGAAGCTTTAGTACAAGCTGTGCAGTAAACATTGTGCAACCATTGTGTATATATTAAAATATCATTCTGTATAACATTAAATCCTTAGGCAATATA

Разные варианты BLAST для фрагмента ДНК

Земляной шмель относится к первичноротым, поэтому в качестве достаточно удаленного таксона я выбрала семейство Кошачьи (Felidae). Я я выполнила поиск BLAST через сайт NCBI по последовательностям геномов из выбранного таксона для последовательности гена δ-субъединицы АТФ-синтазы земляного шмеля. Я использовала базу данных RefSeq Genome Database. В ней имеется 15 сборок, входящих в семейство Felidae. Сначала мною был выбран метод blastn, чтобы получить, в том числе, варианты с не очень высоким процентом совпадения. По моему запросу было найдено 0 результатов, как я и ожидала, потому что земляной шмель и семейство Кошачьи находятся далеко друг от друга на дереве родства таксонов.

Затем я выбрала инструмент tblastn, так как мне известна белковая последовательность и мне было интересно найти по ней гомологи. Далее я ввела те же параметры, что и при поиске с помощью blastn, а остальные настройки оставила по умолчанию. Я получила 15 не совпадающих друг с другом находок, каждая с процентом идентичности 57.69%. Ожидала 0 находок из-за неродственности организмов. Таблица результатов запроса

Поиск в геноме эукариота генов основных рибосомальных РНК по далекому гомологу

Для индексации последовательности генома я воспользовалась следующей командой:

makeblastdb -in GCF_910591885.1_iyBomTerr1.2_genomic.fna -dbtype nucl

Далее я осуществила локальный поиск BLAST по 16S и 23S рРНК Escherichia coli.

Я решила использовать blastn, поскольку поиск проводился по не кодирующим белок нуклеотидным последовательностям, и организмы не близкородственные. Я выбрала E-value 0.05, так как при более высоких значениях полученные результаты не будут иметь смысла, а также outfmt 7, чтобы получить результаты в виде таблицы с комментариям.

Использованные команды:

blastn -task blastn -query 16S.fasta -db GCF_910591885.1_iyBomTerr1.2_genomic.fna -out 16s_rRNA_blastn.txt -outfmt 7 -evalue 0.0001 -word_size 11

blastn -task blastn -query 23S.fasta -db GCF_910591885.1_iyBomTerr1.2_genomic.fna -out 23s_rRNA_blastn.txt -outfmt 7 -evalue 0.0001 -word_size 11

Скорее всего, для каждой рРНК было найдено по несколько гомологов, так как у эукариот есть ещё митохондриальные рибосомы 70S помимо основных рибосом типа 80S. Вероятно, в силу гомологии 16S рРНК выравнивается на 18S рРНК, а 23S рРНК - на 28S рРНК. Аннотация совпадает с ожидаемой исходя из результатов поиска. Ссылки на файлы: