Нуклеотидный BLAST

Выбор последовательности внутри генома

Из первой хромосомы референсной сборки генома Danio rerio(идентификатор: GCA_000002035.4) был вырезан фрагмент 207950-215419.

Схема расположения элементов в фрагменте. Сиреневым обозначены разные варианты мРНК, внутри них не выделенные участки - не транскрибируемые участки, красным - CDS.

В данный фрагмент попадает 1 ген - dcun1d2b(DCN1), в нем - 6 CDS.

Последовательность фрагмента

Поиск гомологичных последовательностей

Использование различных алгоритмов blast

Целевым таксоном выбрала подкласс Хрящевые рыбы(cartilaginous fishes в blast). Во всех случаях blast запускался со стандартными параметрами.

Поиск генов рибосомальных РНК

Файл с геномом превышает квоту на диске, поэтому для дальнейшей работы выбран геном Saccharomyces cerevisiae(GCF_000146045.2, референсная сборка)

gzip -d GCA_000002035.4_GRCz11_genomic.fna.gz

gzip: GCA_000002035.4_GRCz11_genomic.fna: Disk quota exceeded

Для поиска использовался алгоритм blastn - рРНК не транслируются, поэтому эволюция последовательностей не зависит от соответствующего пептида и blastx и tblastx применять бессмысленно.

makeblastdb -in GCF_000146045.2_R64_genomic.fna -dbtype nucl

blastn -task blastn -query 16s_rRNA.fna -db GCF_000146045.2_R64_genomic.fna -out 16s_rRNA_blastn.txt -outfmt 7 -evalue 0.05

blastn -task blastn -query 23s_rRNA.fna -db GCF_000146045.2_R64_genomic.fna -out 23s_rRNA_blastn.txt -outfmt 7 -evalue 0.05

16s рРНК

23s рРНК

Находки есть и на аутосомах, и в митохондриальной ДНК(тк и там, и там закодированы рРНК). 16s рРНК выравнивается на 18s, 23s - на 35s.

Регион, содержащий рРНК