Нуклеотидный BLAST

Разные варианты BLAST для фрагмента ДНК

Для этого задания я выбрала участок 11160837..11168667 (7831 п.н.) из 34 хромосомы Ястреба‑тетеревятника (нуклеотидная запись NC_064913.1). На этом фрагменте ДНК расположен ген фосфатазы DUS6 (4755 п.н.).

DUSP6
Рис. 1. Схема расположения гена на выбранном участке. Зеленым обозначен ген, светло-зеленым — 5'- и 3'-нетранслируемые области, фиолетовым — мРНК, красным — CDS.

Последовательность фрагмента

BLAST для этого фрагмента я решила провести среди Рептилий:

Поиск генов рРНК по далекому гомологу

16S рРНК входит в состав малой субъединицы, 23S рРНК в состав большой субъединицы прокариотической рибосомы.

Для этого задания был выбран blastn, т.к. нам нужно искать ген рРНК (а не белка) и используются нуклеотидные последовательности сильно разошедшихся организмов.

Проиндексируем геном тетеревятника:

makeblastdb -in GCF_929443795.1_bAccGen1.1_genomic.fna -dbtype nucl

Файл с последовательностями рРНК Escherichia coli был разделен на файлы 16S.txt и 23S.txt. И был проведен поиск по созданной при индексации генома эукариота базе данных:

blastn -task blastn -evalue 0.05 -query 16S.txt -db GCF_929443795.1_bAccGen1.1_genomic.fna
-out blastn_16S.txt -outfmt 7
blastn -task blastn -evalue 0.05 -query 23S.txt -db GCF_929443795.1_bAccGen1.1_genomic.fna
-out blastn_23S.txt -outfmt 7

Значение аргумента -evalue выставлено как в web-версии, а аргумент -outfmt нужен для вывода в табличку.

Бласт по 16S выдал 55 находок, а по 18S — 278. В результате поисков был найден замечательнейший участок на 35 хромосоме (рис. 2), где расположись рРНК (одна 28S (верхний ряд, самая левая), 18S и 5.8S). 16S рРНК выравнивалась на 18S, а вот 26S на 28S (единственную), а также на участки между аннотированными рРНК и на неохарактеризованные псевдогены (серые на рисунке).

rRNAs
Рис. 2. Схема расположения рРНК на выбранном участке 35-й хромосомы. Фиолетовым обозначены рРНК, по их размеру можно определить какие: самая длинная слева сверху — 28S, средние — 18S и совсем тоненькие — 5.8S, серым цветом обозначены псевдогены.