Для этого задания я выбрала участок 11160837..11168667 (7831 п.н.) из 34 хромосомы Ястреба‑тетеревятника (нуклеотидная запись NC_064913.1). На этом фрагменте ДНК расположен ген фосфатазы DUS6 (4755 п.н.).
BLAST для этого фрагмента я решила провести среди Рептилий:
Алгоритм megablast (длина слова 28) выдал 18 находок, являющися предсказанными мРНК для DUSP6. Megablast используется для быстрого поиска почти идентичных последовательностей близкородственных видов или, например, картирования известной последовательности на геном.
Алгоритм blastn (длина слова 11) выдал 230 находок, и все они тоже являются предсказанными мРНК для DUSP6. Blastn используется для поиска гомологичных последовательностей и сравнения геномов не близкородственных организмов.
Алгоритм blastx (длина слова 5) выдал 500/500 находок, белков DUSP6 рептилий. Blastx используется для поиска гомологичных белков, когда мы имеем только последовательность гена.
Алгоритм tblastx (длина слова 3) выдал ошибку, даже после расширения выборки до всех хордовых и изменения параметров, все равно выдавалась ошибка. Tblastn используется для поиска гомологов белка по последовательностям, в которых белки не предсказаны.
16S рРНК входит в состав малой субъединицы, 23S рРНК в состав большой субъединицы прокариотической рибосомы.
Для этого задания был выбран blastn, т.к. нам нужно искать ген рРНК (а не белка) и используются нуклеотидные последовательности сильно разошедшихся организмов.
Проиндексируем геном тетеревятника:
makeblastdb -in GCF_929443795.1_bAccGen1.1_genomic.fna -dbtype nucl
Файл с последовательностями рРНК Escherichia coli был разделен на файлы 16S.txt и 23S.txt. И был проведен поиск по созданной при индексации генома эукариота базе данных:
blastn -task blastn -evalue 0.05 -query 16S.txt -db GCF_929443795.1_bAccGen1.1_genomic.fna
-out blastn_16S.txt -outfmt 7
blastn -task blastn -evalue 0.05 -query 23S.txt -db GCF_929443795.1_bAccGen1.1_genomic.fna
-out blastn_23S.txt -outfmt 7
Значение аргумента -evalue выставлено как в web-версии, а аргумент -outfmt нужен для вывода в табличку.
Бласт по 16S выдал 55 находок, а по 18S — 278. В результате поисков был найден замечательнейший участок на 35 хромосоме (рис. 2), где расположись рРНК (одна 28S (верхний ряд, самая левая), 18S и 5.8S). 16S рРНК выравнивалась на 18S, а вот 26S на 28S (единственную), а также на участки между аннотированными рРНК и на неохарактеризованные псевдогены (серые на рисунке).