Нуклеотидный BLAST


Разные варианты BLAST для фрагмента ДНК

Я выбрала участок с 17 хромосомы (идентификатор нуклеотидной записи – NC_062229.1) с координатами 276549..280758 (4,210 п.н.), в нём содержится поcледовательность гена глутатионпероксидазы 4 Gpx4 длиной 2,105 п.н.

участок
Рис 1. Участок 17 хромосомы, включающий в себя ген Gpx4. Зелёным цветом показан ген, светло-зелёным – 5' и 3'-нетранслируемые области, фиолетовым – мРНК, а красным – CDS

Ссылка на файл с последовательностью

Для BLAST я решила взять таксон Sauropsida (рептилии). Mammalia, к которым относится каролинская белка, и Sauropsida относятся к одному надклассу Amniota

Поиск в геноме генов основных рибосомальных РНК по далекому гомологу

Чтобы проиндексировать последовательность генома, я воспользовалась следующей программой:

makeblastdb -in GCF_902686445.1_mSciCar1.2_genomic.fna -dbtype nucl

Далее я осуществила локальный поиск BLAST по 16S и 23S рРНК Escherichia coli. 16S рРНК выполняет структурную функцию, выступая в качестве каркаса малой субъединицы рибосомы прокариот, а так же на 3'-конце содержит последовательность анти-Шайна-Дальгарно, с помощью которой связывается с мРНК. 23S рРНК входит в состав большой субъединицы рибосомы прокариот и входит в каталитический пептидилтрансферазный центр на рибосоме

Я решила использовать blastn, так как нужно было сравнить нуклеотидные последовательности неблизкородственных организмов. В качестве парметров я взяла evalue 0.05, чтобы отсеять плохие находки, а также outfmt 7, чтобы получить результаты в виде таблицы с комментариями

Команды:

blastn -task blastn -query 16S.txt -db GCF_902686445.1_mSciCar1.2_genomic.fna -out blastn_16S.out -evalue 0.05 -outfmt 7

blastn -task blastn -query 23S.txt -db GCF_902686445.1_mSciCar1.2_genomic.fna -out blastn_23S.out -evalue 0.05 -outfmt 7

Для 16S рРНК 3 находки – 1 хромосома и 2 скэффолда. Файл с выдачей.

Для 23S рРНК 10 находок – 1 хромосома и 9 скэффолдов. Файл с выдачей.

Участки на хромосомах, к сожалению, не аннотированы, а вот участки на скэффолдах соответствуют 18S рРНК и 28S рРНК для 16S и 23S соответственно, что, в общем-то, неудивительно, так как они являются гомологами.