Я выбрала участок с 17 хромосомы (идентификатор нуклеотидной записи – NC_062229.1) с координатами 276549..280758 (4,210 п.н.), в нём содержится поcледовательность гена глутатионпероксидазы 4 Gpx4 длиной 2,105 п.н.
Ссылка на файл с последовательностью
Для BLAST я решила взять таксон Sauropsida (рептилии). Mammalia, к которым относится каролинская белка, и Sauropsida относятся к одному надклассу Amniota
Чтобы проиндексировать последовательность генома, я воспользовалась следующей программой:
makeblastdb -in GCF_902686445.1_mSciCar1.2_genomic.fna -dbtype nucl
Далее я осуществила локальный поиск BLAST по 16S и 23S рРНК Escherichia coli. 16S рРНК выполняет структурную функцию, выступая в качестве каркаса малой субъединицы рибосомы прокариот, а так же на 3'-конце содержит последовательность анти-Шайна-Дальгарно, с помощью которой связывается с мРНК. 23S рРНК входит в состав большой субъединицы рибосомы прокариот и входит в каталитический пептидилтрансферазный центр на рибосоме
Я решила использовать blastn, так как нужно было сравнить нуклеотидные последовательности неблизкородственных организмов. В качестве парметров я взяла evalue 0.05, чтобы отсеять плохие находки, а также outfmt 7, чтобы получить результаты в виде таблицы с комментариями
Команды:
blastn -task blastn -query 16S.txt -db GCF_902686445.1_mSciCar1.2_genomic.fna -out blastn_16S.out -evalue 0.05 -outfmt 7
blastn -task blastn -query 23S.txt -db GCF_902686445.1_mSciCar1.2_genomic.fna -out blastn_23S.out -evalue 0.05 -outfmt 7
Для 16S рРНК 3 находки – 1 хромосома и 2 скэффолда. Файл с выдачей.
Для 23S рРНК 10 находок – 1 хромосома и 9 скэффолдов. Файл с выдачей.
Участки на хромосомах, к сожалению, не аннотированы, а вот участки на скэффолдах соответствуют 18S рРНК и 28S рРНК для 16S и 23S соответственно, что, в общем-то, неудивительно, так как они являются гомологами.