Был выбран участок 156,796,000..156,805,711 (длина 9 711) 1 хромосомы Eublepharis macularius. Идентификатор: NC_072803.1 В данном участке располагается ген ZBTB18, он кодирует цинковый палец и домен BTВ. Длина CDS: 156,797,966..156,805,711
Рис.1. Участок 156,796,000..156,805,711 первой хромосомы. Зеленым цветом показан ген ZBTB18 (фиолетовым и красным-возможные транскрипты). Участки экзонов отмечены толстыми линями, интронов - узкими.
Последовательность можно скачать по ссылке.
Гекконы относятся к отряду Чешуйчатые (Squamata), для сравнения я решила выбрать отряд Crocodilia, так как они являются отрядами класса Пресмыкающиеся.
Результаты поиска
blastn(длина слова - 16): 31 находка
megablast (длина слова - 28): 19 находок
blastx(длина слова - 5): 100 находок
tblastx(длина слова - 3): 100 находок
Примеры использования:
blastn: Сравнивает нуклеотидные последовательности с нуклеотидными базами данных, пример: поиск гомологичных последовательностей.
megablast:Сравнивает нуклеотидную последовательность (предполагаемую мРНК) с белковой базой данных, пример: поиск регуляторных последовательностей у различных организмов
blastx:BLASTn, оптимизированный для быстрого выравнивания последовательностей, которые очень похожи друг на друга (например, при сравнении различных версий одного и того же генома). Множество находок megablast - это подмножество находок blastn.
tblastx: Сравнивает транслированные нуклеотидные базы данных с транслированными нуклеотидными последовательностями. Пример: поиск гомологов, которые не были аннотированы, как кодирующие гены белков.
Для того, чтобы найти гомологи 16S и 23S рРНК E. coli у Eublepharis macularius проиндексируем геном:
makeblastdb -in GCF_028583425.1_MPM_Emac_v1.0_genomic.fna -dbtype nucl
Функции 16S рРНК: находится в малой субъединице рибосомы у бактерий, учавствует в узнавании последовательности Шайн-Дальгарно и стабилизации кодон-антикодонового взаимодействия в аминокислотном сайте (место в рибосомы, где аминокислота-тРНК комплекс вступает во взаимодействие с соответствующим кодоном на мРНК). 16S рРНК способствует распознаванию и гибридизации кодона на мРНК с его антикодоном на тРНК, что обеспечивает правильную добавку аминокислот в растущую полипептидную цепь. Кроме того, учавствует в формировании структуры рибосомы и связывается с белками малой субъединицы (эти взаимодействия способствуют стабилизации трехмерной структуры рибосомы и её функциональной активности)
Функции 23S рРНК: располагается в большой субъеденице, участвует в формировании активного сайта рибосомы, где происходит каталитическая реакция синтеза белка, участвует в взаимодействии с тРНК во время транслокации, помогая в перемещении тРНК и мРНК через рибосому. Еще 23S рРНК обладает рибозимной активностью, то есть способностью катализировать химические реакции. Она является ключевым компонентом пептидилтрансферазного центра рибосомы, который катализирует образование пептидных связей между аминокислотами во время синтеза белка.
Для выравнивания был выбран blastn, так как этот алгоритм наиболее подходит под задачу поиска некодирующих белки аминокислотных последовательностей у неродственных организмов.
blastn -task blastn -query 16s_rRNA.fna -db GCF_028583425.1_MPM_Emac_v1.0_genomic.fna -out 16S_bl.out -outfmt 7 -word_size 11 -evalue 0.05
blastn -task blastn -query 23s_rRNA.fna -db GCF_028583425.1_MPM_Emac_v1.0_genomic.fna -out 23S_bl.out -outfmt 7 -word_size 11 -evalue 0.05
Для 16S рРНК найдено 278 хитов, а для 23S рРНК 1119.
Скачать выдачу blastn для 16S рРНК и 16S рРНК
На этом моменте возник вопрос, почему так много находок, этот вопрос поставил меня в ступор.