Практикум 8. Нуклеотидный BLAST

Задание 1

Был выбран участок 156,796,000..156,805,711 (длина 9 711) 1 хромосомы Eublepharis macularius. Идентификатор: NC_072803.1 В данном участке располагается ген ZBTB18, он кодирует цинковый палец и домен BTВ. Длина CDS: 156,797,966..156,805,711

Рис.1. Участок 156,796,000..156,805,711 первой хромосомы. Зеленым цветом показан ген ZBTB18 (фиолетовым и красным-возможные транскрипты). Участки экзонов отмечены толстыми линями, интронов - узкими.

Последовательность можно скачать по ссылке.

Поиск в BLAST

Гекконы относятся к отряду Чешуйчатые (Squamata), для сравнения я решила выбрать отряд Crocodilia, так как они являются отрядами класса Пресмыкающиеся.

Результаты поиска

blastn(длина слова - 16): 31 находка

megablast (длина слова - 28): 19 находок

blastx(длина слова - 5): 100 находок

tblastx(длина слова - 3): 100 находок

Примеры использования:

blastn: Сравнивает нуклеотидные последовательности с нуклеотидными базами данных, пример: поиск гомологичных последовательностей.

megablast:Сравнивает нуклеотидную последовательность (предполагаемую мРНК) с белковой базой данных, пример: поиск регуляторных последовательностей у различных организмов

blastx:BLASTn, оптимизированный для быстрого выравнивания последовательностей, которые очень похожи друг на друга (например, при сравнении различных версий одного и того же генома). Множество находок megablast - это подмножество находок blastn.

tblastx: Сравнивает транслированные нуклеотидные базы данных с транслированными нуклеотидными последовательностями. Пример: поиск гомологов, которые не были аннотированы, как кодирующие гены белков.

Задание 2

Для того, чтобы найти гомологи 16S и 23S рРНК E. coli у Eublepharis macularius проиндексируем геном:

 makeblastdb -in GCF_028583425.1_MPM_Emac_v1.0_genomic.fna -dbtype nucl

Функции 16S рРНК: находится в малой субъединице рибосомы у бактерий, учавствует в узнавании последовательности Шайн-Дальгарно и стабилизации кодон-антикодонового взаимодействия в аминокислотном сайте (место в рибосомы, где аминокислота-тРНК комплекс вступает во взаимодействие с соответствующим кодоном на мРНК). 16S рРНК способствует распознаванию и гибридизации кодона на мРНК с его антикодоном на тРНК, что обеспечивает правильную добавку аминокислот в растущую полипептидную цепь. Кроме того, учавствует в формировании структуры рибосомы и связывается с белками малой субъединицы (эти взаимодействия способствуют стабилизации трехмерной структуры рибосомы и её функциональной активности)

Функции 23S рРНК: располагается в большой субъеденице, участвует в формировании активного сайта рибосомы, где происходит каталитическая реакция синтеза белка, участвует в взаимодействии с тРНК во время транслокации, помогая в перемещении тРНК и мРНК через рибосому. Еще 23S рРНК обладает рибозимной активностью, то есть способностью катализировать химические реакции. Она является ключевым компонентом пептидилтрансферазного центра рибосомы, который катализирует образование пептидных связей между аминокислотами во время синтеза белка.

Для выравнивания был выбран blastn, так как этот алгоритм наиболее подходит под задачу поиска некодирующих белки аминокислотных последовательностей у неродственных организмов.

  blastn -task blastn -query 16s_rRNA.fna -db GCF_028583425.1_MPM_Emac_v1.0_genomic.fna -out 16S_bl.out -outfmt 7 -word_size 11 -evalue 0.05 
  blastn -task blastn -query 23s_rRNA.fna -db GCF_028583425.1_MPM_Emac_v1.0_genomic.fna -out 23S_bl.out -outfmt 7 -word_size 11 -evalue 0.05 

Для 16S рРНК найдено 278 хитов, а для 23S рРНК 1119.

Скачать выдачу blastn для 16S рРНК и 16S рРНК

На этом моменте возник вопрос, почему так много находок, этот вопрос поставил меня в ступор.