Для выполнения последующих двух исследований и анализов необходимо было получить некоторые данные о гене δ-субъединицы АТФ-синтазы для выбранного мною в прошлом практикуме организма (это C. elegans, смотри Практикум 7). Из файлов, скачанных и представленных в прошлом практикуме, были получена следующая необходимая информация о данном гене у данного организма:
АТФ-синтаза – один из самых известных и распространенных белков среди аэробных организмов. Мне захотелось проверить его консервативность на примере структуры гена и конкретного белка, входящего в состав АТФ-синтазы (собственно δ-субъединицы моего ранее выбранного организма).
Для проведения данного исследования необходимо было выбрать таксон, достаточно далекий от исходного организма (поскольку интересует именно консервативность глобально, а не среди родственников), поскольку мой организм принадлежит к первичноротым животным, то таксон выбирался среди вторичноротых. Выбор был среди наиболее всем известных представителей: семейство Кошачьи (Felidae) и Собачьи (Canidae). Методом тыка был выбрал первый таксон. Поиск нужной информации происходился с помощью двух типов программы BLAST (об этом ниже) на сайте . База данных для поиска была взята довольно известная база данных RefSeq Genome Database, в которой было 15 геномных сборок, входящих в этот таксон. Программы были следующие:
В этом задании я попытался отыскать гомологов 16S рРНК (последовательность) и 23S рРНК (последовательность) E. coli у выбранной мною нематоды. Для этого сперва был проиндексирован мой геном (файл genome_seq.fna) следующей командой:
После чего был запущен алгоритм blastn (был выбран именно он, так как он подходит для поиска похожих некодирующих белки нуклеотидных последовательностей даже среди неблизкородственных организмов), в качестве запроса были поданы как раз выше упомянутые последовательности 16S и 23S рРНК. Команды следующие:
Результаты выдачи blastn можно посмотреть здесь: 16S-таблица и текст, 23S-таблица и текст (текстовый формат был получен аналогичными командами, но без -outfmt 7). Как видно для 16S было обнаружено 10 находок, среди них все находки, относящиеся к хромосоме 1 содержат участки 2 генов 18S рРНК у нематоды, то есть это и есть искомый гомолог для 16S, остальные находки относятся либо к неаннотированным областям, либо к генам белков. Для 23S – 13 находок, и снова те, что относятся к хромосоме 1 содержат участки гена, кодирующего 26S рРНК, а также псевдогена этой рРНК, и это второй искомый гомолог (они аннотированы и аннотация совпадает с ожиданиями для обоих рРНК), остальные находки не относятся к гомологам. На Рис. 4 можно видеть найденный участок с гомологами к рРНК у нематоды:
Известно, что рРНК необходимы для поддержания структуры и работы рибосом, так 16S рРНК помимо структурной функции для малой субъединицы также необходима для связывания с мРНК во время трансляции (по последовательности Шайно-Дельгарно), а 23S рРНК армирует большую субъединицу и катализирует реакцию роста пептидной цепи в ъоде трансляции. Аналогичные функции выполняют и найденные гомологи у нематоды (конкретно 18S и 26S для цитозольных эукариотических рибосом).