УЧЕБНЫЙ САЙТ АРТЕМА МУРАВЛЕВА

Практикум 8

В этом практикуме я выполнял все задания для генома свиньи породы дюрок, выбранного мной для практикума 7.

Задание 1. δ-субъединица АТФ-синтазы

В данном задании были получены данные о δ-субъединице АТФ-синтазы для выбранного м

Идентификатор белка: XP_003123039.1

Последовательность_белка

Идентификатор нуклеотидной записи, содержащей ген, кодирующий данный белок: NC_010444

Последовательность_гена_с_окрестностью

Задание 2. Поиск гомологов δ-субъединицы АТФ-синтазы свиньи среди Пауков(Araneae)

Для гена исследуемого белка был произведен поиск гомологов среди Пауков(Araneae)(так как в рамках задания было необходимо исследовать достаточно таксономически далеких родственников выбранного животного). Из предложенных для анализа вариантов алгоритмов(blastn\megablast; tblastn\tblastx) были выбраны blastn и tblastn(megablast не подходит, так как приспособлен для быстрого поиска очень похожих последовательностей, что не гарантировано в случае настолько далекого родства; tblastn предпочтительнее tblastx, так как позволит выравнивать реально существующий белок на транслированную нуклеотидну базу данных, таким образом исключается влияние на результаты трансляции окружения гена и не кодирующих белок участков гена).

Поиск производился по базе референсных сборок, таких для Araneae было найдено 4(см. Рис.1).

Ошибка
Рисунок 1. Референсные сборок Araneae

При использовании алгоритмов выставлялось максимальное число(5000) находок, проверялись стандартная и минимальная длина слова(11 и 7 для blastn, 5 и 2 для tblastn), различий в результатах при этом не найдено.

tblastn, как и ожидалось, выдал более полный результат, чем blastn. В случае blastn(результаты на Рис.2) был найден гомолог(также δ-субъединица АТФ-синтазы) только у одной из референсных сборок(Argiope bruennichi), тогда как tblastn(результаты на Рис.3) нашел как гомологи δ-субъединицы АТФ-синтазы у всех 4 геномов(были проверены указанные части сборок).

Ошибка
Рисунок 2. Результаты blastn
Ошибка
Рисунок 3. Результаты tblastn

Задание 3. рРНК

В данном задании производилось выравнивание последовательностей 16S_рРНК(рРНК малой субъединицы рибосомы прокариот) и 23S_рРНК(одной из двух рРНК большой субъединицы рибосомы прокариот) E.Coli(str. K-12 substr. MG1655 strain K-12) на геном свиньи для поиска гомологов.

Анализ проводился с помощью blastn(так как вравнваемые последовательности в клетках не транслируются, а значит, нужно использовать нуклеотидную БД). Были использованы как стандартная(11), так и минимальная(4) длина слова для локального blastn, различий в находках не было.

16s_результаты 23s_результаты

Гомологами 16s рРНК у эукариот является 18s рРНК, а 23s - 28s и 5.8s(гомолог небольшой части 23s). В результатах среди лучших находок в обоих случаях обнаружен скэффолд NW_018085108.1, содержащий гены 18s и 5.8s, также гомологи с хорошим счетом были найдены в хромосоме 1(для 16s, NC_010443.5) и 7(для 23s, NC_010449.5). Также среди менее хороших находок митохондриальный геном(NC_000845.1; видимо из-за митохондриальных рРНК), а среди результатов с хорошим счетом скэффолд NW_018084912.1

По какой-то причине непосредственно гены рРНК размечены только на скэффолде NW_018085108.1(при этом в нем не отмечена 28s) и в митохондриальном геноме. Но обычно для плаценатрных млекопитающих характерно несколько кластеров генов рРНК на разных хромосомах, при этом гены рРНК могут быть обозначены как некодирующие РНК(ncRNA), что может объяснять представленные результаты.

Многие хромосомы, а также оба скэффолда, находятся в списке потенциальных гомологов для обеих последовательностей, что служит аргументом в пользу того, что они действительно содержат гены рРНК(как известно, в эукариотах рРНК, кроме 5s, синтезируются в виде единого предшественника)). При этом хорошие находки на хромосомах 1 и 7 встречаются только в одном случае каждая, что ставит под сомнение то, что на них были найдены гены рРНК.