Парное выравнивание геномов

Для сравнения были выбраны митохондриальные геномы двух позвоночных: модельной рыбки Danio rerio (рис. 1) и аллигатора Alligator mississippiensis (рис. 2). Выбор может выглядеть глупым, но дело в том, что митохондриальные геномы позвоночных довольно похожи: в них мало генов, практически все из которых завязаны на функциониравание электрон-транспортной цепи. Без них нормальное функционирование организма, превышающее 7 минут (мировой рекорд по задержке дыхания), не представляется возможным. Как следствие, аминокислотные последовательности этих белков довольно консервативны.

Помимо этого, митохондрии позвоночных обладают специфичным генетическим кодом и принципиально другим строением рибосом (прокариотичексим), из-за чего в остатках генома бывшей альфа-протеобактерии остались собственные гены тРНК и рРНК. Без них невозможна трансляция белков, поэтому эти гены наиболее консервативны.


Выровненные геномы имели идентификаторы AC024175.3 и Y13113.1 для рыбки и аллигатора соответственно. Использовал программы blastn (рис. 3, слева) и megablast (рис. 3, справа), параметры оставлены по умолчанию (из ключевых отмечу длину слова 11 и 28 соответственно).

blast
Рис. 3. Слева результаты blastn, справа — megablast. По оси Х отложен Danio rerio, по оси Y Alligator mississippiensis.

По результатам megablast хорошо видно, что на найденных участках лежат гены тРНК и рРНК. Это наиболее консервативные участки митохондриального генома, так как если они выйдут из строя, нормальная трансляция будет невозможна. Остальные участки оказались слишком вариабельными (и как следствие, недостаточно схожими у выбранных организмов), чтобы алгоритмы megablast могли найти сходство между ними. Поэтому основные выводы будем делать именно на основе blastn.

В случае blastn совпадение выбранных геномов почти полное. Никаких геномных перестроек не было. Отмечу два относительно крупных гэпа, один из которых (~15 000) связан с субъединицами NADH-дегидрогеназы, а природу второго (~5 500) установить не удалось.

Также у Danio rerio выравнивание начинается с ~1000 нуклеотидов. В невыровненном регионе гипервариабельная D-петля, участвующая в регуляции траскрипции и репликации митохондриальной ДНК. В геноме аллигатора этой петли не было, но зато в конце есть putative control region — возможно, это и есть D-петля (геном же кольцевой), но поскольку у разных авторов этот регион называется разными терминами, не готов утверждать это без отдельного локального выравнивания.