![]() |
Для выполнения данного задания были выбраны 3 штамма Sulfolobus islandicus - вид термофильных архей, впервые обнаруженный в исландских серных источниках. Эта архея способна вести как хемоавтотрофный образ жизни, используя в качестве источника энергии серу или сероводород, так и гетеротрофно. Данный организм удобен для генетической инженерии, так как обладает небольшим геномом, способен принимать плазмиды и генетически стабилен, помимо этого в геном некоторых штаммов входят инвертированные повторы ДНК-транспозонов [1]. В Таблице 1 собрана информация о выбранны штаммах, и указаны ссылки на последовательности их геномов в fasta-формате.
Таблица 1. Характеристика штаммов Sulfolobus islandicus. | ||||
С помощью программы blastn были проанализированы попарно последовательно три генома. Рис. 2-4 показывают карты локального сходства, построенные blast, а в Таблице 2 приведены некоторые характеристики сравнений.
Таблица 2. Характеристика штаммов Sulfolobus islandicus. | |||
![]() |
![]() |
![]() |
Рис. 2. Сравнение штаммов M.16.27 и REY15A Как видно из карты локального сходства, у штамма REY15A в позициях 0,6 - 0,8 М произошла инверсия, а в последующем участке делеция нескольких сотен пар нуклеотидов или же у штамма M.16.27 произошла вставка последовательности в позициях 0,8-0,9 М. На участке 2,4 - 2,5 М наблюдается также инвертированный участок. | Рис. 3. Сравнение штаммов HVE104 и M.16.27 Для данных штаммов существует участок длиной около 0,6 М, в котором происходили перестройки. Можно увидеть как инвертированные участки, причем инверсия происходила немного в другом порядке, так и вставки последовательностей у обоих штаммов. | Рис. 4. Сравнение штаммов HVE104 и REY15A Так же, как и для второго сравнения существует участок длиной около 0,6 М, в котором произошла инверсия и вставка/делеция последовательности. Можно также заметить, что как и в первом сравнении на участке 2,3 - 2,4 М имеется инвертированный участок, что позволяет сделать вывод о том, что в этом месте в штамме REY15A произошла инверсия. |
С помощью программы NPG-explorer был построен и визуализирован нуклеотидный пангеном.
Был найден 71 синтеничный участок, то есть найден 71 g-блок (глобальный блок, состоящий из последовательно идущих s-блоков, или стабильных блоков, которые содержат по одному фрагменту из каждого генома, и перемежаются с блоками других типов). Самый большой из них состоит из 448043 п.н. и в состав его входят 214 блоков разных типов, в том числе 23 s-блока.
![]() |
Наибольшее число s-блоков (26) наблюдается в g3x200960. Ниже представлено отображение s-блока - стабильного блока, в который входит по одному фрагменту из каждого генома. Блок длиной 10591 п.н., в котором закодированы 43 гена, является первым блоком, входящим в состав блока g3x448043.
![]() |
Анализировались различные блоки, в которые входят фрагменты только из двух геномов, было выяснено, что таких сходных блоков больше для штаммов HVE104 и REY15A. Для примера приведен h-блок, состоящий из 3720 п.н. В состав его входят 6 генов, кодирующих CRISPR-связанные RAMP белки. Возможно, отсутствие этих белков в штамме M.16.27 связано с тем, что они лишены такого механизма защиты.
![]() |
Кроме того, программа NPG-explorer способна распознавать сходство в последовательностях прямой и обратной цепочек, так ниже представлен пример h-блока, состоящего из 216 п.н. и кодирующего 4 гена, при этом для штамма HVE104 этот участок последовательности является обратным.
![]() |
Встречаются также идентичные участки для двух послеовательностей, в которых не закодированы гены. Ниже представлен h-блок, состоящий из 116 нуклеотидов и обладающий 100% идентичностью.
![]() |
Минорные блоки, или m-блоки - короткие блоки, которые не удается включить в другие блоки, зачастую включают в себы последовательности, кодирующие гипотетические белки, либо части кодирующих белки последовательности, либо совсем не включают кодирующих последовательностей. Так, ниже представлен такой блок, состоящий из 67 п.н., видно, что белок закодирован лишь в одном из геномов (белые литеры).
![]() |
Довольно много уникальных участков наблюдается для штамма M.16.27, ниже представлен u-блок - уникальные последовательности из одного генома,у них нет гомологов среди всех геномов, кроме самой себя. Он состоит из 23376 п.н. и включает 33 гена, однако большинство белков, которые закодированы в этой последовательнотси относятся к гипотетическим.
![]() |
Однако в геноме у штамма HVE104 в таком уникальном участке содержатся последовательность, кодирующая белок уреазу - гидролитический фермент из группы амидаз, обладающий специфическим свойством катализировать гидролиз мочевины до диоксида углерода и аммиака [3]. Последовательность этого фермента не присутствует в других штаммах, скорее всего, это можно объяснить вставкой данного гена в штамм HVE104 путем, например, горизонтального переноса. В данном уникальном участке закодировано всего 7 белков, и все они принадлежат к сходной группе ферментов.
![]() |
А у штамма REY15A в уникаьном участке находится последовательность, кодирующая фермент гликозил трансферазу, который не встречается у других штаммов, помимо этого в u-блок входит ещё 4 гипотетических белка.
![]() |
Благодаря NPG-explorer в штамме HVE104 был обнаружен участок, в который встроилась последовательность длиной 741 п.н. В блоке g3x23244, эти выводы сделаны на основании того, что участков, комплементарных 6 блокам, нет у других штаммов, а вокруг находятся s-блоки.
![]() |
Для отображения повторяющихся участков геномов существуют r-блоки - блоки с повторами, по крайней мере, в одном геноме. Ниже приведен пример r-блока, состоящего из 34 фрагментов, то есть сходные участки наблюдаются 34 раза, в данном случае, в двух геномах штаммов HVE104 и REY15A. Длина фрагментов 115 п.н. Как видно из Рис. 8 эти участки повторяются в прямом прочтении, а также видно, что данным повторам соответствуют транспозоны, кодирующие транспозазу, позволяющую транспозонам быть вырезанными из геномной ДНК и встроенными в другие места, или же это уже результат такого процесса [4]. При этом данный участок инвертирован, то есть расположен в геноме в обратном направлении. Наличие транспозонов почти невозможно понять из карты сходства blast, поэтому в данном вопросе NPG-explorer незаменим.
![]() |
Помимо этого, была найдена схожая инверсия в штамме REY15A в блоке g3x79017, где повторение также обусловлено наличием транспозонов, причем повторы встречаются в разных участках генома.
![]() |
Интересной особенностью Sulfolobus islandicus является то, что их заражют лизогенные вирусы Sulfolobus, чтобы защитить себя от чрезвычайно высокой кислотности окружающей среды и повышенной температуры. При этом после заражения вирусы реплицируются внутри археи, не лизируя клетку-хозяина [5]. Ниже представлен r-блок, найденный в геноме штамма REY15A, он состоит из 2 фрагментов длиной 100 п.н. и кодирует консервативный провирусный белок. Это можно объяснить тем, что при попадании в архею вируса он встроил часть своей ДНК в геном хозяин, эта последовательность в дальнейшем сохранилась и была секвенирована.
![]() |
Помимо всего выше перечисленного программа NPG-explorer выдает очень много полезной информации, в том числе строит гипотетическое филогенетическое дерево. На Рис. 10 Вы можете ознакомиться с таким деревом, построенным для данных трех штаммов. Как видно из этого рисунка штамм M.16.27 располагется дальше всего из этих трех штаммов, что подтверждалось наличием большого количества уникальных участков, характерных для него и найденных как с помощью blast, так и NPG-explorer.
[1]Описание Sulfolobus islandicus [2]Sulfolobus islandicus [3]Уреаза [4]Транспозоны [5]Sulfolobus |