Анализ крупных перестроек геномов






Следите за обновлениями и дополнениями
Если Вы заметили опечатки, или ссылка испортилась, пожалуйста, напишите мне


Выбор геномов

Рисунок 1. Бактерии семейства Clostridiaceae

Для выполнения практикума были выбраны три генома бактерий, относящихся к роду [Clostridium] stercorarium из семейства Clostridiaceae. Клостридии уже ранее описывались в

  • предыдущих практикумах.
    1. [Clostridium] stercorarium subsp. leptospartum DSM 9219 (firmicutes)
    2. [Clostridium] stercorarium subsp. stercorarium DSM 8532
    3. [Clostridium] stercorarium subsp. thermolacticum DSM 2910


    Были скачаны последовательности геномов бактерий. Каждая содержит по одной хромосоме без плазмид. Найти их можно в директории


    Исследование перестроек в геномах

    С помощью программы blast2seq был произведён поиск геномных перестроек между тремя штаммами бактерий. На рисунках 2-4 показаны получившиеся карты локального сходства. Из полученных данных следует, что выбор был произведён неудачно и поиск следует продолжить, так как крупных геномных перестроек не наблюдается.



    Рисунок 2. Результаты работы blast2seq 1-2
    Рисунок 3. Результаты работы blast2seq 1-3
    Рисунок 4. Результаты работы blast2seq 2-3

    Было найдено ещё несколько аналогичных близких троек последовательностей. Наибольший интерес представляли следующие ниже карты.



    Рисунок 1. Бактерии семейства Bacillus

    Для выполнения практикума были выбраны три генома бактерий, относящихся к другому виду - Bacillus velezensis из рода Bacillus.

    1. Bacillus velezensis strain ATR2
    2. Bacillus velezensis strain SCDB 291
    3. Bacillus velezensis strain SCGB 1


    Последовательности лежат в директории


    Параметры выравниваний геномов

    Query cover, полученное для трёх выравниваний с помощью blast2seq было в каждом случае равно 93%.

    Исследование перестроек в геномах

    С помощью программы blast2seq повторно был произведён поиск геномных перестроек между тремя штаммами бактерий. На рисунках 5-7 показаны получившиеся карты локального сходства.



    Рисунок 5. Результаты работы blast2seq 1-2. х-1, у-2
    Рисунок 6. Результаты работы blast2seq 1-3. х-1, у-3
    Рисунок 7. Результаты работы blast2seq 2-3. х-2, у-3


    Карты локального сходства говорят об отсутствии крупных перестроек в геноме разных штаммов. Выравнивания говорят о том, что кольцевые хромосомы бактерий собирались и были записан, начиная с разных геномных координат. Стоит отметить наличие около десятка мелких блоков локального сходства, присутствующих на каждой из карт. Скорее всего, это участки коротких дупликаций или повторов, многократно повторённые в геномах или в одном из геновов.

    Чтобы найти и описать больше геномных перестроек и сравнить данные выравнивания заведомо неродственных штаммов, был выбран штамм из другого рода - Bacillus cereus C1L. Видно, что последовательности имеют низкое сходство. Участок в 300 пар нуклеотидов является общим для обоих штаммов и располагается примерно от 500 до 800 пар нуклеотидов по оси абсцисс. У предков данных штаммов произошла инверсия участков от 1 до 2.25 и от 2.5 и до 4.5 Мбаз. Их разбиение может свидетельствовать о сборке геномов с разных точек. Также имеется гомологичный участок от 4.5 до 4.7 Мбаз по оси х. Сравнение геномов отдалённых штаммов даёт сложно интерпретируемый результат.

    Рисунок 9. Результаты работы blast2seq. х-2, у-Bacillus cereus C1L





    Рисунок 10. Бактерии рода Methanosarcina

    С n-ой попытки всё же были найдены штаммы, представляющие некоторый интерес. Их ID:


    CP009512.1
    CP004144.1
    CP009512.1

    1. Methanosarcina mazei WWM610
    2. Methanosarcina mazei Tuc01
    3. Methanosarcina mazei S-6

    Параметры выравниваний геномов

    Query cover, полученные для трёх выравниваний с помощью blast2seq были равны:
    1-2 87% С покрытием 99%
    1-3 93% С покрытикм 99%
    2-3 98% С покрытием 97%
    С помощью NPG-explorer были найдены параметры, оценивающие сходство трёх геномов.

    Исследование перестроек в геномах

    На рисунках 11-13 показаны получившиеся карты локального сходства.



    Рисунок 11. Результаты работы blast2seq 1-2. х-1, у-2

    Заметна инверсия участка длинной 1 Мбаза между 2.5 и 5 Мбазы. Также имеется небольшая инверсия ближе к 4 Мбазам. Инвертированииый участок был найден в 4 хромосоме человека с E-value 0.029.

    Рисунок 12. Результаты работы blast2seq 1-3. х-1, у-3

    Заметна, как и на рисунке 10, инверсия участка длинной 1 Мбаза между 2.5 и 5 Мбазы. Также имеется небольшая инверсия ближе к 4 Мбазам.

    Рисунок 13. Результаты работы blast2seq 2-3. х-2, у-3

    Бласт против последовательности, отсутствующей во втором геноме, но присутствующей в третьей (координаты 3.1 Мбазы) находит данную последовательность в геномах родственных бактерий с низким E-value и с очень высоким E-value (2.9) говорит, что присутствует гомология с регуляторным фактором интерферонов, что крайне маловероятно: этому гену не от куда взяться в бактериальном геноме. Данный участок присутствует в десяти близкородственных штаммах, что может свидетельствовать в пользу его делеции в штамме 2. Но возможно также, что имеется ещё большая клада, где этот ген отсутствует. Чтобы проверить это, был выполнен поиск участка с делецией с помощью blastn. Достоверная выдача была гораздо меньше, а значит, не так давно произошла делеция данного участка. Карта локального сходства 13 говорит о близком родстве штаммов 2 и 3. Также похоже, что сборка производилась, начиная с разных участков.



    NPG-explorer

    С помощью NPG-explorer были найдены блоки, оценивающие сходство трёх геномов. Было найдено 49 s-блоков, имеющих по одному фрагменту из каждого генома. 25 h-блоков, имеющих всего по два фрагмента из трёх геномов. 19 u-блоков - уникальных последовательностей в каждом из геномов, не встречающихся в других двух.

    Рисунок 14. Визуализатор работы NPG-explorer


    Рисунок 15. h-блоки в NPG-explorer


    В базе данных UniProt была найдена последовательность ABC-type nitrate/sulfonate/bicarbonate transport system неродственной бактерии , обнаруженная в геноме Methanosarcina mazei WWM610. Показана на рисунке 16. В данном штамме было обнаружено больше всего инсерций. Самые интересные из них показаны ниже.


    Рисунок 16. Результаты работы NPG-explorer


    Была найдена последовательность 6-aminohexanoate-dimer hydrolase из класса гидролаз, катктализирующей реакцию гидролиза N-(6-aminohexanoyl)-6-aminohexanoate в 6-aminohexanoate.

    Рисунок 13. Результаты работы NPG-explorer


    Был найден фрагмент последовательности, кодирующей АТФ-зависимую ДНК геликазу, найденную только в первом штамме. Похоже, что произошла серия мутаций в этом гене, приведшая к несоответствию последовательностей.

    Рисунок 13. Результаты работы NPG-explorer


    Для всех трёх геномов характерно наличие енолазы или фосфопируват гидратазы, относящейся к суперсемейству енолаз. Данный фермент является катализатором девятой реакции гликолиза, переводящей 2-Фосфоглицерат в фосфоенолпируват.

    Рисунок 13. Результаты работы NPG-explorer


    Также в трёх штаммах был обнаружен ген полифосфат киназы, катализирующей реакцию образования полифосфата из АТФ.

    Рисунок 13. Результаты работы NPG-explorer


    Был найден ген сорбитол дегидрогеназы, превращающей глюкозу в фруктозу.

    Рисунок 13. Результаты работы NPG-explorer


    Также в трёх геномах присутствует Xaa-Pro aminopeptidase, катализирующая реакцию N-краевого расщепления пептидов.

    Рисунок 13. Результаты работы NPG-explorer




    Ссылки

    1. 6-aminohexanoate-dimer hydrolase
    2. RECQL
    3. Enolase
    4. Polyphosphate kinase
    5. Sorbitol dehydrogenase