Выравивание геномов

Выбор организмов

Для выравнивания были выбраны три штамма (DSM 1313; ATCC 27405; DSM 2360) Ruminiclostridium(Clostridium) thermocellum. Все геномы собраны полностью, состоят из одной хромосомы и доступны для ознакомления по ссылкам.
Данная бактерия - анаэробный термофил. Она привлекает внимание ученых своим многокомпонентным комплексом гидролиза целлюлозы, в том числе и кристаллической. Это позволяет надеяться, что несмотря на наличие конкурирующих путей, данная бактерия поможет осуществлять переработку целлюлозо-содержащих растительных отходов в топливный этиловый спирт.

Однослойные биопленки Clostridium thermocellum на целлюлозных волокнах

Гомологичные участки

Был создан пангеном программой NPGE. В данных трех штаммах 97,6 процентов составляют глобальные блоки, а выдачи попарных Blast говорят об identity 98%. Подавляющее большинство уникальных блоков - из генома ATCC 27405. Это неудивительно, так как он длинее двух других на примерно 200 килобасов. Благодаря графическому интерфейсу просто оценить, что полустабильные блоки практически полностью встречаются в геноме DSM 1313 и DSM 2360. Это позволяет говорить, что из трех пар геномов эта самая близкая в эволюционном плане.

Геномные перестройки

На графическом отображении попарного blast видно, что штамм ATCC 27405 обладает смешенным по отношению к двум другим штаммам ориджином репликации а также крупной инверсией и некоторыми инзерциями(конкретно этот факт понятен из анализа уникальны блоков, определенных NPG). Оставшиеся два штамма практически полностью соответствуют друг другу. Возможно, что непривлекательно выглядящий регион перед последней десятой генома составляют регионы низкой сложности, которые из-за этого и дают большое количество полос.

Выравнивание DSM 2360(слева) и ATCC 27405

Выравнивание DSM 1313(слева) и ATCC 27405

Выравнивание DSM 1313(снизу) и DSM 2360


© Бусыгин Сергей, 2017