Выравнивание геномов

Меню

На главную

Третий семестр

Задание 1

Для бактериии из первого семестра Thermus Thermophilus HB8 и другого штамма(JL-18) того же вида построила карту локального сходства с помощью blast2seq с алгоритмом blastn. На получившейся карте было много мелких точек, которые мешают рассматривать ее. С помощью megablast построила новую карту. Крупные перестройки остались, а лишних точек на ней не так много. (Рис.1.)
На карте диагональ идет от вернего левого в нижний правый угол(для одинаковых участков диагональ идет из нижнего левого в верхний правый). Это значит, что выравнены комплементарные последовательности. Для одной бактерии в банке лежит "+"-цепь(пусть назовем так прямую цепь JL-18, взятую из банка), а для другой "-"-цепь(последовательность HB8, из банка). При выравнивании одной неизмененной последовательности(JL-18 из банка) и комплементарной другой(обратной к HB8, лежащей в банке), два кусочка: большой по центру и маленький снизу слева - соединились бы. Красной рамкой отмечена транслокация. Это именно транслокация, а не просто разрыв в разных местах, потому что даже если мысленно соединить в кольцо хромосомы, кусочки будут идти в разной последовательности. Голубой рамкой отмечена инверсия относительно комплементарной цепи. Вставка в хромосоме штамма HB8 или делеция в хромосоме штамма JL-18 отмечена оранжевой рамкой.

Рис.1. Карта локального сходства для штаммов HB8(по вертикали) и JL-18(по горизонтали) вида Thermus Thermophilus.

Задание 2

С помощью пакета NPG-explorer был построен нуклеотидный пангеном для трех штаммов вида Rickettsia rickettsii: Hlp#2, Hauke и Hino. NPG создает файлы, в которых содержится информация о блоках или выравнивание блоков.

g-блоки

Из файла blocks.blocks получено выравнивание g-блоков - глобальных блоков, которые состоят из последовательно идущих во всех геномах s-блоков, перемежающихся блоками других типов (r-, h-, u- и m-). (Рис.2.) В этих хромосомах 5 g-блоков. Относительно штамма Hauke в штамме Hino нет хромосомных перестроек(заметных на уровне g-блоков). В штамме Hlp2 транслокация и инверсия во втором и четвертом g-блоках относительно обоих Hino и Hauke.

Рис.2. Выравнивание g-блоков в геноме 3 штаммов Rickettsia rickettsii. Фиолетовым отмечены хромосомные перстройки, оранжевым - последовательность, с которой сравниваются две другие.

s-блоки

В файле pangenomes.info есть информация о каждой группе блоков. Оттуда же и взяты следующие значения:
- количество s-блоков: 114
- суммарная длина:1252712 и процент от длины генома в среднем:98,63%(длина генома дана в самом начале файла)
- сходство геномов - процент консервативных позиций в объединенном выравнивании s-блоков:99.01%

r-блоки

С помощью визуализатора qnpge получено выравнивание самого частого повтора r21x159: по 7 фрагментов в хромосоме каждого штамма. На месте этого повтора предполагается гипотетический белок. Идентичность по блоку 96,85% - встречаются неконсервативные позиции.(Рис.3)

Рис.3. Изображение r-блока в визуализаторе qnpge.

Так как различных повторов много, а длина у повторов маленькая, то для того, чтобы различать их, добавляют номер в конце названия r6x103n3. (Рис.4)

Рис.4. Таблица блоков с одинаковыми параметрами(тип блока, число фрагментов, длина), формирующими имя, из визуализатора qnpge.

h-блоки

Всего 10 h-блоков, и только один из них общий для Hino и Hpl2(к тому же он еще и инвертированный), остальные - для Hino и Hauke. (Рис.5) На месте этого блока у Hauke делеция.

Рис.5. Изображение h-блока для штаммов Hino и Hpl2. Делеция для Hauke.

Остальные h-блоки выглядят почти одинаково: идентичность 100% и у обоих штаммов Hauke и Hino на прямых цепях. Это делеция у Hpl2. (Рис.6)

Рис.6. Делеция для Hpl2.

Такое расположение h-блоков согласуется с деревом родства штаммов для Rickettsia rickettsii.(Рис.7.)

Рис.7. Дерево штаммов Rickettsia rickettsii.

u-блоки

Только один u-блок находится в хромосоме Hino, остальные - в Hpl2.(Рис.8.) Это последовательность транспортной РНК, переносящей глутаминовую кислоту.

Вставка в хромосоме Hpl2.

C помощью blastn были найдены гомологи к последовательности этого u-блока. В основном это находки с низким e-value и 100% идентичностью из штаммов Rickettsia rickettsii или видов Rickettsia. (Рис.9.) Сам Hino тоже нашелся. Удивительно, что среди них есть Hauke, хотя npge определил, что эта последовательность уникальна для Hino из трех рассматриваемых штаммов.

Рис.9. Результаты blastn.

Различие в аннотациях

На рисунке 10 представлен блок s3x224, в котором у Hauke и Hino одинаковые белки(tRNA delta(2)-isopentenylpyrophosphate), а Hpl2 другой(ribonucleotide-diphosphate reductase subunit). Идентичность по блоку 100%.

Рис.10. Разные белки в одном блоке.

На рисунке 11 изображен блок s3x125, в котором у Hauke и Hino аннотирован гипотетический белок на обратной цепи, а у Hpl2 нет белка.

Различие в аннотации внутри одного блока.


© Корзина Анастасия, 2015