Сравнение геномов

Главная страница
С помощью алгоритма blastn было проведено сравнение геномов бактерий Caulobacter crescentus и Caulobacter segnis и построена карта локального сходства.



На карте видно, что в геноме происходило очень много инверсий, примерно 1 инверсия на 500 тысяч нуклеотидов, эти места показаны красным. Самая большая длиной около 500 тыс нуклеотидов, она находится примерно с 7000000 по 1200000 нуклеотид (в геноме C. crescentus).
Также имеются места, где произошли вставки или делеции, они отмечены синим: вертикальные линии указывают, что в этом месте последовательность длинее у C. segnis, а горизонтальные - что у C. crescentus. В целом же, геном C. segnis длинее.

У бактерий Caulobacter сложная регуляция клеточного цикла, и очень важно положение гена относительно начала репликации (они должны располагаться приблизительно на том же месте или на том же расстоянии, но с протиоположного конца) [A comparison of the Caulobacter NA1000 and K31 genomes reveals extensive genome rearrangements and differences in metabolic potential]. Этот факт хорошо согласуется с крестообразной формой карты.

Для сравнения близкородственных бактерий я выбрала разные штаммы Helicobacter pylori: F16, F30, F32 и F57, для которых есть полностью секвенированные геномы.

Для них был построен нуклеотидный пангеном (NPG) с помощью пакета NPG-explorer.

Глобальные блоки:

Число блоков: 37

Информация о блоках в виде таблицы.

Выравнивание:



По выравниванию видно, что 5 блоков у всех штаммов расположены на одном и том же месте (10, 12, 14,16,18 столбцы).
8 столбцов выравнивания (7, 8,9,11,13,19,20 и 25) показывают разделение штаммов на две группы: F16 c F32 и F30 c F57.
Но 6 столбцов наоборот свидетельствуют о другом разделении : F16 c F30 и F32 c F57.
Так как во втором случае блоки чаще находятся против гэпов, я склонна считать этот случай менее вероятным, так как делеция в одном месте вероятнее одинаковой транслокации у предков.
У бактерий возможен горизонтальный перенос генов, поэтому установить степень родства довольно сложно.

Стабильные блоки:

Число блоков: 633
Суммарная длина и процент от длины генома: 1551378 (91.24%)
Сходство геномов: 0.943141

Повторы:

Число блоков: 185
Суммарная длина и процент от длины генома: 52557 (3.09%)
Сходство геномов: 0.85911

Пример:
r25x102:

фрагментов - 25
колонок - 102
сходство - 71,56%
генов – 25

Внутри s-блока s4x3164 есть крупные делеции:



Блока h2x2150 нет у штаммов F16 и F57, а h3x335 есть только у F32.

Уникальные последовательности:

Блок u1x113, есть у штамма F16. Последовательность для различных штаммов не аннотирована, зато есть похожий ген у человека в 5 хромосоме, который кодирует белок, участвующий в биосинтезе органелл (например, лизосом). Либо это какая-то ошибка, либо ккогда-то действительно произошел перенос гена от бактерии к человеку и впоследствии стал выполнять важные функции.

Блок u1x1167 есть у F57, это метилтрансфераза 11 типа, горизонтального переноса из других организмов не происходило.

Расхождения в аннотациях для F16 и F57:

"
CDS 41885..43018
/locus_tag="HPF57_0036
/codon_start=1
/transl_table=11
/product="signal-transducing protein, histidine kinase"
/protein_id="BAJ59110.1"


CDS 41384..42529
/locus_tag="HPF16_0035"
/codon_start=1
/transl_table=11
/product="putative histidine kinase sensor protein"
/protein_id="BAJ54632.1"

Разница в названиях белка, хотя оба определенно связаны с гистидиновой киназой.


CDS 51763..54261
/locus_tag="HPF57_0047"
/codon_start=1
/transl_table=11
/product="Type IIG restriction-modification enzyme"
/protein_id="BAJ59121.1"


CDS 53660..54859
/locus_tag="HPF16_0046"
/codon_start=1
/transl_table=11
/product="adenine specific DNA methyltransferase"
/protein_id="BAJ54643.1"
/db_xref="GI:317176854"

Продукты вообще разные.

В ходе работы с геномами бактерий одного вида, но разных штаммов с помощью NPG-explorer я поняла, что представление всего генома с помощью блоков очень удобно. Также я наглядно увидела, что среди близкородственных бактерий нелегко установить однозначные родственные отношения.

© Широковских Татьяна