1. Крупные эволюционные события в геномах 4 штаммов одного вида бактерий
Для этого задания я выбрал классическую бактерию - Escherichia coli.
Штаммы: 8-3-Ti3, 152661, RM9872-C1, RHB04-C17.
Была сделана TSV таблица -
Ссылка, необходимая для работы NPG.
На сервере он считал долго, поэтому я делал это у себя на компутере.
Файлы, которые нужно представить в отчёте:
log_prepare
log_make
log_post
При работе на сервере в log_post загружается
Running PostProcessing..
.. done
и время выполнения. А на компьютере я такого не наблюдал.
число блоков (s-blocks): 1181
размер нуклеотидного ядра: 71.96%
процент консервативных колонок в объединённом выравнивании s-блоков: 56.62%
Геном
|
Имя блока, подтверждающего делецию
|
Длина блока
|
Имена делетированных генов |
8-3-Ti3
|
h3x5378
|
5378
|
YjbF family lipoprotein, capsule biosynthesis GfcC family protein, YjbH domain-containing protein, phosphate-starvation-inducible protein PsiE, D-xylose transporter XylE
|
152661
|
h3x3863
|
3863
|
2-keto-3-deoxy-L-rhamnonate aldolas, MFS transporter, L-rhamnonate dehydratase, IclR family transcriptional regulator
|
RM9872-C1
|
h3x4944
|
4944
|
sulfoquinovosidase, aldose-1-epimerase, sulfoquinovose isomerase, sulfofructosephosphate aldolase
|
RHB04-C17
|
h3x8389
|
8389
|
putative selenate reductase subunit YgfK, putative aminohydrolase SsnA, molybdopterin-dependent oxidoreductase, xanthine permease XanQ
|
Описание одной перестановки синтений (g-блоков) в одном или нескольких геномах
Расположение блоков g4x17784 совпадает у RHB04-C17 и RM9872-C1. У штамма 152661 этот блок сдвинут вправо на 4 g-блока.
И у 8-3-Ti3 этот блок находится на большом расстоянии (несколько десятков g-блоков) по сравнению с другими рассматриваемыми штаммами.я
Ошибки... долго искал, но всё же нашёл. В блоке 8-3-Ti3 в самом начале блока у всех штаммов кодируемый
белок назывался pentapeptide repeat-containing protein, тогда как у 8-3-Ti3 - hypothetical protein. Всё же, как мне
кажется, первое название даёт больше информации о потенциальном белке. Просмотрев порядка 10-15 блоков я ничего интереснее не нашёл.
Но! Хотелось бы отметить, что иногда одинаковые белки называются по-разному и это очень неудобно.
Заключение
NPG-explorer позволяет сравнивать геномы родственных организмов. В этом практикуме я описал стабильное ядро нуклеотидного пангенома.
Рассмотрел крупные делеции в каждом геноме(причем уникальные для каждого штамма) и рассмотрел какие гены присутствовали в этих делециях.
Достаточно интересно, что подобные "выпадения" некоторых участков генома могут быть связаны, например, с изменением и(или) приспособление к
окружающей среде, и используя NPG-explorer можно сделать вывод, от чего бактерия смогла "отказаться" в своей жизнедеятельности.
Ну и в самом конце я заметил, что онисание(названия белков в блоках) не всегда одинаковое, что, как я уже говорил, является
очень неудобным.