1. Крупные эволюционные события в геномах 4 штаммов одного вида бактерий

Для этого задания я выбрал классическую бактерию - Escherichia coli.
Штаммы: 8-3-Ti3, 152661, RM9872-C1, RHB04-C17. Была сделана TSV таблица - Ссылка, необходимая для работы NPG.
На сервере он считал долго, поэтому я делал это у себя на компутере.
Файлы, которые нужно представить в отчёте:
log_prepare
log_make
log_post
При работе на сервере в log_post загружается
    Running PostProcessing..
.. done

и время выполнения. А на компьютере я такого не наблюдал.
число блоков (s-blocks): 1181
размер нуклеотидного ядра: 71.96%
процент консервативных колонок в объединённом выравнивании s-блоков: 56.62%
Геном Имя блока, подтверждающего делецию Длина блока Имена делетированных генов
8-3-Ti3 h3x5378 5378 YjbF family lipoprotein, capsule biosynthesis GfcC family protein, YjbH domain-containing protein, phosphate-starvation-inducible protein PsiE, D-xylose transporter XylE
152661 h3x3863 3863 2-keto-3-deoxy-L-rhamnonate aldolas, MFS transporter, L-rhamnonate dehydratase, IclR family transcriptional regulator
RM9872-C1 h3x4944 4944 sulfoquinovosidase, aldose-1-epimerase, sulfoquinovose isomerase, sulfofructosephosphate aldolase
RHB04-C17 h3x8389 8389 putative selenate reductase subunit YgfK, putative aminohydrolase SsnA, molybdopterin-dependent oxidoreductase, xanthine permease XanQ

Описание одной перестановки синтений (g-блоков) в одном или нескольких геномах Расположение блоков g4x17784 совпадает у RHB04-C17 и RM9872-C1. У штамма 152661 этот блок сдвинут вправо на 4 g-блока. И у 8-3-Ti3 этот блок находится на большом расстоянии (несколько десятков g-блоков) по сравнению с другими рассматриваемыми штаммами.я
Ошибки... долго искал, но всё же нашёл. В блоке 8-3-Ti3 в самом начале блока у всех штаммов кодируемый белок назывался pentapeptide repeat-containing protein, тогда как у 8-3-Ti3 - hypothetical protein. Всё же, как мне кажется, первое название даёт больше информации о потенциальном белке. Просмотрев порядка 10-15 блоков я ничего интереснее не нашёл. Но! Хотелось бы отметить, что иногда одинаковые белки называются по-разному и это очень неудобно.

Заключение

NPG-explorer позволяет сравнивать геномы родственных организмов. В этом практикуме я описал стабильное ядро нуклеотидного пангенома. Рассмотрел крупные делеции в каждом геноме(причем уникальные для каждого штамма) и рассмотрел какие гены присутствовали в этих делециях. Достаточно интересно, что подобные "выпадения" некоторых участков генома могут быть связаны, например, с изменением и(или) приспособление к окружающей среде, и используя NPG-explorer можно сделать вывод, от чего бактерия смогла "отказаться" в своей жизнедеятельности. Ну и в самом конце я заметил, что онисание(названия белков в блоках) не всегда одинаковое, что, как я уже говорил, является очень неудобным.