В данной работе рассматриваются стандартные данные о геноме бактерии Waddlia chondrophila WSU 86-1044, а также статистические данные о белках протеома и генах РНК данного штамма
Chlamydiaceae долгое время считались филогенетически изолированной группой близкородственных бактерий.[1] Штамм WSU 86-1044 был выделен в 1986 году из тканей абортированного плода крупного рогатого скота в Вашингтонской лаборатории диагностики болезней животных. Waddlia chondrophila WSU 86-1044 является потенциальным агентом выкидышей у животных.[2] Кроме того, совсем недавно исследование продемонстрировало связь между невынашиванием беременности и наличием антител против Waddlia у людей.[3] Представители семейства Chlamydiaceae признаны широко распространенной и клинически значимой причиной заболеваний у людей и животных.[4] Секвенирование генома этой бактерии выявила многочисленные интригующие особенности, которые будут представлены в данной работе. В целом доступность генома W. chondrophila открывает новые возможности в исследованиях эволюции представителей Chlamydiales и некоторых патогенных закономерностей людей и животных. В данной работе приведены и проанализированы результаты некоторых вычислительных исследований генома и протеома бактерии.
Стандартные данные о геноме : Геном бактерии состоит из кольцевой хромосомы 2116312 п.н. с содержанием GC 44% и кольцевой плазмиды 15593 п.н. с содержанием GC 37,5%.
Распределение длин белков
Геном W. chondrophila кодирует 1849 белка, 22 из которых синтезируются с плазмиды, а остальные с хромосомы. Белки бактерии имеют длину от 29 до 4637 аминокислотных остатков, среднее значение составляет 352, медианная длина белка - 293, а стандартное распределение - 298 аминокислотных остатков. Гистограмма распределения была сформирована на основе данных таблицы особенностей генома данной бактерии. На гистограмме видно, что для протеома данной бактерии классического “двугорбого” распределения длин белков не наблюдается. С ростом длины белка количество белков убывает, но существует три скачка: 1) 130–180; 2) 230–280, в этот промежуток попало наибольшее количество белков; 3) 830–880, небольшой, но все же заметный скачок.
Распределение генов на прямой и обратной цепи генома
Также были получены сведения о количестве генов, содержащихся на прямой и обратной цепи. На рисунке выше представлено распределение относительно всего генома ( на цепи прямого направления находится 50,6% генов, а на обратной - оставшиеся 49,4%). Можно сказать, что гены распределены примерно поровну на обеих цепях. В следующей таблице показано более точное распределение в плазмиде и хромосоме.
Для того, чтобы проверить случайность распределения на прямой и обратной цепи хромосомы и плазмиды, было рассчитано P-value в качестве критерия статистической значимости. Так как в обоих случаях значение достаточно большое, то нет основания для предположения о не случайном распределении генов. [6]
С помощью таблицы геномных особенностей были получены данные о количестве разных классов белков в геноме W. chondrophila WSU 86-1044.
Из полученных данных можно сделать вывод о том, что “гипотетические” белки составляют почти треть от всех остальных. Исходя из этого можно сделать вывод о том, что бактерия не очень хорошо изучена и для целой трети потенциальных белков функции еще не исследованы.