Краткий обзор генома бактерии Waddlia chondrophila WSU 86-1044

Резюме

В данной работе рассматриваются стандартные данные о геноме бактерии Waddlia chondrophila WSU 86-1044, а также статистические данные о белках протеома и генах РНК данного штамма

Введение

Chlamydiaceae долгое время считались филогенетически изолированной группой близкородственных бактерий.[1] Штамм WSU 86-1044 был выделен в 1986 году из тканей абортированного плода крупного рогатого скота в Вашингтонской лаборатории диагностики болезней животных. Waddlia chondrophila WSU 86-1044 является потенциальным агентом выкидышей у животных.[2] Кроме того, совсем недавно исследование продемонстрировало связь между невынашиванием беременности и наличием антител против Waddlia у людей.[3] Представители семейства Chlamydiaceae признаны широко распространенной и клинически значимой причиной заболеваний у людей и животных.[4] Секвенирование генома этой бактерии выявила многочисленные интригующие особенности, которые будут представлены в данной работе. В целом доступность генома W. chondrophila открывает новые возможности в исследованиях эволюции представителей Chlamydiales и некоторых патогенных закономерностей людей и животных. В данной работе приведены и проанализированы результаты некоторых вычислительных исследований генома и протеома бактерии.

Материалы и методы
Для проведения вычислительных исследований из электронной библиотеки NCBI были взяты: нуклеотидная последовательность генома, аннотация протеома Waddlia chondrophila WSU 86-104. Вычислительные исследования на основе этих данных были проведены с помощью программы для работы с электронными таблицами Google Sheets и Python 3.8.16, исполняемый в интегрированной среде разработки Visual Studio Code.[5] Количество белок-кодирующих генов, генов РНК, медианная длина белка и некоторые другие статистические данные были получены с помощью программы Google Sheets. Поиск встречаемости нуклеотидов был реализован при помощи скриптов Python. Используемые скрипты и результирующие таблицы можно найти по ссылке в разделе “Сопроводительные материалы” данной работы или на моей странице “Миниобзор бактерии” Kodomo
Результаты

Стандартные данные о геноме : Геном бактерии состоит из кольцевой хромосомы 2116312 п.н. с содержанием GC 44% и кольцевой плазмиды 15593 п.н. с содержанием GC 37,5%.

Табл 1. Стандартные данные о геноме W. chondrophila WSU 86-1044
Рис 1  Гистограмма длин распределения белков W. chondrophila WSU 86-1044

Распределение длин белков

Геном W. chondrophila кодирует 1849 белка, 22 из которых синтезируются с плазмиды, а остальные с хромосомы. Белки бактерии имеют длину от 29 до 4637 аминокислотных остатков, среднее значение составляет 352, медианная длина белка - 293, а стандартное распределение - 298 аминокислотных остатков. Гистограмма распределения была сформирована на основе данных таблицы особенностей генома данной бактерии. На гистограмме видно, что для протеома данной бактерии классического “двугорбого” распределения длин белков не наблюдается. С ростом длины белка количество белков убывает, но существует три скачка: 1) 130–180; 2) 230–280, в этот промежуток попало наибольшее количество белков; 3) 830–880, небольшой, но все же заметный скачок.

Распределение генов на прямой и обратной цепи генома

Также были получены сведения о количестве генов, содержащихся на прямой и обратной цепи. На рисунке выше представлено распределение относительно всего генома ( на цепи прямого направления находится 50,6% генов, а на обратной - оставшиеся 49,4%). Можно сказать, что гены распределены примерно поровну на обеих цепях. В следующей таблице показано более точное распределение в плазмиде и хромосоме.

Табл 3. Распределение генов, кодирующих белки на прямой и обратной цепи молекулы ДНК

Для того, чтобы проверить случайность распределения на прямой и обратной цепи хромосомы и плазмиды, было рассчитано P-value в качестве критерия статистической значимости. Так как в обоих случаях значение достаточно большое, то нет основания для предположения о не случайном распределении генов. [6]

Соотношение различных классов белков в геноме бактерии

С помощью таблицы геномных особенностей были получены данные о количестве разных классов белков в геноме W. chondrophila WSU 86-1044.

Табл 3 Соотношение разных классов белков в геноме бактерии

Из полученных данных можно сделать вывод о том, что “гипотетические” белки составляют почти треть от всех остальных. Исходя из этого можно сделать вывод о том, что бактерия не очень хорошо изучена и для целой трети потенциальных белков функции еще не исследованы.

Статистические данные о генах РНК
В ходе рассмотрения распределения генов различных функциональных РНК было выяснено, что в протеоме бактерии находится 78 генов, которые кодируют РНК: 6 рРНК, 37 тРНК, 1 SRP РНК и 1 tmРНК. tmРНК - это транспортно-матричная РНК, которая участвует в в высвобождении рибосом, «застрявших» во время трансляции проблемных участков мРНК, а также разрушении получившихся в ходе неполной трансляции дефектных пептидов. [7] SRP РНК - это длинная некодирующая РНК, входящая в состав эукариотической частицы узнавания сигнала.[8] Общее число генов, кодирующих РНК значительно меньше, чем генов, кодирующих белки (1872).
Нуклеотидный состав геномных ДНК
Для того, чтобы проверить второе правило Чаргаффа, была написана программа, подсчитывающая число и частоту встреч каждой из букв A, T, G, C (а также появления других букв) в одной из последовательностей геномной ДНК. Была написана программа, которая подсчитывает встречаемость каждого из стоп кодонов кодирующих белок последовательностей в долях (до 4 знака после запятой). Были получены следующие данные:
Табл 4 Нуклеотидный состав геномной ДНК W. chondrophila WSU 86-1044.
Сопроводительные материалы
  1. Аннотация сборки генома бактерии:
  2. Нуклеотидная последовательность бактерии из NCBI в формате FASTA:
  3. Геномная таблица особенностей:
  4. Статистические расчеты
  5. Скрипт для рассчета нуклеотидного состава генома бактерии:
Ссылки
  1. Everett KD, Bush RM, Andersen AA (1999) Emended description of the order Chlamydiales, proposal of Parachlamydiaceae fam. nov. and Simkaniaceae fam. nov., each containing one monotypic genus, revised taxonomy of the family Chlamydiaceae, including a new genus and five new species, and standards for the identification of organisms. Int J Syst Bacteriol 49 Pt2: 415–440.
  2. Dilbeck PM, Evermann JF, Crawford TB, Ward ACS, Leathers CW, et al. (1990) Isolation of a previously undescribed rickettsia from an aborted bovine fetus. Journal of Clinical Microbiology 28: 814–816.
  3. Baud D, Thomas V, Arafa A, Regan L, Greub G (2007) Waddlia chondrophila, a potential agent of human fetal death. Emerging Infectious Diseases 13: 1239–1243.
  4. orsaro D, Greub G (2006) Pathogenic potential of novel chlamydiae and diagnostic approaches to infections due to these obligate intracellular bacteria. Clinical Microbiology Reviews 19: 283–297.
  5. Alexander Yu. Mitrophanov, Mark Borodovsky, Statistical significance in biological sequence analysis : Briefings in Bioinformatics, Volume 7, Issue 1, March 2006, Pages 2–24 https://academic.oup.com/bib/article/7/1/2/262762