Мини-обзор генома и протеома Aeribacillus pallidus



Автор


Шумейко Виталий Витальевич
МГУ им. Ломоносова Факультет Биоинженерии и биоинформатики


ВВЕДЕНИЕ

Aeribacillus pallidus – аэробная палочковидная бактерия с бледным цветом колонии, един-ственный представитель рода Aeribacillus (ра-нее реклассифицированная из рода Geobacillus). A.pallidus грамположительная и эндоспорообразующая термофильная бакте-рия. Впервые была обнаружена в горячем вод-ном экстракте стеблей сои, собранных в Нака-сацунай, Хоккайдо, Япония. (см. 1 литература)


МАТЕРИАЛЫ И МЕТОДЫ

Геном и протеом бактерии для мини-обзора взяты из базы данных NCBI. Для изучение генома я написал код на языке Python. С его помощью я смог 1) проверить правило Чаргоффа и длину нуклеотидной по-следовательности. 2)GC-состав генома. Для исследования протеома я использовал функции Google таблиц: СЧЕТЕСЛИМН (для создания таблицы, по которой была построена гистограмма), и СРЗНАЧ, МАКС, МИН, СЧЕТЕСЛИ.(см. сопроводительные материалы)

РЕЗУЛЬТАТЫ

Aeribacillus pallidus содержит одну кольцевую молекулу ДНК, которая состоит из 4 089 457 нуклеотидов.
1) количество нуклеотидов и их доля в геноме.
Как видно из Таблицы 1 количество A примерно равно T, а количество G примерно равно C. Эти результаты подтверждают справедливость правила Чаргоффа.


нуклеотид количество процентное содержание
A 1 246 718 30.49%
T 1 234 720 30.19%
G 821 522 20.09%
C 786 497 19.23%

Таблица 1 нуклеотиды и их доля в геноме


2) GC-состав
GC-состав генома Aeribacillus pallidus составляет 39.32%, что довольно средний показатель для тер-мофильных бактерий. (см. 2 литература)

3) общие данные о протеоме
Геном Aeribacillus pallidus содержит 7864 гена, из которых 3596 являются белок-кодирующими. Самый длинный белок имеет размеры 2325, а са-мый короткий 17. В среднем размер белка состав-ляет 289,57.( см. элек. таблицы в сопроводитель-ных материалах)


Цепь ДНК Число белок-кодирующих генов
Прямая 1923
Обратная 1673

Таблица 2 расположение генов на цепочках ДНК


Также из Таблицы 2 видно, что на прямой цепи ДНК белок-кодирующих генов расположено боль-ше чем на обратной


4) сопоставление длин белков

здесь должна быть картинка

(первый столбец – количество белков длиной от 17 до 67 ; второй – от 67 до 117; и т.д.)


Как видно из гистограммы, большинство белков Aeribacillus pallidus имеют размеры от 67 до 417. ( см. элек. таблицы в сопроводительных материа-лах)


СОПРОВОДИТЕЛЬНЫЕ МАТЕРИАЛЫ


Ссылка на файл в моём Google диске, содержащий файл с геномом, таблицу особенностей генома, электронную таблицу с построенной в ней гистограммой, код на языке программирования Python, которые использовались для написания миниобзора.


БЛАГОДАРНОСТЬ


Автор выражает благодарность преподавателям биоинформатики за предоставленные знания.


ЛИТЕРАТУРА


1)Authors: Kyosuke Kita, Atsushi Ishida, Kosei Tanaka, Shu Ishikawa, Ken-ichi Yoshida. ASM Journals Microbiology Resource Announcements Vol. 9, No. 17 Complete Genome Sequence of Thermophilic Bacterium Aeribacillus pallidus PI8 (статья о Aeriba-cillus pallidus)
2) статья о сопоставлении GC – состава различных бактерий Authors: John Lightfield, Noah R. Fram, and Bert Ely Across Bacterial Phyla, Distantly-Related Genomes with Similar Genomic GC Content Have Similar Patterns of Amino Acid Usage.