Шумейко Виталий Витальевич
МГУ им. Ломоносова Факультет Биоинженерии и биоинформатики
Aeribacillus pallidus – аэробная палочковидная бактерия с бледным цветом колонии, един-ственный представитель рода Aeribacillus (ра-нее реклассифицированная из рода Geobacillus). A.pallidus грамположительная и эндоспорообразующая термофильная бакте-рия. Впервые была обнаружена в горячем вод-ном экстракте стеблей сои, собранных в Нака-сацунай, Хоккайдо, Япония. (см. 1 литература)
Геном и протеом бактерии для мини-обзора взяты из базы данных NCBI. Для изучение генома я написал код на языке Python. С его помощью я смог 1) проверить правило Чаргоффа и длину нуклеотидной по-следовательности. 2)GC-состав генома. Для исследования протеома я использовал функции Google таблиц: СЧЕТЕСЛИМН (для создания таблицы, по которой была построена гистограмма), и СРЗНАЧ, МАКС, МИН, СЧЕТЕСЛИ.(см. сопроводительные материалы)
Aeribacillus pallidus содержит одну кольцевую молекулу ДНК, которая состоит из 4 089 457 нуклеотидов.
1) количество нуклеотидов и их доля в геноме.
Как видно из Таблицы 1 количество A примерно равно T, а количество G примерно равно C. Эти результаты подтверждают справедливость правила Чаргоффа.
нуклеотид | количество | процентное содержание |
A | 1 246 718 | 30.49% |
T | 1 234 720 | 30.19% |
G | 821 522 | 20.09% |
C | 786 497 | 19.23% |
Таблица 1 нуклеотиды и их доля в геноме
2) GC-состав
GC-состав генома Aeribacillus pallidus составляет 39.32%, что довольно средний показатель для тер-мофильных бактерий. (см. 2 литература)
3) общие данные о протеоме
Геном Aeribacillus pallidus содержит 7864 гена, из которых 3596 являются белок-кодирующими.
Самый длинный белок имеет размеры 2325, а са-мый короткий 17. В среднем размер белка состав-ляет 289,57.( см. элек. таблицы в сопроводитель-ных материалах)
Цепь ДНК | Число белок-кодирующих генов |
Прямая | 1923 |
Обратная | 1673 |
Таблица 2 расположение генов на цепочках ДНК
Также из Таблицы 2 видно, что на прямой цепи ДНК белок-кодирующих генов расположено боль-ше чем на обратной
(первый столбец – количество белков длиной от 17 до 67 ; второй – от 67 до 117; и т.д.)
Как видно из гистограммы, большинство белков Aeribacillus pallidus имеют размеры от 67 до 417. ( см. элек. таблицы в сопроводительных материа-лах)
Ссылка на файл в моём Google диске, содержащий файл с геномом, таблицу особенностей генома, электронную таблицу с построенной в ней гистограммой, код на языке программирования Python, которые использовались для написания миниобзора.
Автор выражает благодарность преподавателям биоинформатики за предоставленные знания.
1)Authors: Kyosuke Kita, Atsushi Ishida,
Kosei Tanaka, Shu Ishikawa, Ken-ichi Yoshida.
ASM Journals
Microbiology Resource Announcements
Vol. 9, No. 17
Complete Genome Sequence of Thermophilic Bacterium Aeribacillus pallidus PI8 (статья о Aeriba-cillus pallidus)
2) статья о сопоставлении GC – состава различных бактерий
Authors: John Lightfield, Noah R. Fram, and Bert Ely
Across Bacterial Phyla, Distantly-Related Genomes with Similar Genomic GC Content Have
Similar Patterns of Amino Acid Usage.