Музалевская Юлия1,*
1 Факультет биоинженерии и биоинформатики Московского Государственного Университета
* uliamuzalevskaya@gmail.com
Резюме: В данной работе представлен миниобзор генома Corynebacterium deserti GIMN1.010 – штамма бактерий из рода Коринебактерии, выделенного из песка пустыни в Китае.Количественный и качественный анализ генома и протеома был проведён с использованием методов электронных таблиц и языка программирования Python.
Штамм Corynebacterium deserti GIMN1.010 был выделен из пробы смешанного песка из пустыни западного Китая. Его выращивали в среде TGY (0,5% пептона, 0,5% дрожжевого экстракта, 0,1% глюкозы, pH доводили до 6,8) при 30 °С при встряхивании 200 об/мин в течение 2 дней с последующим выделением лимонно-жёлтых колониеобразующих бактерий на чашечках в среде TGY с 1,5% агара. Физиологическая характеристика и дополнительные биохимические тесты были выполнены в Институте микробиологии, провинция Гуандун, Китай.
Клетки штамма GIMN1.010 представляют собой положительные по Грамму, не образующие спор, короткие палочки неправильной формы. Полученные в среде TGY колонии были лимонно-жёлтыми, круглыми, непрозрачными, выпуклыми с правильными краями и диаметром примерно 0,5 мм. Изолят был положительным по каталазе и уреазе, но отрицательным по оксидазе и тирозиназе. Штамм GIMN1.010 был способен использовать ряд субстратов (таких как глюкоза, d-ксилоза, сахароза и салицин) в качестве единственных источников углерода для роста, но не желатин или казеин. Оптимальные pH и температура культивирования были pH 7 и 30 °С.[1]
Информация о геноме бактерии была взята из базы данных NCBI Genome. Хромосомная таблица находится в файле Genome features, последовательность – в файле Genome.txt. Таблица с результатами исследований находится в файле Minireview, использованные коды – в файле Python. В качестве методов использовались электронные таблицы Google Sheets:
3.1 Стандартные данные о геноме Corynebacterium deserti
3.1.1. Число и названия ДНК, составляющих геном
У Corynebacterium deserti GIMN1.010 3 молекулы ДНК: основная кольцевая хромосома и две плазмиды – pCdes1 и pCdes2
3.1.2. GC-состав каждой ДНК
Общий GC-состав генома 55,25%; на хромосоме 55,27%; на pCdes1 52,86%; на pCdes2 55,18%
3.2. Статистические данные о белках протеома
3.2.1. Гистограмма длин белков
Всего геном Corynebacterium deserti кодирует 2 697 белков, из них 50 синтезируются с плазмид, а остальные 2 647 – с хромосомы. Длины белков находятся в промежутке от 17 до 3 008 аминокислот, среднее значение составляет 318 аминокислот. Из гистограммы видно, что больше всего белков находятся в диапазоне 210-240 аминокислот. Также наблюдается пик, соответствующий длинам 570-600 аминокислот. Индивидуальные распределения длин белков показывают пики при определённых длинах белков, которые, по-видимому, соответствуют семействам генов с высокой степенью дублирования в их соответствующих линиях.[2]
3.2.2. Число генов белков, закодированных на прямой и комплементарной цепочке
Всего у бактерии 2 697 генов, кодирующих какой-либо белок. Из них на прямой цепи находится 1 340 генов, а на комплементарной – 1 357. Расчёты находятся на листе Chain.
3.2.3. Число рибосомальных белков
Всего в протеоме бактерии 55 рибосомальных белков, то есть примерно 5%. Их перечень приведён на листе Ribosomal protein
3.2.4. Гипотетические белки
Количество гипотетических белков (hypothetical protein) – 461, что составляет 17,09% от числа всех белков бактерии. Перечень всех гипотетических белков их длиной, координатами начала и конца представлен на листе Hypothetical proteins.
3.2.5. Транспортные белки
Количество транспортных белков – 251, что составляет 9,3% от всех белков бактерии. Перечень всех транспортных белков с их характеристиками представлен на листе Transport proteins.
3.2.6. Обобщение
Далее приведены диаграммы распределения белков по типам на хромосоме и обеих плазмидах. В сопроводительных материалах их можно найти на листе Protein diagram.
3.3. Статистические данные о генах РНК
3.3.1. Число генов РНК
В геноме Corynebacterium deserti 80 генов, кодирующих какую-либо РНК. Все эти гены сосредоточены на хромосоме. Генов, кодирующих РНК, значительно меньше, чем генов кодирующих белок (2 697).
3.3.2. Число рибосомальных РНК
Число рибосомальных РНК составляет 18, то есть 22,5% от всех генов, кодирующих РНК
3.3.3 Число транспортных РНК
Наибольшую часть всех РНК бактерии составляют транспортные РНК: их 59, что составляет 73,8%
3.3.4. Обобщение
Помимо приведённых рибосомальных и транспортных РНК у бактерии синтезируются:
Далее приведена диаграмма распределения всех РНК по типам, которую также можно найти в сопроводительных материалах на листе RNA.
3.4 Нуклеотидный состав геномных ДНК
Правило Чаргаффа гласит о том, что количество аденина на одной цепочке ДНК примерно равно количеству тимина, а гуанина – цитозину. То есть в общем количество пуринов примерно равно количеству пиримидинов (A+G≈T+C). Проверим справедливость этого утверждения для изучаемой бактрии.
Нуклеотид | Количество | Процентное содержание |
---|---|---|
A | 664 502 | 22,36% |
T | 664 740 | 22,37% |
G | 821 320 | 27,63% |
C | 821 587 | 27,64% |
Исходя из таблицы, можно сделать вывод о том, что правило Чаргаффа выполняется для хромосомы Corynebavterium deserti GIMN1.010, так как и для пары A-T, и для пары G-C разница в процентном соотношении составляет всего 0,01%.
Нуклеотид | Количество | Процентное содержание |
---|---|---|
A | 7 304 | 23,56% |
T | 7 311 | 23,58% |
G | 8 326 | 26,85% |
C | 8 064 | 26% |
Исходя из таблицы, можно сделать вывод о том, что для плазмиды pCdes1 также выполняется правило Чаргаффа, но чуть менее точно, чем для хромосомы. Для пары A-T разница в процентном соотношении составляет 0,02%, а вот для пары G-C более значительное число – 0,85%.
Нуклеотид | Количество | Процентное содержание |
---|---|---|
A | 6 995 | 22,76% |
T | 6 782 | 22,06% |
G | 8 288 | 26,96% |
C | 8 674 | 28,2% |
Из третьей таблицы также видно менее строгое выполнение правила Чаргаффа. Однако для плазмиды pCdes2 разница в процентном соотношении заметна уже для обеих пар: A-T – 0,7%, G-C – 1,24%
3.5. Оценка степени случайности распределения генов по двум цепочкам ДНК
На прямой цепи хромосомы находится 1 317 генов, на обратной – 1 330. Вероятность такого распределения или распределения с большей разностью составляет 40,78%. Это достаточно большая вероятность, а занчит нет противоречия предположению о случайном распределении.
В отношении обеих плазмид можно сделать аналогичный вывод: для pCdes1 вероятность равна 27,06%, а для pCdes2 – 57,75%.