Практикум 8

Резюме: В ходе работы над данным практикумом были освоены базовые навыки работы с базой данной UniProt Proteoms и предпринята попытка анализа протеома Streptococcus thermophilus - бактерии, которая описывалась в прошлом семестре. Ссылка на мини-обзор: mini-review.


Выбор протеомов

Так как Streptococcus thermophilus - важная для пищевой промышленности молочнокислая бактерия, я сразу нашел протеом этой бактерии, имеющий статус референсного (ID: UP000001170, количество белков: 1577). S. thermophilus - молочнокислая бактерия, способная катаболизировать лактозу (каких-то других особенностей этой бактерии я не придумал), поэтому я решил для сравнения выбрать бактерию, не осуществляющую молочнокислое брожение и катаболизм лактозы. Мне кажется, неплохо подходит Bacillus subtilis, так как она сравнительно близка по систематическому положению (оба вида бактерий находятся в классе Bacilli) и хорошо изучена, поэтому я выбрал ее протеом в качестве контрольного (ID: UP000001570, количество белков: 4260). Может броситься в глаза сильное различие в количестве белков. При каком-то количественном сравнении у маленького протеома, наверное, будут наблюдаться более существенные статистические погрешности. А еще, в большом протеоме, наверное, будет больше белков, нужных для для обслуживания генома (в том числе всяких регуляторных). Но для представителей порядков Bacillales и Lactobacillales в целом наблюдается такое различие в размерах протеомов, поэтому придется смириться.

Оба протеома хорошо изучены, так как являются референсными. BUSCO не вызывает опасений - у обоих протеомов S > 99%, M < 1%. CPD у B. subtilis - Standart. Единственное, что может смутить - это CPD у S. thermophilus - Close to standart (low value), действительно, протеомы этого вида обычно чуть побольше (~1800), но этот имеет статус рефернсного, поэтому тоже смиримся.

Сравнение протеомов по представленности определенных групп белков

Сравнение проходило по группам 'Трансмембранные белки', 'Ферменты' и 'ДНК-связывающие'. Третья группа выбрана такой, чтобы проверить гипотезу о том, что в бОльшем протеоме будет больше белков, нужных для 'обсуживания' генома. Я подумал, что большинство таких белков будут связывать ДНК или РНК. Результаты сравнения приведены ниже.

Ссылка на скрипт, с помощью которого получены результаты.

Доля трансмембранных белков примерно равна, а вот разницу в доле ферментов я, к сожалению, не могу объяснить (разве что влияет, как раз разница размеров протеомов). Доля ДНК-связывающих белков у S. thermophilus действительно оказалась меньше, но я не уверен, что эти различия можно считать существенными, поэтому принять или отвергнуть гипотезу не получилось(

Дальнейшее сравнение

К сожалению, моей фантазии не хватило, чтобы придумать какое-то интересное сравнение, так как единственная отличительная особенность S. thermophilus, которая приходит мне на ум - это ее способность осуществлять молочнокислое брожение, но это не особо влияет на состав протеома (ферменты гликолиза есть у всех, лактатдегидрогеназа тоже есть, по крайней мере, у B. subtilis). Лактазы (бета-галактозидазы, расщепляющей лактозу) действительно не оказалась у контрольной бактерии, но это всего лишь один белок. Сначала я хотел каким-то образом сравнивать устойчивость к кислому pH у белков бактерий, так как при молочнокислом брожении, очевидно, происходит закисление среды, но не придумал как это сделать. От отчаяния я решил сравнить частоты ключевых слов для протеомов (ссылка на скрипт). Результаты представлены справа (я умею делать таблицы в html, но мне показалось это нецелесообразным).

B. subtilis
S. thermophilus

Что можно сказать? Большое количество белков B. subtilis имеют описанную 3D-структуру, что говорит о их хорошей изученности (неудивительно, так как это модельный организм). Также мне кажется, что у контрольной бактерии сложнее организация генома и сложнее регуляторные связи (группы 'Signal', 'Transcription regulation', 'DNA-binding'), с этим может быть связано и бОльшее количество белков в протеоме. Ну и в отличие от S. thermophilus, B. subtilis является спорообразующей бактерией.

Я понимаю, что 2 и 3 пункт можно было объеденить (и выводы по ним), но так виден ход моих мыслей.