Протеом моей археи (Haloprofundus salinisoli) отсутствует в базе данных UniProtKB, поэтому я решил выбрать протеом другого близкого организма из того же рода. Поиск выдал только два результата: Haloprofundus sp. MHR1 (референсный) и Haloprofundus marisrubri. Я выбрал второй протеом. Хотя он и не является референсным (качество по BUSCO ниже, 1,4% Missing против 0,9%), но его качество по СPD выше (Standart против Close to standard (low value)), а главное, о нём гораздо больше информации в научных статьях. В качестве второго протеома я выбрал Halococcus morrhuae DSM 1307. Эта архея принадлежит тому же отряду, что и Haloprofundus (Halobacteriales), и их объединяет экстремальная галофильность (рода Halococcus и Haloprofundus считаются одними из самых экстремальных галофилов среди микроорганизмов). При этом способность к оптимальному существованию в условиях высокой солености у этих архей различается, и это можно исследовать.
Результаты оценки протеома представлены в таблице:
Архея | Haloprofundus marisrubri | Halococcus morrhuae |
ID | UP000054387 | UP000011568 |
BUSCO | C: 98.6% M:1.4% | C: 95.7% F: 1.1% M:3.2% |
СPD | Standart | Unknown |
Genome Representation | Full | Full |
Белков в геноме | 3716 | 3035 |
Белков из курируемой базы данных | 0 | 0 |
Референсный | Нет | Да |
Команды для скачивания протеома:
wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=proteome:UP000054387' -O ~/term2/pr8/UP000054387.swiss.gz
wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=proteome:UP000011568' -O ~/term2/pr8/UP000011568.swiss.gz
zgrep 'KW' UP000011568.swiss.gz | grep 'Transmembrane {' | wc -l
Результат: 653 трансмембранных белков
zgrep 'KW' UP000054387.swiss.gz | grep 'Transmembrane {' | wc -l
Результат: 938 трансмембранных белков
Современная классификация ферментов включает семь классов, в зависимости от выполняемой функции. Воспользуемся этим в поиске (Enzyme Classification в Advanced):
Ферменты | Haloprofundus marisrubri | Halococcus morrhuae |
Оксиредуктазы | 57 | 57 |
Трансферазы | 154 | 136 |
Гидролазы | 87 | 65 |
Лиазы | 61 | 59 |
Изомеразы | 26 | 25 |
Лигазы | 60 | 55 |
Транслоказы | 8 | 5 |
Запрос по 7 классам | 444 | 394 |
Сумма первых семи запросов | 475 | 402 |
Как видно из представленных данных, математический подсчёт всех ферментов, найденых отдельно, отличается от суммарного подсчёта. Так происходит потому, что организмы содержат мультифункциональные ферменты, которым присвоено сразу несколько EC. Например, археи содержат бифункциональный фермент NAD(P)H-hydrate repair enzyme, который принадлежит к классу лигаз как ADP-dependent (S)-NAD(P)H-hydrate dehydratase и к классу изомераз как NAD(P)H-hydrate epimerase.
Поискав информацию в статьях по галофильным организмам, я выяснил, что они имеют характерные особенности протеома, позволяющие им выживать в суровых условиях солёных вод. Отдельные рода имеют характерные для них защитные белки, например, бактериородопсин, свойственный Pseudomona [1]. В общем случае, для галофильных организмов характерен особый состав цитоплазматической мембраны (на треть липидный, на две трети белковый), повышенное количество ферментов амилаз, дегидрогеназ, протеаз и эстераз, а также цитохромов и флавопротеинов [3,4]. Я выдвинул гипотезу, что архея, в протеоме которой будет наблюдаться наибольшее разнообразие этих веществ, будет наиболее устойчивой к соленым условиям. С помощью расширенного поиска в UniProtKB я получил результаты о количестве белков в протеоме архей.
Белок | Haloprofundus marisrubri | Halococcus morrhuae |
Флавопротеины | 8 | 10 |
Цитохромы и относящиеся к ним ферменты | 19 | 21 |
Амилазы | 1 | 1 |
Дегидрогеназы | 132 | 137 |
Эстеразы | 1 | 2 |
Протеазы | 13 | 9 |
Анализ полученных результатов привёл к тому, что архея Haloprofundus marisrubri должна быть менее устойчивой к солёным условием. Проанализировав источники информации, я выяснил, что её оптимум действительно находится в менее соленых условиях (концентрация NaCl = 3.9М (22.8%)) [5], нежели у Halococcus morrhuae (концентрация NaCl в ср. 25%) [6], что согласуется с гипотезой. Однако зависимость между разнообразием галофильных белков и, собственно, галофильностью нелинейна (например, количество протеаз выбивается из общей тенденции) и поэтому нуждается в дальнейших исследованиях.
В ходе изучения источников информации было выяснено, что белки галофильных микроорганизмов обычно содержат пониженное количество цистеина [8]. Я решил проверить эту гипотезу и посчитать, сколько раз встречается молекула цистеина в протеоме архей. Для этого нужно было написать скрипт на Python, который выводит количество молекул цистеина в протеоме, количество молекул всех аминокислот в протеоме и долю, которую составляет цистеин от всех аминокислот (так как разные протеомы содержат разное количество белков, а различные белки состоят из различного числа аминокислот). Для того, чтобы получить дополнительное подтверждение или опровержение гипотезы, я скачал протеом референсной археи Nanoarchaeum equitans, которая живет в воде с концентрацией солей около 2% [9], то есть не является галофильной. (Proteom ID: UP000000578)
Результаты работы скрипта представлены в таблице:
Архея | Halococcus morrhuae | Haloprofundus marisrubri | Nanoarchaeum equitans |
Число АК Cys | 6263 | 7380 | 1227 |
Общее число АК | 858774 | 1074348 | 154228 |
Доля Cys | 0.00729 | 0.00687 | 0.00796 |
Как видно из результатов, в протеоме Haloprofundus marisrubri содержится меньше цистеина, чем у Halococcus morrhuae, что согласно гипотезе может указывать на то, что Haloprofundus более галофилен, нежели Halococcus. Однако следует учесть, что содержание цистеина в протеоме далеко не универсальный признак определения галофильности микроорганизмов и может зависеть от многих факторов, а белки, в состав которых входит Cys, могут выполнять совершенно разные функции. Тем не менее, согласно результатам у экстремальных галофилов действительно наблюдается пониженное содержание Cys в сравнении с мезофильной по этому фактору археей Nanoarchaeum equitans, что даёт гипотезе право на существование.