Референсного протеома Pyrococcus abyssi не было, но был референсный Pyrococcus furiosus, также экстремофила.
TaxID:186497
ID:UP000001013
BUSCO:C:99.6% (S:99.1% D:0.4%) F:0% M:0.4%
CPD:Standart
N:2044
PE: 298, 573, 1173 (15%;28%;57%) - существование белка: экспериментально на уровне белка; из гомологии; предсказаны.
Команда для скачивания:wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=proteome:UP000001013' -O UP000001013.swiss.gz
Как видно, протеом хорошего качества. 15% белков подтверждены по PE:1. Из Swiss-prot 506 записей(25%), что неплохо. BUSCO и CPD показывают хорошую полноту протеома.
В качестве сравнения выбрал протеом археи Methanococcus maripaludis, не являющейся термофилом.
TaxID:267377
ID:UP000000590
BUSCO:C:99.7% (S:99.7% D:0%) F:0.3% M:0%
CPD:Standart
N:1722
PE: 54, 711, 957 (3%;41%;56%)
Команда для скачивания:wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=proteome:UP000000590' -O UP000000590.swiss.gz
Как видно, протеом достаточного качества. Всего 3% белков подтверждены по PE:1, что меньше чем у первого, но также как у него предсказанных белков не сильно больше половины. Из Swiss-prot 364 записей(21%), что неплохо. BUSCO и CPD показывают хорошую полноту протеома.
Проверка производилась через расширенный поиск UniProtKB c запросом:
(proteome:{ID}) AND ((keyword:transmembrane) OR (cc_scl_term:SL-0162))
У Pyrococcus furiosus значение равно 401 записи (20%), у протеома сравнения 324 (19%)
Поиск осуществлялся через командную строку посредством команды Bash:
zgrep 'CATALYTIC ACTIVITY' {ID} | wc -l
У Pyrococcus furiosus значение равно 548 (27%), у протеома сравнения 479 (28%)
Можно сделать вывод, что данные протеомы, по крайней мере, описаны одинаково неплохо
Pyrococcus - род архей экстремофилов, поэтому интересно исследовать, существует ли у них большее разнообразие белков отвечающих за восстановление. Ведь при экстремальных условиях шанс повреждения повышен, особенно для белков. Поэтому средствами Bash и расширенным поиском UniProtKB проверим число белков - шаперонов, имеющих отношения к исправлению структур поврежденных белков. К тому же интересно, влияет ли среда на систему репарации ДНК.
Повреждение белков: zgrep 'KW' {ID}.swiss.gz | zgrep 'haperon' | wc -l
Репарация: (proteome:{ID}) AND ((keyword:KW-0227) OR (keyword:KW-0234))
Но оказалось, что к первому запросу относилось лишь 4 записи, при чем в обоих протеомах. Во втором случае у Pyrococcus 17 белков, у контрольного же 16, впрочем, это разница не кажется значительной. Полученные данные не дают оснований полагать, что эти системы как-то разительно отличаются. К сожалению, иных предположений, которые могли бы разделять этих представителей выдвинуть не смог.
С помощью программы, написанной на python, удалось установить среднюю встречаемость аминокислот в белках сравниваемых протеомов. Полученные данные занесены в таблицу. Помимо прочего было обнаружено, что в белках Methanococcus maripaludis, в отличие от Pyrococcus furiosusвстречается селеноцистеин, что может быть связано со специфичностью среды обитания экстремофилов, где селен и его формы не встречаются.
Methanococcus | Pyrococcus | свойства | разница | относительная разница | |
---|---|---|---|---|---|
S | 6,30% | 4,90% | p | -1,40% | -0,25 |
F | 4,20% | 4,40% | n | 0,20% | 5% |
L | 9,10% | 10,10% | n | 1,00% | 10% |
Y | 3,80% | 4,00% | n | 0,20% | 5% |
C | 1,40% | 0,60% | p | -0,80% | -80% |
W | 0,70% | 1,20% | n | 0,50% | 53% |
P | 3,40% | 4,30% | n | 0,90% | 23% |
H | 1,50% | 1,50% | + | 0,00% | 0% |
Q | 1,90% | 1,70% | p | -0,20% | -11% |
R | 3,10% | 5,30% | + | 2,20% | 52% |
I | 9,40% | 8,70% | n | -0,70% | -8% |
M | 2,60% | 2,20% | S | -0,40% | -17% |
T | 5,00% | 4,40% | p | -0,60% | -13% |
N | 5,60% | 3,50% | p | -2,10% | -46% |
K | 8,80% | 8,10% | + | -0,70% | -8% |
V | 7,00% | 7,90% | n | 0,90% | 12% |
A | 5,80% | 6,60% | n | 0,80% | 13% |
D | 5,60% | 4,40% | - | -1,20% | -24% |
E | 8,10% | 8,90% | - | 0,80% | 9% |
G | 6,80% | 7,20% | n | 0,40% | 6% |
Можно заметить, что практически все неполярные аминокислоты встречаются чаще в исследуемом протеоме, чем в контрольном. Выделяется изменение частоты Аргинина и аспарагина. При этом частота аспарагиновой кислоты закономерно понижена, вместе с аспарагином.