Практикум 8

Сравнение протеомов

Выбор протеомов

Референсного протеома Pyrococcus abyssi не было, но был референсный Pyrococcus furiosus, также экстремофила.
TaxID:186497
ID:UP000001013
BUSCO:C:99.6% (S:99.1% D:0.4%) F:0% M:0.4%
CPD:Standart
N:2044
PE: 298, 573, 1173 (15%;28%;57%) - существование белка: экспериментально на уровне белка; из гомологии; предсказаны.
Команда для скачивания:wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=proteome:UP000001013' -O UP000001013.swiss.gz
Как видно, протеом хорошего качества. 15% белков подтверждены по PE:1. Из Swiss-prot 506 записей(25%), что неплохо. BUSCO и CPD показывают хорошую полноту протеома.

В качестве сравнения выбрал протеом археи Methanococcus maripaludis, не являющейся термофилом.
TaxID:267377
ID:UP000000590
BUSCO:C:99.7% (S:99.7% D:0%) F:0.3% M:0%
CPD:Standart
N:1722
PE: 54, 711, 957 (3%;41%;56%)
Команда для скачивания:wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=proteome:UP000000590' -O UP000000590.swiss.gz
Как видно, протеом достаточного качества. Всего 3% белков подтверждены по PE:1, что меньше чем у первого, но также как у него предсказанных белков не сильно больше половины. Из Swiss-prot 364 записей(21%), что неплохо. BUSCO и CPD показывают хорошую полноту протеома.

Сравнение по группам белков

Трансмембранные

Проверка производилась через расширенный поиск UniProtKB c запросом:
(proteome:{ID}) AND ((keyword:transmembrane) OR (cc_scl_term:SL-0162))

У Pyrococcus furiosus значение равно 401 записи (20%), у протеома сравнения 324 (19%)

Ферменты

Поиск осуществлялся через командную строку посредством команды Bash:
zgrep 'CATALYTIC ACTIVITY' {ID} | wc -l

У Pyrococcus furiosus значение равно 548 (27%), у протеома сравнения 479 (28%)

Можно сделать вывод, что данные протеомы, по крайней мере, описаны одинаково неплохо

Повреждение днк и белков

Pyrococcus - род архей экстремофилов, поэтому интересно исследовать, существует ли у них большее разнообразие белков отвечающих за восстановление. Ведь при экстремальных условиях шанс повреждения повышен, особенно для белков. Поэтому средствами Bash и расширенным поиском UniProtKB проверим число белков - шаперонов, имеющих отношения к исправлению структур поврежденных белков. К тому же интересно, влияет ли среда на систему репарации ДНК.

Повреждение белков: zgrep 'KW' {ID}.swiss.gz | zgrep 'haperon' | wc -l
Репарация: (proteome:{ID}) AND ((keyword:KW-0227) OR (keyword:KW-0234))

Но оказалось, что к первому запросу относилось лишь 4 записи, при чем в обоих протеомах. Во втором случае у Pyrococcus 17 белков, у контрольного же 16, впрочем, это разница не кажется значительной. Полученные данные не дают оснований полагать, что эти системы как-то разительно отличаются. К сожалению, иных предположений, которые могли бы разделять этих представителей выдвинуть не смог.

Частота аминокислот

С помощью программы, написанной на python, удалось установить среднюю встречаемость аминокислот в белках сравниваемых протеомов. Полученные данные занесены в таблицу. Помимо прочего было обнаружено, что в белках Methanococcus maripaludis, в отличие от Pyrococcus furiosusвстречается селеноцистеин, что может быть связано со специфичностью среды обитания экстремофилов, где селен и его формы не встречаются.

MethanococcusPyrococcusсвойстваразницаотносительная разница
S6,30%4,90%p-1,40%-0,25
F4,20%4,40%n0,20%5%
L9,10%10,10%n1,00%10%
Y3,80%4,00%n0,20%5%
C1,40%0,60%p-0,80%-80%
W0,70%1,20%n0,50%53%
P3,40%4,30%n0,90%23%
H1,50%1,50%+0,00%0%
Q1,90%1,70%p-0,20%-11%
R3,10%5,30%+2,20%52%
I9,40%8,70%n-0,70%-8%
M2,60%2,20%S-0,40%-17%
T5,00%4,40%p-0,60%-13%
N5,60%3,50%p-2,10%-46%
K8,80%8,10%+-0,70%-8%
V7,00%7,90%n0,90%12%
A5,80%6,60%n0,80%13%
D5,60%4,40%--1,20%-24%
E8,10%8,90%-0,80%9%
G6,80%7,20%n0,40%6%

Можно заметить, что практически все неполярные аминокислоты встречаются чаще в исследуемом протеоме, чем в контрольном. Выделяется изменение частоты Аргинина и аспарагина. При этом частота аспарагиновой кислоты закономерно понижена, вместе с аспарагином.

Скрипт Python