Учебный сайт Ивана Федорова


Практикум 8

В ходе данного практикума я рассматривал референсные протеомы двух архей из рода Thermococcus: T. kodakarensis (идентификатор UP000000536, 2301 белок) и T.barophilus (идентификатор UP000007478, 2207 белков). T. kodakarensis был выбран, потому что это ближайший родственник T. peptonophilus, имеющий референсный протеом, а T.barophilus - потому что это родственный им обоим вид, в то же время обладающий некоторыми особенностями, например, способностью к карбокситрофии, которой лишен T. peptonophilus.

Оба протеома алгоритмом CPD относятся к близким к стандарту, имеющим более высокие значения, чем в среднем среди родственных организмов (Close to standard, high value). Показатели BUSCO для первого протеома - S:100%; для второго - S:98,3% F:0,4% M:1,3%. Таким образом, качество протеома T. kodakarensis слегка лучше, чем у протеома T.barophilus.

Для сравнения долей функциональных групп я воспользовался расширенным поиском в UniProtKB. Первая группа - трансмембранные белки, результаты запросов для нее следующие:

(proteome:UP000000536) AND (ft_transmem:*) - 462 записи;

(proteome:UP000007478) AND (ft_transmem:*) - 422 записи.

Вторая группа - ферменты:

(proteome:UP000000536) AND (ec:*) - 399 записей;

(proteome:UP000007478) AND (ec:*) - 346 записей.

Поскольку меня интересовала разница в способности к карбокситрофии, за которую отвечают оксидоредуктазы, в качестве третьей функциональной группы я взял ферменты из 1 класса:

(proteome:UP000000536) AND (ec:1) - 32 результата;

(proteome:UP000007478) AND (ec:1) - 29 результатов.

Таким образом, можно заметить, что протеомы двух рассмотренных архей при близких размерах довольно существенно различаются по количеству трансмембранных белков, и особенно ферментов. T. kodakarensis, чей протеом лучше описан и немног крупнее, имеет намного больше известных ферментов, чем T.barophilus. В то же время разница в количестве записей, относящихся к оксидоредуктазам, меньше.

Помимо сравнения протеомов по размеру разных групп белков, я проверил их на наличие белков, начинающихся не с метионина, однако ни в одном из протеомов таких белков не обнаружил. Прилагаю скрипт, с помощью которого проводил проверку.

Для скачивания протеомов были использованы следующие команды:

wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=%28proteome%3AUP000000536%29' -O UP000000536.swiss.gz

wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=%28proteome%3AUP000007478%29' -O UP000007478.swiss.gz