Практикум 8

1.Выбор и скачивание протеомов

Для анализа я выбрала протеом Rickettsia asiatica (UP000321183), содержащий 1580 белков.Он не является референсным, но имеет достаточно хорошие показатели качества и полноты. BUSCO - 98.6% (S: 98.4% D:0.3%), оценка размера протеома (CPD) имеет показатель outlier (high value) – это не очень высокий показатель, но возможно разбор в размерах связан с внутриклеточным паразитизмом. Причина по которой я выбрала не референсный геном близкородственного вида заключается в том, у рода Rickettsia существуют 4 группы. Rickettsia asiatica относится к группе пятнистых лихорадок, а все 4 представителя рода для которых протеомы являются референсными относятся к другим группам, что может быть причиной значительных различий в геноме, связанных с присоблением к жизни во внутриклеточной среде того или иного хозяина. Также Rickettsia asiatica содержит плазмиду в отличие от остальных организмов. Согласно статье, возможность быть патогенным для данного вида не выявлена.

Для сравнения я выбрала геном Rickettsia prowazekii, содеражащий 832 белка. Является референсным и имеет показатели: BUSCO - 98.9% (S: 98.9% D:0%). CPD - close to standard (low value). Rickettsia prowazekii относится к группе тифа и является возбудителем эпидемического сыпного тифа.

Скачивание протеомов с помощью команд:

wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000321183) ' -O UP000321183.swiss.gz

wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000002480) ' -O UP000002480.swiss.gz

2. Сравнение протеомов по представленности определенных групп белков

1.Трансмембранные белки

Для поиска трансмембранных белков использовались следующие поисковые запросы в UniProtKB:

(proteome:UP000321183) AND (ft_transmem:*)

(proteome:UP000002480) AND (ft_transmem:*)

Таким образом, Rickettsia asiatica содержит 285 трансмембранных белков (18.0%), а Rickettsia prowazekii – 202 (24.4%).

Далеко не для всех белков в протеоме известно клеточное расположение. Поэтому чем более хорошо аннотирован протеом, тем ближе к реальности будут результаты. Так для протеома Rickettsia asiatica ни один из 1580 белков не представлен в Swiss-Prot, а в протеоме Rickettsia prowazekii 584 белка из 832 представлены в Swiss-Prot, поэтому данные по этому протеому более показательны. В записи узнать является ли белок трансмембранным или нет можно по строке KW, но, поскольку большинство ключевых слов в записи добавляются в процессе аннотации, в записях Swiss-Prot обычно больше ключевых слов.

2.Ферменты

Для сравнения содержания ферментов были выполнены следующие запросы:

(proteome:UP000321183) AND (ec:*)

(proteome:UP000002480) AND (ec:*)

Rickettsia asiatica содержит 280 ферментов (17.7%), а Rickettsia prowazekii – 288 (34.6%).

Протеом Rickettsia prowazekii более хорошо анннотирован по сравнению с протеомом Rickettsia asiatica. Но возможно, данные о количестве ферментов в протеомах более репрезентативны, так как каждому ферменту присваивается свой EC-номер, кототрый отражается в строке DE и вероятно менее зависит от аннотированности белка

3.Белки, участвующие в гликолизе

(proteome:UP000321183) AND (keyword:KW-0324)

(proteome:UP000002480) AND (keyword:KW-0324)

Несмотря на лучшую аннотированность протеома Rickettsia prowazekii, такой запрос выдал 3 результата, у Rickettsia asiatica – 5. Это связано с тем, что Rickettsia prowazekii утрачивает очень многие ферменты гликолиза.

3. Сравнение протеомов по средней длине белков

скрипт

Результаты мини-обзора позволили сделать вывод о том, что внутриклеточный паразитизм является возможной причиной ряда особенностей, связанных с устройством генома и протеома Rickettsia asiatica, такие как небольшой размер генома и тенденция к уменьшению средней длины белков.

Rickettsia prowazekii также является внутриклеточным паразитизмом. Интересно, что Rickettsia prowazekii содержит еще меньшее количество белков. Геном R. prowazekii содержит самую высокую долю некодирующей ДНК (24%), обнаруженную на сегодняшний день в микробном геноме. Такие некодирующие последовательности могут быть деградировавшими остатками «нейтрализованных» генов, которые ожидают исключения из генома.

Я решила сравнить среднюю длину белка у Rickettsia prowazekii и Rickettsia asiatica.

Результаты получились следующие:

Rickettsia asiatica - 236.5

Rickettsia prowazekii - 335.3

На самом деле, перед началом сравнения были ожидания получить противоположные результаты.

Вероятно, что уменьшение протеома у Rickettsia prowazekii не позволяет исключить большие белки, так как они играют важную роль в функционировании организма. Поэтому, несмотря на то что протеом Rickettsia prowazekii состоит из меньшего количества белков, средняя длина белков больше, чем у Rickettsia asiatica.