Для анализа я выбрала протеом Rickettsia asiatica (UP000321183), содержащий 1580 белков.Он не является референсным, но имеет достаточно хорошие показатели качества и полноты. BUSCO - 98.6% (S: 98.4% D:0.3%), оценка размера протеома (CPD) имеет показатель outlier (high value) – это не очень высокий показатель, но возможно разбор в размерах связан с внутриклеточным паразитизмом. Причина по которой я выбрала не референсный геном близкородственного вида заключается в том, у рода Rickettsia существуют 4 группы. Rickettsia asiatica относится к группе пятнистых лихорадок, а все 4 представителя рода для которых протеомы являются референсными относятся к другим группам, что может быть причиной значительных различий в геноме, связанных с присоблением к жизни во внутриклеточной среде того или иного хозяина. Также Rickettsia asiatica содержит плазмиду в отличие от остальных организмов. Согласно статье, возможность быть патогенным для данного вида не выявлена.
Для сравнения я выбрала геном Rickettsia prowazekii, содеражащий 832 белка. Является референсным и имеет показатели: BUSCO - 98.9% (S: 98.9% D:0%). CPD - close to standard (low value). Rickettsia prowazekii относится к группе тифа и является возбудителем эпидемического сыпного тифа.
Скачивание протеомов с помощью команд:
wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000321183) ' -O UP000321183.swiss.gz
wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000002480) ' -O UP000002480.swiss.gz
1.Трансмембранные белки
Для поиска трансмембранных белков использовались следующие поисковые запросы в UniProtKB:
(proteome:UP000321183) AND (ft_transmem:*)
(proteome:UP000002480) AND (ft_transmem:*)
Таким образом, Rickettsia asiatica содержит 285 трансмембранных белков (18.0%), а Rickettsia prowazekii – 202 (24.4%).
Далеко не для всех белков в протеоме известно клеточное расположение. Поэтому чем более хорошо аннотирован протеом, тем ближе к реальности будут результаты. Так для протеома Rickettsia asiatica ни один из 1580 белков не представлен в Swiss-Prot, а в протеоме Rickettsia prowazekii 584 белка из 832 представлены в Swiss-Prot, поэтому данные по этому протеому более показательны. В записи узнать является ли белок трансмембранным или нет можно по строке KW, но, поскольку большинство ключевых слов в записи добавляются в процессе аннотации, в записях Swiss-Prot обычно больше ключевых слов.
2.Ферменты
Для сравнения содержания ферментов были выполнены следующие запросы:
(proteome:UP000321183) AND (ec:*)
(proteome:UP000002480) AND (ec:*)
Rickettsia asiatica содержит 280 ферментов (17.7%), а Rickettsia prowazekii – 288 (34.6%).
Протеом Rickettsia prowazekii более хорошо анннотирован по сравнению с протеомом Rickettsia asiatica. Но возможно, данные о количестве ферментов в протеомах более репрезентативны, так как каждому ферменту присваивается свой EC-номер, кототрый отражается в строке DE и вероятно менее зависит от аннотированности белка
3.Белки, участвующие в гликолизе
(proteome:UP000321183) AND (keyword:KW-0324)
(proteome:UP000002480) AND (keyword:KW-0324)
Несмотря на лучшую аннотированность протеома Rickettsia prowazekii, такой запрос выдал 3 результата, у Rickettsia asiatica – 5. Это связано с тем, что Rickettsia prowazekii утрачивает очень многие ферменты гликолиза.
Результаты мини-обзора позволили сделать вывод о том, что внутриклеточный паразитизм является возможной причиной ряда особенностей, связанных с устройством генома и протеома Rickettsia asiatica, такие как небольшой размер генома и тенденция к уменьшению средней длины белков.
Rickettsia prowazekii также является внутриклеточным паразитизмом. Интересно, что Rickettsia prowazekii содержит еще меньшее количество белков. Геном R. prowazekii содержит самую высокую долю некодирующей ДНК (24%), обнаруженную на сегодняшний день в микробном геноме. Такие некодирующие последовательности могут быть деградировавшими остатками «нейтрализованных» генов, которые ожидают исключения из генома.
Я решила сравнить среднюю длину белка у Rickettsia prowazekii и Rickettsia asiatica.
Результаты получились следующие:
Rickettsia asiatica - 236.5
Rickettsia prowazekii - 335.3
На самом деле, перед началом сравнения были ожидания получить противоположные результаты.
Вероятно, что уменьшение протеома у Rickettsia prowazekii не позволяет исключить большие белки, так как они играют важную роль в функционировании организма. Поэтому, несмотря на то что протеом Rickettsia prowazekii состоит из меньшего количества белков, средняя длина белков больше, чем у Rickettsia asiatica.