С помощью расширенного поиска на сайте UniProt мною были найдены записи о протеоме бактерии Coxiella burnetii RSA 493. Для начала я выбрала базу, в которой будет осуществляться поиск: Proteomes.
Для начала я установила фильтр Taxonomy [OC] и ввела название организма: Coxiella burnetii (strain RSA 493 / Nine Mile phase I). В запросе получилось: (taxonomy_id:227377). Таокй поиск выдал один результат. Протеом моей бактерии референсный. В нём 1812 белков 396 из которых были добавлены из Swiss-Prot.
Также я выбрала другую бактерию, чей протеом будет выступать контрольным. Я остановила свой выбор на Saccharophagus degradans (strain 2-40 / ATCC 43961 / DSM 17024), так как эта бактерия является непатогенной и тоже относится к типу Протеобактерий. Провела точно такой же поиск, но в запросе получилось: (taxonomy_id:203122). Протеом этой бактерии тоже референсный. В нём 3999 белков 385 из которых были добавлены из Swiss-Prot.
• Proteome ID: UP000002671
• Protein count: 1812
• CPD: Close to standard (low value)
• BUSCO: C:86.3% (S:86% D:0.3%) F:1.2% M:12.6%
• Swiss-Prot: 396
• Proteome ID: UP000001947
• Protein count: 3999
• CPD: Standard
• BUSCO: C:99.1% (S:99% D:0.1%) F:0.2% M:0.7%
• Swiss-Prot: 385
1. Трансмембранные белки
Трансмембранных белков: 353, в Swiss-Prot представлено 29 из них, запрос: (proteome:UP000002671) AND (ft_transmem:*)
2. Ферменты
Ферментов: 610, в Swiss-Prot представлено 234 из них, запрос: (proteome:UP000002671) AND (ec:*)
1. Трансмембранные белки
Трансмембранных белков : 858, в Swiss-Prot представлено 24 из них, запрос: (proteome:UP000001947) AND (ft_transmem:*)
2. Ферменты
Ферментов: 894, в Swiss-Prot представлено 245 из них, запрос: (proteome:UP000001947) AND (ec:*)
Третья группа белков для сравнения была выбрана на основе различий между основной и контрольной бактерии, а именно патогенности. Мной была найдена статья , в которой говорится, что белок 50S ribosomal subunit assembly factor BipA у данной бактерии (UniProt_ID: Q83D58_COXBU) отвечает за бактериальную подвижность, регуляцию экспрессии генов вирулентности и опосредовании избежания защитных механизмов хозяина. Однако на сайте UniProt указана другая функция. Запрос: (taxonomy_id:227377) AND (gene:BipA)
Этот же белок был найден у Saccharophagus degradans (strain 2-40 / ATCC 43961 / DSM 17024) по запросу: (taxonomy_id:203122) AND (gene:BipA)
Я решила сравнить протеомы двух представленных бактерий по встречаемости кодов ECO для того чтобы оценить полноту определения белков. Для начала мой был написан код на Python (посмотреть его можно перейдя по ссылке), который выбрал все встречаемые коды ECO и подсчитал их количество в каждом файле с информацией о протеоме.
ECO:0000269 53
ECO:0000314 0
ECO:0000353 0
ECO:0000315 0
ECO:0000316 0
ECO:0000270 0
ECO:0006056 0
ECO:0007005 0
ECO:0007001 0
ECO:0007003 0
ECO:0007007 0
ECO:0000318 0
ECO:0000319 0
ECO:0000320 0
ECO:0000321 0
ECO:0000250 211
ECO:0000266 0
ECO:0000247 0
ECO:0000255 4550
ECO:0000317 0
ECO:0000245 0
ECO:0000304 0
ECO:0000303 3
ECO:0000305 211
ECO:0000307 0
ECO:0007669 0
Таким образом мы видим, что наиболее часто встречаемый код - ECO:0000255. Он используется для обозначения данных, существование которых было предположено на основе модели последовательности. Используется, когда любой метод моделирования последовательности (например, Скрытые Марковские Модели) является основным доказательством.
Коды ECO:0000250 и ECO:0000305 являются вторыми по встречаемости. Их значение было описано мной на странице Практикума 7 (Код ECO:0000305 используется для обозначения данных, курируемых вручную, которые были выведены куратором на основе его/ее научных знаний или научного содержания статьи, код ECO:0000250 используется для обозначения данных, для доказательства которых используется сходство последовательностей).
Также встречается код ECO:0000269, значение которого тоже было описано на странице предыдущего практикума (Код ECO:0000269 используется для обозначения данных, которые были получены экспериментально).
Самым редко встречаемым является код ECO:0000303. Он используется для обозначения данных, которые были найдены в опубликованной статье, но их невозможно проследить до другой публикации.
На основе полученных данных мы можем сдлеать вывод, что белки протеома Coxiella burnetii описаны достаточно полно
ECO:0000269 34
ECO:0000314 0
ECO:0000353 0
ECO:0000315 0
ECO:0000316 0
ECO:0000270 0
ECO:0006056 0
ECO:0007005 0
ECO:0007001 0
ECO:0007003 0
ECO:0007007 0
ECO:0000318 0
ECO:0000319 0
ECO:0000320 0
ECO:0000321 0
ECO:0000250 31
ECO:0000266 0
ECO:0000247 0
ECO:0000255 4959
ECO:0000317 0
ECO:0000245 0
ECO:0000304 0
ECO:0000303 3
ECO:0000305 21
ECO:0000307 0
ECO:0007669 0
У контрольной бактерии так же самый встречаемый код ECO:0000255, однако код ECO:0000305 встречается реже, чем ECO:0000250, а вторым по частоте использования является ECO:0000269. Самым редко встречаемым так же является ECO:0000303.
Мы можем сделать вывод, что у данной бактерии протеом тоже описан достаточно полно, однако используется больше данных, которые были получены экпериментально.