Вы находитесь на главной странице учебного сайта Яковлевой Марии.
Здесь будут выкладываться результаты практических работ по биоинформатике и не только :з
Яковлева Мария Владимировна
Факультет Биоинженерии и биоинформатики Московского государственного университета имени М. В. Ломоносова, Москва, Россия
Контакты: yakovleva.marusya@yandex.ru.
При поиске протеома для моей бактерии Salmonella enterica subsp. enterica serovar Typhimurium str. LT2 мне удалось найти несколько референсных протеомов, из которых только один(UP000001014) полностью соответствовал моей бактерии вплоть до штамма.
К тому же, качество и полнота генома тоже были отличные: все 4533 белка есть в базе Swiss-Prot, параметр BUSCO высокий C:100% (S:99.8% D:0.2%) F:0% M:0%, параметр СPD тоже идеальный: Standard.
В качестве контрольного протеома я хотела взять непатогенную сальмонеллу, однако, оказалось, что все бактерии рода Salmonella являются патогенными.
Поэтому я решила взять бактерию Escherichia coli (штамм K12), которая является модельным организмов и при этом достаточно близким родственником Сальмонеллы (они относятся к одному семейству).
Идентификатор протеома UP000000558, число белков равно 5059, все они есть в базе данных Swiss-Prot, BUSCO отличный C:100% (S:99.5% D:0.5%) F:0% M:0%, CPD тоже: Standard.
Протеомы я скачала командами:
wget
'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000001014)'
-O UP000001014.swiss.gz
wget
'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000000558)'
-O UP000000558.swiss.gz
1) Для поиска трансмембранных белков я использовала ключевое слово Transmembrane [KW-0812]. Получились следующие запросы для Salmonella и Escherichia соответственно.
(keyword:KW-0812) AND (proteome: UP000001014) | 1025 (22.6%) |
(keyword:KW-0812) AND (proteome: UP000000558) |
886 (17.5%) |
Можно предположить, что такое различие в 5 процентов связано с патогенностью сальмонеллы. Проведя анализ трансмембранных белков Сальмонеллы, я обнаружила, что многие из них связаны с образом жизни данной бактерии (она является внутриклеточным патогеном), например, Invasion protein InvA, Virulence sensor histidine kinase PhoQ и другие.
2) Для оценки количества белков ферментов я вводила следующий запрос для Salmonella и Escherichia соответственно:
(ec:*) AND (proteome: UP000001014) | 1417 (31.3%) |
(ec:*) AND (proteome: UP000000558) |
1293 (25.6%) |
Аналогичным образом, я предположила, что такая разница в количестве белков ферментов связана с наличием специфических ферментов, связанных с патогенностью Сальмонеллы. Действительно, мне удалось найти достаточно много таких белков. Например, Secreted effector protein SseJ, который секретируются в цитоплазму клетки хозяина, где она может впоследствии влиять на внутриклеточные процессы.
3) В качестве третьей группы я решила сравнить сальмонеллу и эшерихию по функциональной группе “Вирулентность”. Для этого использовались следующие запросы c ключевым словом Virulence
keyword:KW-0843) AND (proteome: UP000001014) | 112 (2.4%) |
(keyword:KW-0843) AND (proteome: UP000000558) |
30 (0.6%) |
Как и предполагалось, сальмонелла имеет гораздо больше факторов вирулентности, тк она вызывает сальмонеллез, в то время как E.Coli достаточно редко бывает патогенной (только некоторые штаммы).
Для этого я использовала следующие команды
zcat UP000001014.swiss.gz | grep -A 1 '^SQ' | grep -n '^ M' | wc -l
результат: 5054
zcat UP000000558.swiss.gz | grep -A 1 '^SQ' | grep -n '^ M' | wc -l
результат: 4533
Оказалось, что все белки начинаются с метионина!