На данном этапе выполнения работы мне нужно было воспользоваться поисковой сиситемой UniProt для нахождения возможных белков в бактерии Salmonella enterica subsp. enterica serovar Typhimurium str. LT2. Для поиска нужно использовать поисковую строку, где по умолчанию выбрана база данны UniProtKB, но для более точного и быстрого поиска я воспользовалась продвинутым поиском, сначала по таксонам ( taxonomy_name:"Salmonella enterica subsp. enterica serovar Typhimurium str. LT2"), но ничего не обнаружила, тогда я ввела в поисковую строку (organism_name:"Salmonella enterica subsp. enterica serovar Typhimurium str. LT2"), но опять столкнулась с той же проблемой, что и в прошлый раз, тогда я решила выполнить поиск по все возможным критериям "Salmonella enterica subsp. enterica serovar Typhimurium str. LT2" и мне выдало 6 вариантов. Теперь стлао понятно, что отдельно для моего штамма бактерии не были созданы страницы с белками, т.к. все страницы, которые я нашла, содержали в том числе 2 других штамма.
Я остановила свой выбор на белке PYRC_SALTY, т.к. его аннотация была наилучшей из 5 других (4/5). Немало важно, что этот белок содержит заметку о том, что он был проверен системой UniProtKB.
Полное название белка: дигидрооратаза (Название связано с функцией данного белка).
Функция:
1) катализирует обратимую циклизация N-карбонила-L-аспартата в дигидрооратат.
(S)-дигидрооротат + H2O = H + N-карбамоил-L-аспартат+
2) имеет 1 кофакторный сайт связывания: Zn2+
Название гена: ПирС (название исходит из функции: биосинтез пиримидина).
Мне стало интересно проверить у каких еще организмов кроме Salmonella enterica subsp. enterica serovar Typhimurium str. LT2 есть такой же кофактор (Zn2+).
Запрос: NOT (organism_id:99287) AND (cc_cofactor_chebi:"CHEBI:29105").
Итог: 2 883 292. Большая часть - это белки человека, ожидаемый исход.
Далее я решла проверить количесвто белков, которые выполняют ту же функуции, при этом имееют тот же кофактор (Zn 2+).
Запрос: NOT (organism_id:99287) AND (cc_cofactor_chebi:"CHEBI:29105") AND (cc_catalytic_activity:"EC:3.5.2.3").
Итог: 29 566. В большинстве своем это белки с геном pyrC/pyr1 встречающиеся в разных организмах, но можно заметить ген CAD ( участвует в первых 3 фазах биосинетеза пиримидина), интересно, что белки с этим геном очень хорошо аннотированы, скорее всего это связано с тем, что белки с этим геном были выделены из курпных эукариот ( человек,катран,хомяк).
А что, если просто проверить в каких еще организмах встречается этот белок.
Запрос: NOT (organism_id:99287) AND (protein_name:Dihydroorotase)
Итог: 68 193. В запросе преобладает ген pyrC. Интресно, что по этом запросу были показаны белки с другими названиями( CAD protein), но с той же функцией. Открыв их плоскую таблицу, я поняла, что их имя влючает еще нексколько имен белков, в том числе Дигидрооратаза.
Тогда мне стало интерсно, а если добавить и функцию белка.
Запрогс: NOT (organism_id:99287) AND (protein_name:Dihydroorotase) AND (cc_catalytic_activity:"EC:3.5.2.3").
Итог: 28 516. Видим значительное уменьшение. То есть поисковая сиситема исключила белки, которые содяржат название анализируемого белка, но не выполняют заданную функцию.