Учебный сайт
Яковлевой Марии

Вы находитесь на главной странице учебного сайта Яковлевой Марии.
Здесь будут выкладываться результаты практических работ по биоинформатике и не только :з

ПРАКТИКУМ 7

Яковлева Мария Владимировна
Факультет Биоинженерии и биоинформатики Московского государственного университета имени М. В. Ломоносова, Москва, Россия

Контакты: yakovleva.marusya@yandex.ru.

1. Выбор белка

Мой миниобзор был посвящен геному бактерии Salmonella enterica subsp. enterica serovar Typhimurium str. LT2, поэтому для поиска я решила использовать запрос к базе данных UniProtKB: Salmonella enterica subsp. enterica serovar Typhimurium str. LT2.

Из полученных 58 результатов, самый высокий annotation score(AS) был равен 4/5 и соответствовал всего одному белку: дигидрооротазе (P06204 · PYRC_SALTY). В качестве кофактора дигидрооротаза использует ион двухвалентного цинка.

Мне было интересно узнать больше деталей о биосинтезе пиримидинов, поэтому я решила изучить этот белок подробнее. 

2. Информация о белке

Дигидрооротаза ( EC 3.5.2.3 , карбамоиласпартдегидраза , дигидрооротатгидролаза ) — фермент, превращающий карбамоиласпарагиновую кислоту в 4,5-дигидрооротовую кислоту при биосинтезе пиримидинов (катализирует обратимую циклизацию карбамоиласпартата в дигидрооротат)

В качестве кофактора дигидрооротаза использует ион двухвалентного цинка.

3. Кластеры похожих белков

Поиск кластеров проводился в базе данных UniRef.

В кластере UniRef100 было найдено 26 записей, в UniRef90 – 715 и в UniRef50 – 3197. Как мы можем видеть из большого количества кластеров UniRef50 и небольших размеров UniRef100 и UniRef90, белок не очень консервативен, при этом широко распространен среди различных бактерий.

4. Поисковые запросы

Так как я не очень знакома с отличиями биосинтеза пиримидинов у прокариот и эукариот, мне стало интересно: есть ли дигидрооротаза у кого-то, кроме бактерий?

Для начала я нашла, насколько вообще этот белок распространен, путем введения запроса protein_name: ”Dihydroorotase”. Данный фермент оказался достаточно распространенным (67672 результата), причем, как среди бактерий, так и среди эукариот. Это достаточно логично, ведь этот фермент необходим для биосинтеза пиримидинов, который, как мне кажется, является достаточно консервативным процессом.

Затем мне стало интересно: сколько вариантов дигидрооротазы существует у бактерий, эукариот и архей?

Для этого я применила запросы:

(protein_name:"Dihydroorotase") AND (taxonomy_id:2)
(protein_name:"Dihydroorotase") AND (taxonomy_id: 2759)
(protein_name:"Dihydroorotase") AND (taxonomy_id:2157)

Получились следующие результаты:

Бактерии: 58919
Эукариоты: 5986
Эукариоты: 2297

Также я заметила, что не все Дигидрооротазы считаны с одного и того же гена. Я ввела два запроса, для того, чтобы посмотреть, сколько Дигидрооротаз считано с гена pyrC и с каких других генов может происходить считывание этого ферменты.

(protein_name:”Dihydroorotase”) AND (gene:"pyrC") 32721

(protein_name:”Dihydroorotase”) AND (gene:"pyrC")

34951

В основном это были гены PYR1-4 и CAD.

Тут мне пришла в голову мысль проверить: а сходятся ли числа? Равно ли количество генов pyrC и других генов, кодирующих данный фермент, 67672?

Путем нехитрых математических расчетов выяснилось, что все совпало, слава калькулятору, 32721 + 34951, действительно, 67672.

Но потом я решила проделать тоже самое для самопроверки в первом пункте и обнаружила, что 58919 + 5986 + 2297 не равняется 67672. Я списала это на ошибки UniProt.

Чтобы удостовериться, я ввела запрос запрос: (protein_name:"Dihydroorotase") NOT (taxonomy_id:2) NOT (taxonomy_id: 2759) NOT (taxonomy_id:2157)

Оказалось, что оставшиеся 470 результатов принадлежат различным метагеномам (метагеном морских отложений, метагеном шахтного дренажа, метагеном гидротермального источника, метагеномы растений и беспозвоночных)