Практикум 8. База данных UniProt

Данный практикум посвящён знакомству с базой данных о белковых последовательностях UniProt. В ходе работы была изучена запись о дегидрогеназе монооксида углерода, выделенной из Carboxydothermus hydrogenoformans (штамм ATCC BAA-161 / DSM 6008 / Z-2901). Структура белка известна полностью, в записях PDB она представлена 1 цепью. В таблице 1 представлена информация, полученная из записи UniProt о данном белке.

Таблица 1. Информация об исследуемом белке
Раздел UniProtKB UniProt ID UniProt AC EMBL AC нуклеотидной записи PDB ID Длина, а. о. Молекулярная масса, Да Рекомендуемое UniProt название
Swiss-Prot COOS2_CARHZ Q9F8A8, Q3AFX7, Q9F8L4 AF249899, CP000141, AF244619 1SU7, 1SU8, 1SUF, 2YIV, 3B51, 3B52, 3B53, 3I39, 4UDX, 4UDY, 5FLE 636 66 914 Carbon monoxide dehydrogenase 2 (CODH 2)

Далее, для изучаемой записи были найдены кластеры UniRef50, UniRef90 и UniRef100. С результатами поиска можно ознакомиться в таблице 2.

Таблица 2. Кластеры UniRef исследуемого белка
ID кластера Название кластера Размер кластера
UniRef50 UniRef50_P31896 Cluster: Carbon monoxide dehydrogenase 121
UniRef90 UniRef90_Q9F8A8 Cluster: Carbon monoxide dehydrogenase 2 6
UniRef100 UniRef100_Q9F8A8 Cluster: Carbon monoxide dehydrogenase 2 1

Сеансы поиска

Помимо изучения записи Q9F8A8, были проведены несколько сеансов поиска в базе данных UniProt. Их результаты представлены ниже.

Поиск по рекомендованному названию белка

Текст запроса: name:"codh 2"
Найдено 3 записи с UniProt AC Q9F8A8, Q8TR73 и Q8PUN1; все 3 - из раздела Swiss-Prot. Первая из них - это ранее рассмотренная запись о бактериальном белке, 2 другие - записи о белках архей.

Поиск по рекомендованному названию среди белков Carboxydothermus hydrogenoformans

Текст запроса: name:"codh 2" organism:"carboxydothermus hydrogenoformans"
Найдена 1 ранее рассмотренная запись (UniProt AC: Q9F8A8).

Поиск по рекомендованному названию среди белков бактерий семейства Thermoanaerobacteraceae

Текст запроса: name:"codh 2" taxonomy:thermoanaerobacteraceae
Найдена 1 ранее рассмотренная запись (UniProt AC: Q9F8A8).

Поиск по рекомендованному названию среди белков бактерий отдела Firmicutes

Текст запроса: name:"codh 2" taxonomy:firmicutes
Найдена 1 ранее рассмотренная запись (UniProt AC: Q9F8A8).

Поиск по названию cytochrome

Текст запроса: name:cytochrome
Найдено 2 998 182 записей; 7 863 - из раздела Swiss-Prot, 2 990 319 - из раздела TrEMBL. Больше всего записей посвящено белкам Homo sapiens (4 807), Arabidopsis thaliana (678) и Mus musculus (555).

Поиск по названию cytochrome среди белков позвоночных (Vertebrata)

Текст запроса: name:cytochrome taxonomy:vertebrata
Найдено 349 658 записей; 2 948 - из раздела Swiss-Prot, 346 710 - из раздела TrEMBL. Самые популярные организмы - Homo sapiens (4 807), Mus musculus (555), Bos taurus (477).

Поиск по названию cytochrome среди белков членистоногих (Arthropoda)

Текст запроса: name:cytochrome taxonomy:arthropoda
Найдено 1 381 084 записей; 230 - из раздела Swiss-Prot, 1 380 854 - из раздела TrEMBL. Больше всего записей о белках Musca domestica (277), Drosophila melanogaster (250), Blattella germanica (193).

Поиск по названию trypsin

Текст запроса: name:trypsin
Найдено 29 530 записей; 320 - из раздела Swiss-Prot, 29 210 - из раздела TrEMBL. Популярные организмы - Homo sapiens (64), Mus musculus (36), Bos taurus (31).

Поиск по названию trypsin, исключающий ингибиторы трипсина

Текст запроса: name:trypsin ec:3.4.*.*
Найдено 860 записей; 96 - из раздела Swiss-Prot, 764 - из раздела TrEMBL. Наибольшее число записей - о белках Homo sapiens (13), Drosophila melanogaster (13), Rattus norvegicus (9).

Информация актуальна на 06.04.2020