Практикум 8. База данных UniProt
Данный практикум посвящён знакомству с базой данных о белковых последовательностях UniProt. В ходе работы была изучена запись о дегидрогеназе монооксида углерода, выделенной из Carboxydothermus hydrogenoformans (штамм ATCC BAA-161 / DSM 6008 / Z-2901). Структура белка известна полностью, в записях PDB она представлена 1 цепью. В таблице 1 представлена информация, полученная из записи UniProt о данном белке.
Раздел UniProtKB | UniProt ID | UniProt AC | EMBL AC нуклеотидной записи | PDB ID | Длина, а. о. | Молекулярная масса, Да | Рекомендуемое UniProt название |
---|---|---|---|---|---|---|---|
Swiss-Prot | COOS2_CARHZ | Q9F8A8, Q3AFX7, Q9F8L4 | AF249899, CP000141, AF244619 | 1SU7, 1SU8, 1SUF, 2YIV, 3B51, 3B52, 3B53, 3I39, 4UDX, 4UDY, 5FLE | 636 | 66 914 | Carbon monoxide dehydrogenase 2 (CODH 2) |
Далее, для изучаемой записи были найдены кластеры UniRef50, UniRef90 и UniRef100. С результатами поиска можно ознакомиться в таблице 2.
ID кластера | Название кластера | Размер кластера | |
---|---|---|---|
UniRef50 | UniRef50_P31896 | Cluster: Carbon monoxide dehydrogenase | 121 |
UniRef90 | UniRef90_Q9F8A8 | Cluster: Carbon monoxide dehydrogenase 2 | 6 |
UniRef100 | UniRef100_Q9F8A8 | Cluster: Carbon monoxide dehydrogenase 2 | 1 |
Сеансы поиска
Помимо изучения записи Q9F8A8, были проведены несколько сеансов поиска в базе данных UniProt. Их результаты представлены ниже.
Поиск по рекомендованному названию белка
Текст запроса: name:"codh 2"
Найдено 3 записи с UniProt AC Q9F8A8, Q8TR73 и Q8PUN1; все 3 - из раздела Swiss-Prot.
Первая из них - это ранее рассмотренная запись о бактериальном белке, 2 другие - записи о белках архей.
Поиск по рекомендованному названию среди белков Carboxydothermus hydrogenoformans
Текст запроса: name:"codh 2" organism:"carboxydothermus hydrogenoformans"
Найдена 1 ранее рассмотренная запись (UniProt AC: Q9F8A8).
Поиск по рекомендованному названию среди белков бактерий семейства Thermoanaerobacteraceae
Текст запроса: name:"codh 2" taxonomy:thermoanaerobacteraceae
Найдена 1 ранее рассмотренная запись (UniProt AC: Q9F8A8).
Поиск по рекомендованному названию среди белков бактерий отдела Firmicutes
Текст запроса: name:"codh 2" taxonomy:firmicutes
Найдена 1 ранее рассмотренная запись (UniProt AC: Q9F8A8).
Поиск по названию cytochrome
Текст запроса: name:cytochrome
Найдено 2 998 182 записей;
7 863 - из раздела Swiss-Prot, 2 990 319 - из раздела TrEMBL. Больше всего записей посвящено белкам Homo sapiens
(4 807), Arabidopsis thaliana (678) и Mus musculus (555).
Поиск по названию cytochrome среди белков позвоночных (Vertebrata)
Текст запроса: name:cytochrome taxonomy:vertebrata
Найдено 349 658
записей; 2 948 - из раздела Swiss-Prot, 346 710 - из раздела TrEMBL. Самые популярные организмы - Homo sapiens
(4 807), Mus musculus (555), Bos taurus (477).
Поиск по названию cytochrome среди белков членистоногих (Arthropoda)
Текст запроса: name:cytochrome taxonomy:arthropoda
Найдено 1 381 084
записей; 230 - из раздела Swiss-Prot, 1 380 854 - из раздела TrEMBL. Больше всего записей о белках Musca domestica
(277), Drosophila melanogaster (250), Blattella germanica (193).
Поиск по названию trypsin
Текст запроса: name:trypsin
Найдено 29 530 записей; 320 -
из раздела Swiss-Prot, 29 210 - из раздела TrEMBL. Популярные организмы - Homo sapiens (64), Mus musculus (36),
Bos taurus (31).
Поиск по названию trypsin, исключающий ингибиторы трипсина
Текст запроса: name:trypsin ec:3.4.*.*
Найдено 860 записей; 96 - из
раздела Swiss-Prot, 764 - из раздела TrEMBL. Наибольшее число записей - о белках Homo sapiens (13),
Drosophila melanogaster (13), Rattus norvegicus (9).
Информация актуальна на 06.04.2020