На страницу IV-ого семестра
| Термин: | интегральный белок плазматической мембраны |
| Термин GO: | integral to plasma membrane |
| Идентификатор GO: | GO:0005887 |
| Онтология GO: | cellular component (клеточный компонент) |
| Определение: | Пронизывает как минимум один из двух слоев фосфолипидной мембраны клетки. Может также быть полностью встроенным в билипидный слой не выходя за его пределы. |
| Онтология GO (имя) | Количество ассоциированных терминов GO | Краткий ответ на вопрос | Данные EcoCyc | |
|---|---|---|---|---|
| Где? | Cellular component (клеточный компонент) | 0 | Нет данных | |
| Зачем, для чего? | Biological process (биологический процесс) | 2 (находок 3) | Участвует в важной метаболической реакции - биосинтезе биотина. | Катализирует финальную реакцию в процессе биосинтеза биотина. |
| Молекулярный механизм? | Molecular function (молекулярная функция) | 4 (находок 5) | Каталитическая активность, трансферазная активность, биотинсинтазная активность. Является катализатором в последней реакции в биосинтезе биотина, состоящей в присоединение серы к детиобиотину. Пиридоксаль фосфат-зависимым образом десульфирует цистеин. | Присоединяет атом серы между C6 и С9 атомами детиобиотина в S-аденозилметионин зависимой реакции. |
| Специфичность? | Molecular function (молекулярная функция) | 4 (находок 5) | Селективно взаимодействует с [2Fe-2S] кластером, а также [4Fe-4S] кластером | Содержит 2 различных железо-серносвязывающих сайта: один связывает [2Fe-2S] кластер, а другой [4Fe-4S]. Ингибитором реакции является 5'-дезоксиаденозин. |
EcoCyc. Информация найденая в EcoCyc про белок Biob_Ecoli (P12996) не сильно дополнила информацию банка GOA. Тем не менее банк данных EcoCyc содержит такую полезную информацию, как длина последовательности белка, молекулярный вес пептида, информацию о ферментативной реакции, кофакторы и ингибиторы.
Протеом Danio rerio. Результаты поиска в UniProt, 21.04.2007 г.
| Количество записей | Запрос | |
| Всего | 20411 | (([uniprot-Organism:Danio*] & [uniprot-Organism:rerio*]) | [uniprot-Organism:Danio rerio*]) | Всего с идентификаторами GO | 12072 | ((([uniprot-Organism:Danio*] & [uniprot-Organism:rerio*]) | [uniprot-Organism:Danio rerio*]) & [uniprot-DBxref_:GO:*]) |
| С идентификаторами всех 3-х онтологий GO | 4009 | ((([uniprot-Organism:Danio*] & [uniprot-Organism:rerio*]) | [uniprot-Organism:Danio rerio*]) & ((([uniprot-DBxref_:GO:*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:P:*]) & [uniprot-DBxref_:C:*])) |
| В том числе интегральных белков плазматической мембраны | 39 | ((([uniprot-Organism:Danio*] & [uniprot-Organism:rerio*]) | [uniprot-Organism:Danio rerio*]) & ((([uniprot-DBxref_:GO:0005887*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:P:*]) & [uniprot-DBxref_:C:*])) |
| В том числе только с самыми хорошими доказательствами функции (коды только IDA или TAS) | 0 | Organism Name: Danio rerio & DBxref_: GO:0005887 & F: & P: & C: & (IDA: | TAS:) !NAS: !IMP: !IEA: !IGP: !IEI: !IPI: !ISS: !ND: !RCA: !IC !IGC: !NP: |
| В том числе те, у которых встречается хотя бы один раз самое хорошее доказательство функции (коды IDA или TAS) | 5 | ((([uniprot-Organism:Danio*] & [uniprot-Organism:rerio*]) | [uniprot-Organism:Danio rerio*]) & (((([uniprot-DBxref_:GO:0005887*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:P:*]) & [uniprot-DBxref_:C:*]) & ([uniprot-DBxref_:IDA:*] | [uniprot-DBxref_:TAS:*]))) |
Только 59% белков Danio rario аннотированны в БД GO. Произведя поиск интегральных белков плазматический мембраны с идентификаторами GO из организма Danio rerio, можно заметить, что хорошо аннотированы менее 1% всех записей. Все это говорит о том, что протеом Danio rerio еще очень плохо описан в БД GO.
На страничке GOA со списком терминов GO, ассоциированных с записью UniProt P12996, отметили галочками все термины и нажали кнопку "View selected terms in context". На полученном графе почти все связи типа "IS A", то есть такая связь подразумевает, что нижестоящий объект является частным случаем вышестоящего. Для примера рассмотрим следующий фрагмент графа.
На этом изображении термин "процесс биосинтеза биотина" (biotin biosynthetic process) находится в
подчинительных связях типа "IS A" к трем другим терминам: "процесс метаболизма биотина" (biotin metabolic
process), "биосинтетический процесс включения серы" (sulfur compound biosynthetic process), "процесс
биосинтеза водорастворимых витаминов" (water-soluble vitamin biosynthetic process). Как можно заметить
термин "процесс биосинтеза биотина" является частным случаем для каждого из 3-х более общих случаев. Так
например, биосинтез водорастворимых витаминов, кроме биосинтеза биотина, может подразумевать биосинтез
кобаламина, фолиевой кислоты, рибофлавина, тиамина и т.д.
Также можно рассмотреть случай, когда более общий термин дробится на несколько частных (хотя по сути это
тоже самое, что и вышерассмотренный пример)
На этом фрагменте видно, как термин "процессы метаболизма клетки" разбивается на более частные термины: "процесс метаболизма витаминов", "клеточные биосинтетические процессы" и другие.
В полученном графе только в одном месте имеются связи типа "PART OF A", этот случай и рассмотрим.
Строго говоря эти термины и их связи имеют слабое отношение к генам и генным продуктам, они скорее относятся к структуре базы данных GO. Мне не до конца понятно, почему авторы решили соединить эти термины именно такой связью. Возможно, они хотели показать, что GO может состоять и из других онтологий не обязательно из таких как они предложили. В общем, связь "PART OF A" подразумевает, что младший термин является необязательной частью старшего.
Целью данного упражнения является установить насколько хорошо аннотирована группа интегральных белков плазматической мембраны у Danio rerio, а также как аннотирована, то есть автоматически (компьютером) или на основании эксперимента.
| Доказательство функций | ||
| экспериментальные | электронные | сомнительно |
| IDA (Inferred from Direct Assay) IEP (Inferred from Expression Pattern) IGI (Inferred from Genetic Interaction) IMP (Inferred from Mutant Phenotype) IPI (Inferred from Physical Interaction) TAS (Traceable Author Statement) |
IC (Inferred by Curator) IEA (Inferred from Electronic Annotation) IGC (Inferred from Genomic Context) ISS (Inferred from Sequence or Structural Similarity) RCA (Inferred from Reviewed Computational Analysis) |
NAS (Non-traceable Author Statement) ND (No biological Data available) NR (Not Recorded) |
Для выполнения данного задания сначала с помощью SRS, "Extended Query Form" получили выборку белков, в которых имеется идентификатор GO, соответствующий интегральным белкам плазматической мембраны. В поле "Organism Name" ввели "Danio rerio", в поле "DBxref_ " - "GO:0016021". Отмечаем эти поля галочками, чтобы они были показаны в выдаче. Установили параметры выдачи результата в виде списка (list). Сохранили полученные результаты в текстовом файле с помощью соответствующей функции SRS.
Полученные текстовый файл обработали с помощью функции grep:
grep 'GO:' query.txt -c
| Аннотация | Команда UNIX | Кол-во строк |
| Компьютерные аннотации | ||
| IEA | grep 'GO:.*IEA:' query.txt -c | 3995 |
| ISS | grep 'GO:.*ISS:' query.txt -c | 42 |
| IC | grep 'GO:.*IC:' query.txt -c | 5 |
| IGC | grep 'GO:.*IGC:' query.txt -c | 0 |
| RCA | grep 'GO:.*RCA:' query.txt -c | 0 |
| Всего: | 4042 | |
| Доля от общего кол-ва: | 98,83% | |
| Экспериментальные аннотации | ||
| IMP | grep 'GO:.*IMP:' query.txt -c | 11 |
| TAS | grep 'GO:.*TAS:' query.txt -c | 9 |
| IDA | grep 'GO:.*IDA:' query.txt -c | 4 |
| IGI | grep 'GO:.*IGI:' query.txt -c | 2 |
| IEP | grep 'GO:.*IEP:' query.txt -c | 0 |
| IPI | grep 'GO:.*IPI:' query.txt -c | 0 |
| Всего: | 26 | |
| Доля от общего кол-ва: | 0,63% | |
| Сомнительные | ||
| NAS | grep 'GO:.*NAS:' query.txt -c | 22 |
| ND | grep 'GO:.*ND:' query.txt -c | 0 |
| NR | grep 'GO:.*NR:' query.txt -c | 0 |
| Всего: | 22 | |
| Доля от общего кол-ва: | 0,54% | |
Рассматривая приведенную выше таблицу несложно заметить, что более 98% аннотаций GO - "чисто компьютерные", причем подавляющее большинство из них это IEA аннотации, т.е. они основаны на сходстве с аннотированными последовательностями. Такие аннотации полностью автоматические, кураторами просмотрены не были. Немного среди компьютерных аннотаций (0,78%) ISS, т.е. те же самые IEA, но только были просмотрены куратором.
Только 0,63% среди всех аннотаций чисто экспериментальных.
Таким образом, из 4090 всаго 26 "чисто экспериментальных", а более 97% компьютерно аннотированые - без проверки человеком. Все это говорит о том, что аннотация интегральных мембранных белков из организма Danio rerio в базе данных GO в основном компьютерная. Это еще и приводит к мысли, о важности компьютерных методов исследования и в частности биоинформатики.