Занятие 5. Онтологии



Задание 1. Описание функции белка ENDOA_BACSU в соответствии с GO-аннотацией

  Онтология GO (название словаря) Количество разных ассоциированных терминов GO Функция белка
(краткое описание, близкое к тексту определения термина(ов) GO
Где? Cellular Component 0  
Зачем, для чего? Biological Process 1

Гидролиз фосфодиэфирной связи нуклеиновых кислот - метаболический процесс нуклеиновых кислот, в котором путем гидролиза расщепляются фосфодиэфирные связи между нуклетидами

Молекулярный механизм? Molecular Function 5

ДНК-связывание -любая молекулярная функция, с помощью которой продукт гена избирательно связывается с ДНК

РНК-связывание - избирательное, нековалентное взаимодействие с РНК или ее частью

Нуклеазная активность - катализирование гидродиза эфирной связи в нуклеиновых кислотах

Эндонуклеазная активность - катализирование гидролиза эфирной связи в нуклеиновых кислотах: создание внутренних разрывов

Гидролазная активность - катализирование гидролиза связей различного типа: C-O, C-N, C-C, связей фосфорного ангидрида и т.д. Гидролазы - систематичекое название для любого фермента класса ЕС

Специфичность?   0  

Задание 2. Описание 3 терминов GO, ассоциированных с ENDOA_BACSU

GO ID выбранного термина Список синонимов Список ближайших родительских терминов GO с указанием типа связи Список ближайших дочерних терминов GO с указанием типа связи Изображение графов родительских терминов
GO:0090305 Exact: расщепление нуклеиновых кислот is_a (inferred) biological_process (GO:0008150)

cellular process (GO:0009987)

cellular metabolic process (GO:0044237)

metabolic process (GO:0008152)

nitrogen compound metabolic process (GO:0006807)

cellular nitrogen compound metabolic process (GO:0034641)

primary metabolic process (GO:0044238)

nucleobase-containing compound metabolic process (GO:0006139)

nucleic acid metabolic process (GO:0090304)

Для всех тип связи - is_a
cleavage involved in rRNA processing (GO:0000469)

DNA fragmentation involved in apoptotic nuclear change (GO:0006309)

gene conversion at mating-type locus, DNA double-strand break formation (GO:0000728)

meiotic DNA double-strand break formation (GO:0042138)

mRNA cleavage (GO:0006379)

nucleotide-excision repair, DNA incision (GO:0033683)

snoRNA 3'-end cleavage (GO:0043145)

tRNA 3'-trailer cleavage (GO:0042779)

Для всех тип связи - is_a
Изображение
GO:0004519 нет molecular_function (GO:0003674)

catalytic activity (GO:0003824)

hydrolase activity (GO:0016787)

hydrolase activity, acting on ester bonds (GO:0016788)

nuclease activity (GO:0004518)

Для всех тип связи - is_a
endodeoxyribonuclease activity (GO:0004520)

endonuclease activity, active with either ribo- or deoxyribonucleic acids and producing 3'-phosphomonoesters (GO:0016894)

endonuclease activity, active with either ribo- or deoxyribonucleic acids and producing 5'-phosphomonoesters (GO:0016893)

endoribonuclease activity (GO:0004521)

T/G mismatch-specific endonuclease activity (GO:0043765)

Для всех тип связи - is_a
Изображение
GO:0003677 related: microtubule/chromatin interaction
narrow: plasmid binding
molecular_function (GO:0003674)

binding (GO:0005488)

nucleic acid binding (GO:0003676)

Для всех тип связи - is_a
base pairing with DNA (GO:0000497)

damaged DNA binding (GO:0003684)

DNA binding, bending (GO:0008301)

DNA clamp loader activity (GO:0003689)

DNA topoisomerase activity (GO:0003916)

DNA translocase activity (GO:0015616)

recombination hotspot binding (GO:0010844)

regulatory region DNA binding (GO:0000975)

sequence-specific DNA binding (GO:0043565)

structure-specific DNA binding (GO:0043566)

Для всех тип связи - is_a
Изображение

Задание 3. Описание протеома бактерии Thermobifida fusca YX , используя термины GO.

Полное число белков в протеоме - 3085 , из них 2052 приписан хоть один термин GO (66,5%)

Частота встречаемости терминов из различных словарей:


P - Biological Process - 1405
C - Cellular Component - 846
F - Molecular Function - 3446

Самые часто встречающиеся термины:
Словарь Кол-во Термин
F 329 ATP binding
С 206 cytoplasm
C 199 integral to membrane
F 194 DNA binding
C 113 plasma membrane
F 112 metal ion binding
P 96 transcription, DNA-dependent
P 66 regulation of transcription, DNA-dependent
P 61 translation

Стоит отметить, что полученные статистические данные относительно частоты встречаемости достаточно предсказуемы. Ведь и на самом деле, в каждом компоненте клетки происходит некоторое кол-во процессов, каждый из которых состоит из множества разных ступеней, на которых выполняются различные молекулярные функции. Поэтому ряд частоты встречаемости терминов из словарей C < P < F соответствует действительности. Что касается самых распространенных терминов, то исходя из того, что для всех процессов нужна энергия, значит нужно много белков, участвующих в связывании АТФ в различных процессах. Учитывая, что вся жизнедеятельность клетки целиком и полностью сопряжена с ДНК, транскрипцией и трансляцией - то и тут никаких "претензий" нет. "Популярность" функции связывание с ионом металла можно объяснить тем, что именно металлы часто оказываются активным центром разных ферментов.

Для ответов на поставленные вопросы использовалась таблица

Задание 4.Получение выборки последовательностей белков с заданной функцией

Был задан таксон - картофель
Ранг : вид
Русское название: картофель
Английское название: potato
Латинское название: Solanum tuberosum
Идентификатор в БД Taxonomy NCB (NCBI_TaxID): 4113

Была задана функция - трансляция
Английское название: translation
Идентификатор GO: GO:0006412
Словарь: biological process (Р)

Поиск всех белков из заданного таксона с таким идентификатором GO Запрос: (([uniprot-NCBI_TaxId:4113*] & ([uniprot-DbName:GO*] > parent )) & ([uniprot-DBxref:GO:0006412*] > parent ))
Кол-во находок: 127
Сохраненные fasta-последовательности найденных белков картофеля, имеющих идентификатор GO:0006412 (трянсляция)


© SHADRINA О. А. 2012