|
Задание 1. Описание функции белка ENDOA_BACSU в соответствии с GO-аннотацией
|
Онтология GO (название словаря) |
Количество разных ассоциированных терминов GO |
Функция белка
(краткое описание, близкое к тексту определения термина(ов) GO |
Где? |
Cellular Component |
0 |
|
Зачем, для чего? |
Biological Process |
1 |
Гидролиз фосфодиэфирной связи нуклеиновых кислот - метаболический процесс нуклеиновых кислот, в котором путем гидролиза расщепляются фосфодиэфирные связи между нуклетидами |
Молекулярный механизм? |
Molecular Function |
5 |
ДНК-связывание -любая молекулярная функция, с помощью которой продукт гена избирательно связывается с ДНК
РНК-связывание - избирательное, нековалентное взаимодействие с РНК или ее частью
Нуклеазная активность - катализирование гидродиза эфирной связи в нуклеиновых кислотах
Эндонуклеазная активность - катализирование гидролиза эфирной связи в нуклеиновых кислотах: создание внутренних разрывов
Гидролазная активность - катализирование гидролиза связей различного типа: C-O, C-N, C-C, связей фосфорного ангидрида и т.д. Гидролазы - систематичекое название для любого фермента класса ЕС
|
Специфичность? |
|
0 |
|
Задание 2. Описание 3 терминов GO, ассоциированных с ENDOA_BACSU
GO ID выбранного термина |
Список синонимов |
Список ближайших родительских терминов GO с указанием типа связи |
Список ближайших дочерних терминов GO с указанием типа связи |
Изображение графов родительских терминов |
GO:0090305 |
Exact: расщепление нуклеиновых кислот |
is_a (inferred) biological_process (GO:0008150)
cellular process (GO:0009987)
cellular metabolic process (GO:0044237)
metabolic process (GO:0008152)
nitrogen compound metabolic process (GO:0006807)
cellular nitrogen compound metabolic process (GO:0034641)
primary metabolic process (GO:0044238)
nucleobase-containing compound metabolic process (GO:0006139)
nucleic acid metabolic process (GO:0090304)
Для всех тип связи - is_a
|
cleavage involved in rRNA processing (GO:0000469)
DNA fragmentation involved in apoptotic nuclear change (GO:0006309)
gene conversion at mating-type locus, DNA double-strand break formation (GO:0000728)
meiotic DNA double-strand break formation (GO:0042138)
mRNA cleavage (GO:0006379)
nucleotide-excision repair, DNA incision (GO:0033683)
snoRNA 3'-end cleavage (GO:0043145)
tRNA 3'-trailer cleavage (GO:0042779)
Для всех тип связи - is_a
|
Изображение |
GO:0004519 |
нет |
molecular_function (GO:0003674)
catalytic activity (GO:0003824)
hydrolase activity (GO:0016787)
hydrolase activity, acting on ester bonds (GO:0016788)
nuclease activity (GO:0004518)
Для всех тип связи - is_a
|
endodeoxyribonuclease activity (GO:0004520)
endonuclease activity, active with either ribo- or deoxyribonucleic acids and producing 3'-phosphomonoesters (GO:0016894)
endonuclease activity, active with either ribo- or deoxyribonucleic acids and producing 5'-phosphomonoesters (GO:0016893)
endoribonuclease activity (GO:0004521)
T/G mismatch-specific endonuclease activity (GO:0043765)
Для всех тип связи - is_a
|
Изображение |
GO:0003677 |
related: microtubule/chromatin interaction
narrow: plasmid binding
|
molecular_function (GO:0003674)
binding (GO:0005488)
nucleic acid binding (GO:0003676)
Для всех тип связи - is_a
|
base pairing with DNA (GO:0000497)
damaged DNA binding (GO:0003684)
DNA binding, bending (GO:0008301)
DNA clamp loader activity (GO:0003689)
DNA topoisomerase activity (GO:0003916)
DNA translocase activity (GO:0015616)
recombination hotspot binding (GO:0010844)
regulatory region DNA binding (GO:0000975)
sequence-specific DNA binding (GO:0043565)
structure-specific DNA binding (GO:0043566)
Для всех тип связи - is_a
|
Изображение |
Задание 3. Описание протеома бактерии Thermobifida fusca YX , используя термины GO.
Полное число белков в протеоме - 3085 , из них 2052 приписан хоть один термин GO (66,5%)
Частота встречаемости терминов из различных словарей:
P - Biological Process - 1405
C - Cellular Component - 846
F - Molecular Function - 3446
Самые часто встречающиеся термины:
Словарь |
Кол-во |
Термин |
F |
329 |
ATP binding |
С |
206 |
cytoplasm |
C |
199 |
integral to membrane |
F |
194 |
DNA binding |
C |
113 |
plasma membrane |
F |
112 |
metal ion binding |
P |
96 |
transcription, DNA-dependent |
P |
66 |
regulation of transcription, DNA-dependent |
P |
61 |
translation |
Стоит отметить, что полученные статистические данные относительно частоты встречаемости достаточно предсказуемы.
Ведь и на самом деле, в каждом компоненте клетки происходит некоторое кол-во процессов, каждый из которых состоит из множества разных ступеней, на которых выполняются различные молекулярные функции.
Поэтому ряд частоты встречаемости терминов из словарей C < P < F соответствует действительности.
Что касается самых распространенных терминов, то исходя из того, что для всех процессов нужна энергия, значит нужно много белков, участвующих в связывании АТФ в различных процессах.
Учитывая, что вся жизнедеятельность клетки целиком и полностью сопряжена с ДНК, транскрипцией и трансляцией - то и тут никаких "претензий" нет.
"Популярность" функции связывание с ионом металла можно объяснить тем, что именно металлы часто оказываются активным центром разных ферментов.
Для ответов на поставленные вопросы использовалась таблица
Задание 4.Получение выборки последовательностей белков с заданной функцией
Был задан таксон - картофель
Ранг : вид
Русское название: картофель
Английское название: potato
Латинское название: Solanum tuberosum
Идентификатор в БД Taxonomy NCB (NCBI_TaxID): 4113
Была задана функция - трансляция
Английское название: translation
Идентификатор GO: GO:0006412
Словарь: biological process (Р)
Поиск всех белков из заданного таксона с таким идентификатором GO
Запрос: (([uniprot-NCBI_TaxId:4113*] & ([uniprot-DbName:GO*] > parent )) & ([uniprot-DBxref:GO:0006412*] > parent ))
Кол-во находок: 127
Сохраненные fasta-последовательности найденных белков картофеля, имеющих идентификатор GO:0006412 (трянсляция)
|
|