Следите за обновлениями и дополнениями
Если Вы заметили опечатки, или ссылка испортилась, пожалуйста, напишите мне
В данной работе будет использоваться база данных доменов
Conserved Domains [1]. Для выполнения практикума был использован мой белок из первого семейств -
сиалидазаа. Ниже представлена последовательность
сиалидазы в фаста формате, использованная для поиска в базе данных.
>AJG99379.1 sialidase MIRRNKRILSLTLSMAVFTTMFMSTSFITKAETVSLGANSEITSNASTESTAVATNIA LNKPSTASSVTGGNTASLAVDGNAGTRWESAQGSDPQWISIDLGGSYNISGVKLNWET AAAKDYKIQVSTDNKNWIDAYTKTGGTGGVENIAFNSTATGRYIRMLGTTRTTQYGYS LWEFEVYGIPDGNTVNNVDLGPNVKIFDPSMPSSDIQNTVDSVFSKMETNQFGNERYA FLFKPGSYNVNVNVGFFTSVLGLGKTPDAVNITGAVRCEADWMGGNATCNFWRSVENV AVTPTYSSNNLAPAGTLTWAVSQAAPMRRVHIKGGLSLWDPLGTNYDGAWSSGGFIAD SKIDNSITSGSQQQFFTRNSQMGSWNGANWNMVFVGNNGAPTDDNAYPSTPDTVVSQT PAIREKPFLYIDDSGNYQVFIPDLRKNSQGITWTNGLGQGTSLSIDQFYIAKPDTSTA ESINAALSQGKNIIFTPGVYHLSDAINVTKSNTVILGLGLATLIPDNGTAAMNISDVD GVKVSGVLFDAGAKNSPVLLKVGQDGSSADHSANPTSLSDLFFRIGGAAVGNADTSLK INSNNVIGDDFWVWRADHGTGVGWTVNNAKNGVIVNGNNVTLYGLFVEHFKEYQTIWN GNGGKVYFYQSELPYDVPNQASWMSNNGTQNGYASYKVADSVTSHQLFGSGIYSYFRD SVVSENNGIEVPNASGVKVHHACSVYLSGNGEITHVVNNTGNTAKSGDMKQSVTDYPN S
Был найден домен FA58C (Coagulation factor 5/8 C-terminal domain), имеющий идентификатор cd00057. Данный домен
был найден в интервале 64-182 остатков белка и имел p-value
7.38e-15, что говорит о высокой достоверности находки. Вего в белке 755 остатков аминокислот.
По структурным особенностям данный домен относят к 1EUU; galactose binding domain (potentially binds different sugars in other proteins)
Так как в белке не нашлось КОГов был выбран другой белок выбывшего однокурсника - пируват ацетил коА синтаза
(putative acyl-CoA synthetase) с идентификатором BAC69532.1.
>BAC69532.1 putative acyl-CoA synthetase (NDP forming type) [Streptomyces avermitilis MA-4680 = NBRC 14893] MMAEDRALRVRTLLDTVRAEGRTALTAPEGKVIADAYGIAVPGEELATDVDEAVAYAARFGGPVVMKIVS PDILHKTDAGGVIVGVEGAADVRAAFCRIVENARAYNERARIEGVQVQELLPRGQEVIVGAVTDPTFGKV VAFGLGGVLVEVFKDVTFRLAPVDADEALSMLDSIRSTEILRGVRGAAAVDRWAIAEQIRRVSRLVTDFP EIAEVDLNPVVATPEGAVAADIRVILAESQPKPRRTYTREEILTSMRRLMQPSSVAVIGASNEHGKIGNS VMRNLIDGGFSGEIHPVNPKADDIVGRKAYKSVTDIPGEVDVALFAIPATFVAAALEEVGRKGIPNAVLI PSGFAETGEHELQDEVVAIAERHGVRLLGPNIYGYYSTWHDLCATFCTPYDVKGGVALTSQSGGIGMAIL GFARTTKTGVSAIVGLGNKSDLDEDDLLTWFGEDPHTECIAMHLEDLKDGRAFVAAARATVPRKPVVVLK AGRTAAGAKAAGSHTGALAGDDAVYDDILKQAGVIRAPGLNDMLEYARALPVLPTPQGDNVVIITGAGGS GVLLSDAVTDNGLSLMEIPPDLDASFRTFIPPFGAAGNPVDITGGEPPSTYEATIRLGLEDPRVHALVLG YWHTIVTPPMVFAELTARVVAEFRERGIEKPVVASLAGDVEVEEACQYLYERGVVAYPYTTEKPVAVLGA KYRWARAAGLLGGGS
![]() |
| Рисунок 1. Доменная архитектура ацетил коА синтазы |
Был найден домен КОГ, имеющий идентификатор COG1042. Данный КОГ имеет статус ACCS, with user query added.
Он расположен в интервале 52-528 остатков белка и имеет p-value
1.41e-20, что говорит о высокой достоверности находки.
Вего в белке 715 остатков аминокислот.
Данный КОГ относят к Acyl-CoA synthetase (NDP forming)
Функциональная категория КОГа - Генерация и накопление энергии (Energy production and conversion).
Его можно встрертить во множестве организмов
Было найдено геномное окружение КОГа в сервисе cognat. На рисунке 2 приведён пример выдачи сервиса. В правой верхней трети
расным показан исследуемый белок, а серым - его геномное окружение для каждого аннотированного организма.
Серым показаны белки окружения.
Использовались параметры:
Neighborhood Size - 9
Occurrence Threshold (%) - 20
Taxonomy - Нет
![]() |
| Рисунок 2. Геномное окружение ацетил коА синтазы |
| Name | COG | E-Value |
| Alpha/beta hydrolase fold protein | COG0596 | 3.5e-36 |
| Transcriptional regulator | COG1414 | 6e-46 |
| Protein with phosphotransacetylase BioD-like N-terminal domain | COG0857 | 1.6e-121 |
С помощью инструмента AmiGO поиком BLAST в базе данных GO был обнаружен белок, наиболее похожий на ацетил коА синтазу. Им оказалась суксицил коА лигаза (Succinyl CoA ligase, putative), имеющая идентификатор PF14_0357 и P value, равный 2.0e-47. Найденный белок был обнаружен у Plasmodium falciparum 3D7, относящегося к другому домену - Эукариотам, тогда как мой новый организм (Streptomyces avermitilis MA-4680 = NBRC 14893) относится к Бактериям. Лучшей находкой являлась ацетил коА синтаза Carboxydothermus hydrogenoformans Z-2901 с идентификатором CHY_0264 и P value 3.5e-59.
Score = 607 (218.7 bits), Expect = 3.5e-59, P = 3.5e-59
Identities = 150/459 (32%), Positives = 226/459 (49%)
Query: 250 EEILTSMRRLMQPSSVAVIGASNEHGKIGNSVMRNLIDGGFSGEIHPVNPKADDIVGRKA 309
E+ + +L+ P S+AVIGAS + K+GN+++RN++ G + GE+ VNP+ I +
Sbjct: 10 EKFKERVAKLLNPRSIAVIGASEKPEKLGNAILRNIVSG-YKGEVFGVNPRVKKIQEIEV 68
Query: 310 YKSVTDIPGEVDVALFAIPATFVAAALEEVGRKGIPNAVLIPSGFAETGEHE--LQDEVV 367
Y V +P VD+A+ +PA AL+E G+ +AV+I GF ETG L++E+
Sbjct: 69 YPDVFSLPYPVDLAVIVLPAEKAVVALKEAAEAGVKSAVVISGGFKETGNEGALLEEEIK 128
Query: 368 AIAERHGVRLLGPNIYGYYSTWHDLCATFCTPYDVKGGVALTSQSGGIGMAILGFARTTK 427
IA + +LGPN G + L ATF +KG +A SQSG I +L ++
Sbjct: 129 KIALDFEMPVLGPNCVGIVNNNLQLNATFLRTAPLKGEIAFVSQSGAILSTVLEWSLKED 188
Query: 428 TGVSAIVGLGNKSDLDEDDLLTWFGEDPHTECIAMHLEDLKDGRAFVAAARATVPRKPVV 487
G S ++ +GNK+ L+E D L DP T I +++ED+ +G +F+ A KPVV
Sbjct: 189 LGFSYMISMGNKAVLNEADFLPAIANDPGTAVILLYIEDVVEGSSFLKKAYEASLLKPVV 248
Query: 488 VLXXXXXXXXXXXXXXXXXXLAGDDAVYDDILKQAGVIRAPGLNDMLEYARALPVLPTPQ 547
V LAG Y + G+IRA L +M YAR
Sbjct: 249 VFKAGISTAGAKAASSHTGALAGSIEGYKLAFAKTGLIRAKTLEEMFIYARVFASGQKVT 308
Query: 548 GDNVVIITGAGGSGVLLSDAVTDNGLSLMEIPPDLDASFRTFIPPFGAAGNPVDITGGEP 607
G N+ I+T +GG GV+ +D + NGL++ + +TF+P + GNPVDI G
Sbjct: 309 GKNIGIVTNSGGPGVITADRLELNGLNITGLSAKTINELKTFLPRAASFGNPVDILGDAD 368
Query: 608 PSTYEATIRLGLEDPRVHALVLGYWHTIVTPPMVFAELTARVVAEFRERGIEKPVVASLA 667
Y T++ L+D +V +V Y T V + E + V R + +KPVVA
Sbjct: 369 EEKYAMTLKTVLDDEKVDGVVAVYGKTAV----IDMEKMVQAVINGRRKNPDKPVVACFL 424
Query: 668 GDVEVEEACQYLYERGVVAY--PYTTEKPVAVLGAKYRW 704
G V+ A + L + + Y P +AVL Y W
Sbjct: 425 GGVDSRRAKELLNKNKIPFYSFPEAAADALAVLYRYYSW 463
Было получено два термина GO, отнесённых к моему белку. Они описаны в таблице 2. В таблице 3 пояснены использовавшиеся коды достоверности.
| Аспект | Идентификатор GO | Название термина | Перевод названия термина | Код типа достоверности |
| Биологический процесс (biological process) | GO:0006085 | acetyl-CoA biosynthetic process | Процесс биосинтеза ацетил коА синтазы | ISA |
| Молукцлярная функция (molecular function) | GO:0003985 | acetyl-CoA C-acetyltransferase activit | ацетил коА С-ацетилтрансферазная активность | ISA |
| Код типа достоверности | Расшифровка кода типа достоверности | Объяснение |
| ISA | Inferred from Sequence Alignment (ISA) | Данный код является частью ISS (Inferred from Sequence or structural Similarity) и используется лишь тогда, когда проверяющий данные специалист уверен в том, что информация о белке была опубликована в статье или иной форме найчной публикации, то есть, данные были проверены. Заключение о статусе делается из парного или множественного выравнивания. |
В данном практикуме были освоены программы AmiGO, cognat и базы данных Conserved Domains, GO. Был произведён поиск консервативного геномного окружения, не увенчавегося особенным успехом. Наиболее частотные находки можно увидеть в теблице 1. Был произведён анализ терминов Go, связанных с лучшей находкой BLAST в AmiGO. Найденные термины и расшифровка кодов помещены в таблицы 2 и 3, соответственно. В целом, с использовавшимся КОГом связано немного других белков.