Геномное окружение. База данных GO

Задание 1. Получение информации о COGe

Идентификатор белка: BBA82045.1
transketolase [Lactobacillus plantarum]
COG: COG0021 Transketolase
Функциональная категория: G (Карбогидратный транспорт и метаболизм)//
(Carbohydrate transport and metabolism)
E-value: 0e+00
Интервал, количество остатков в белке: 1 - 664 (665 aa)

Задание 2. Визуализация геномного окружения

Геномное окружение COG0021 было получено с помощью сервиса COGNAT
со следующими параметрами:
Pfam Identifier: COG0021 Neighborhood Size: 9 (было оставлено значение по умолчанию, чтобы мы могли посмотреть
только близких по расстоянию соседей)
Occurrence Threshold (%): 5 (значение было снижено со "стартового", приятого за 20, тк
начальная картина показывала слишком мало генов из окружения и было бы сложно сделать какие-то выводы;
те мы отображаем гены окружения, с частотой встречаемости более 5%
Taxonomy: Да

Полученное изображение вы можете увидеть, перейдя по ссылке
(Оно очень тяжелое и поэтому долго загружается)
Для определенных групп организмов характерно достаточно консервативное окружение

Окружение Polyprenyltransferase (COG0109) - [Наш ген] - Transaldolase (COG0176) -
Glycose-6-phosphate-dehydrogenase (COG0364) - Glycose-6-phosphate dehydrogenase assembly protein OpcA (COG3429) -
6-phosphoglyconolactonase (COG0363)

Если посмотреть, характерно для большинства Actonobacteria (в верхней части рисунка; соответствие цветов стрелочек
COG-ам - в нижней части рисунка)

Интересно, что у Chlorobi ген глокозо-6-фосфат дегидрогеназы (желтая стрелочка) изменил свое направление
У Anaerolinea thermophila UNI-1, Sulfobacillus acidophilus TPY, Ignavibacterium album JCM 16511 и др.
можно наблюдать интересное явление сшивки между генами Трансальдолазы (синяя стрелочка) и глюкозо-6-фосфат изомеразы
(темно-бирюзовая стрелочка)

Большинство Chloroflexi в окружении нашего COGa имеют ген ДНК-связывающего транскрипционного фактора (бордовая стрелка)
У Cyanobacteria и некоторых других групп при указанных нами параметрах нет информации об окружении (видимо, оно не является
достаточно консервативным)

Начиная с Proteobacteria окружение COG0021 значительно меняется:
происходит перемещение гена трансальдолазы (синий) и ДНК-связывающего транскрипционного фактора (бордовый)
"вместо" исходного консервативного кластера, который мы описали ранее
В близком окружении появляются: Glyceraldeghyde-3-phosphate-dehydrogenase - 2-phosphoglycerate kinase -
Fructose/tagatose bisphosphare aldolase


Задание 3. Отнесение Транскетолазы из Lactobacillus plantarum к терминам GO


Для отнесения исследуемого нами белка к терминам GO был использован сервис AMIGO. С помощью BLAST был произведен поиск гомологов;
порог для E-value был выбран следующий: 0.01

Лучшая находка была обнаружена с E-value = 1.9e-202
Транскетолаза из Bacillus anthracis str. Ames
Функционально белок тот же самый

Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot Q81Y15 (Q81Y15_BACAN)

Аспект Идентификатор GO Название термина Перевод названия термина Код типа достоверности
Биологический процесс (biological process) GO:0006098 Pentose-phosphate shunt Шунт ПФП ISS
Молекулярная функция (molecular function) GO:0004802 Transketolase activity Транскетолазная активность ISS

Таблица 2. Описание кодов достоверности, использованных в Таблице 1

Код типа достоверности Расшифровка кода типа достоверности Объяснение
ISS Inferred from Sequence or structural Similarity Используется всякий раз, когда основой для аннотации служит
анализ последователльности вручную; требует от кураторов создания
стабильного идентификатора. Если знаение With/From является геном
или его продуктом, для него должны быть экспериментальные (или IC)
доказательства
То-есть, вероятно, функциональность была подтверждена экспериментальными
данными и расмотрением последовательности вручную

© Беляева Юлия, 2019