Задание 1. Получение информации о COGe
Идентификатор белка: BBA82045.1
transketolase [Lactobacillus plantarum]
COG: COG0021 Transketolase
Функциональная категория: G (Карбогидратный транспорт и метаболизм)//
(Carbohydrate transport and metabolism)
E-value: 0e+00
Интервал, количество остатков в белке: 1 - 664 (665 aa)
Задание 2. Визуализация геномного окружения
Геномное окружение COG0021 было получено с помощью сервиса
COGNAT
со следующими параметрами:
Pfam Identifier: COG0021
Neighborhood Size: 9 (было оставлено значение по умолчанию, чтобы мы могли посмотреть
только близких по расстоянию соседей)
Occurrence Threshold (%): 5 (значение было снижено со "стартового", приятого за 20, тк
начальная картина показывала слишком мало генов из окружения и было бы сложно сделать какие-то выводы;
те мы отображаем гены окружения, с частотой встречаемости более 5%
Taxonomy: Да
Полученное изображение вы можете увидеть, перейдя по
ссылке
(Оно очень тяжелое и поэтому долго загружается)
Для определенных групп организмов характерно достаточно консервативное окружение
Окружение Polyprenyltransferase (COG0109) - [Наш ген] - Transaldolase (COG0176) -
Glycose-6-phosphate-dehydrogenase (COG0364) - Glycose-6-phosphate dehydrogenase assembly protein OpcA (COG3429) -
6-phosphoglyconolactonase (COG0363)
Если посмотреть, характерно для большинства
Actonobacteria (в верхней части рисунка; соответствие цветов стрелочек
COG-ам - в нижней части рисунка)
Интересно, что у
Chlorobi ген глокозо-6-фосфат дегидрогеназы (желтая стрелочка) изменил свое направление
У
Anaerolinea thermophila UNI-1,
Sulfobacillus acidophilus TPY,
Ignavibacterium album JCM 16511 и др.
можно наблюдать интересное явление сшивки между генами Трансальдолазы (синяя стрелочка) и глюкозо-6-фосфат изомеразы
(темно-бирюзовая стрелочка)
Большинство
Chloroflexi в окружении нашего COGa имеют ген ДНК-связывающего транскрипционного фактора (бордовая стрелка)
У Cyanobacteria и некоторых других групп при указанных нами параметрах нет информации об окружении (видимо, оно не является
достаточно консервативным)
Начиная с
Proteobacteria окружение COG0021 значительно меняется:
происходит перемещение гена трансальдолазы (синий) и ДНК-связывающего транскрипционного фактора (бордовый)
"вместо" исходного консервативного кластера, который мы описали ранее
В близком окружении появляются:
Glyceraldeghyde-3-phosphate-dehydrogenase - 2-phosphoglycerate kinase -
Fructose/tagatose bisphosphare aldolase
Задание 3. Отнесение Транскетолазы из Lactobacillus plantarum к терминам GO
Для отнесения исследуемого нами белка к терминам GO был использован сервис AMIGO. С помощью BLAST был произведен поиск гомологов;
порог для E-value был выбран следующий: 0.01
Лучшая находка была обнаружена с E-value = 1.9e-202
Транскетолаза из Bacillus anthracis str. Ames
Функционально белок тот же самый
Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot Q81Y15 (Q81Y15_BACAN)
Аспект |
Идентификатор GO |
Название термина |
Перевод названия термина |
Код типа достоверности |
Биологический процесс (biological process) |
GO:0006098 |
Pentose-phosphate shunt |
Шунт ПФП |
ISS |
Молекулярная функция (molecular function) |
GO:0004802 |
Transketolase activity |
Транскетолазная активность |
ISS |
Таблица 2. Описание кодов достоверности, использованных в Таблице 1
Код типа достоверности |
Расшифровка кода типа достоверности |
Объяснение |
ISS |
Inferred from Sequence or structural Similarity |
Используется всякий раз, когда основой для аннотации служит
анализ последователльности вручную; требует от кураторов создания
стабильного идентификатора. Если знаение With/From является геном
или его продуктом, для него должны быть экспериментальные (или IC)
доказательства
То-есть, вероятно, функциональность была подтверждена экспериментальными
данными и расмотрением последовательности вручную |