Функциональная роль гена в подсистеме. GO, SEED, [String]


Дан белок gspK (AC Q31WN1)

Определить, к какой системе принадлежит белок

Согласно данным Uniprot этот белок - Type II secretion system protein K, находится в бактерии Shigella boydii (граммотрицательная бактерия) и является трансмембранным (внутренняя мембрана). Учавствует во втором типе секреции (Type II), схему секреции бактерий можно увидеть тут.

Схема секреции, к которой принадлежит данный белок, представлена на рисунке 1.

Рис. 1. Схема секреции белка gspK.

Расшифровать термины GO, ассоциированные c белком и с этой системой

Термины GO и их расшифровка приведены в табл. 1.

GO Онтология Название Описание
GO:0006810 P transport (транспорт) Направленое высвобождение веществ из клетки
GO:0009306 P protein secretion (белковая секреция) Направленое высвобождение белков из клетки
GO:0005886 С plasma membrane ПМ
GO:0005886 С plasma membrane ПМ
GO:0005886 С plasma membrane ПМ
GO:0016020 С membrane мембрана
GO:0016021 С integral component of membrane внутренний компонент мембраны
Табл. 1. Обозначения: P — биологический процесс, C — клеточный компонент, ПМ - плазматическая мембрана

Определить функциональную роль данного белка в системе

Функционально мой белок входит в мультисубьединичный комплекс секреторной системы второго типа (13 видов белков). GspK соединяет внутреннюю и внешние мембраны, вместе с белками GspG, GspH, GspI и GspJ образует единый комплекс GspGHIJK. И как уже говорилось ранее, GspK отвечает за транспорт белков, к сожалению, более точной информации по данному белку нет, как и по его аннотированным гомологам. Зато есть изображение 2, на котором можно сравнить различные белки семейства Gsp из статьи.

Рис. 2. Сравнение структур белков семейства gsp.

Найти ортологи. Построить их выравнивание.

Для того чтобы найти ортологов на сайте SEED искала по геномному локусу моего белка. Перешла на найденный ген, убрала все галочки, "update with selected" для устранения похожих геномов, поставила E-value cut off 1e-20 и установила сначала необходимое число гомологов равное 100, потом увеличивала размер окрестности, меняла порог e-value. И в итоге получила скриншот отбора ортологов (рис. 3) и выравнивание (рис. 4), было получено при выборе вкладки sequences->protein и нажатии align sequence (при нажатии генерируется выравнивание).

Рис. 3. Отобранные гомологи с схематичным изображением их структуры. Второй гомолог (третья строчка) является другим видом рода Shigella. Ген GspK ограшен красным.
Рис. 4. Сгенерированное выравнивание. Окрашено по Clustal с порогом консервативности 30.

Сравнить состав генов в окрестностях +/- 15000 п.н. генов отобранных ортологов. Описать те гены, гомологи которых встречаются в нескольких окрестностях из удаленных бактерий. Отметить отнесённые к данной системе, по данным базы SEED

По ссылке Tabular Region information получим таблицу всех генов окрестности 30000 п.н.. И составим сводную таблицу. Посмотреть на это файл можно тут. На листе "сводная" приведены 2 сводные таблицы. Для первой в качестве строк выбраны геномы, для столбцов - Set (группы генов ортологов, помеченные одним цветом и имеющие один номер), подсчет производился по количеству ID. Для второй строки - функции генов, столбцы - геномы, подсчет по ID и встроен фильтр по SS (номер подсистемы, к которой отнесен ген) и Set. Желтым выделены гены Shigella boydii.


Выводы

Как видно из рис. 3 и таблицы Exel:

  1. ген GspK ориентирован всегда в одном направлении;
  2. у большинства ортологов большинство генов (от представленных у Shigella boydii) секреторных белков есть и расположены рядом;
  3. секреторые гены одинаково ориентированы;
  4. GspK относится к Set 1';
  5. GspD, GspE, GspF, GspL, GspG, GspH GspI, GspJ, GspM (все кроме GspN) всегда есть вместе с GspK (они тоже относятся к секреторной системе второго типа, и судя по рис. 5С это логично, т.к. они тесно связаны);
  6. функция GspN в секреторном пути пока точно не известна, хотя он определенно важен, т.к. не встречается только у рода Shigella (среди найденных ортологов);
  7. ко-локализованные с геном GspK, , но не отнесенные к подсистеме 1, гены связаны с фунцией подсистемы, т.к. являются генами секреторноего пути;
  8. ортологичность генов не распростараняется на удаленные области окрестности (т.к. на удалении уже нет генов из секреторной системы и связанных с ней);
  9. ко-локализация генов секреции в значительной близости друг с другом обеспецивает быстроту экспрессии генов при недостатке секреторных белков для бактерий, что очень важно с биологической точки зрения.
Рис. 6. Секреторная система второго типа из статьи.

Источники информации:


© Tishina Sofia, 2014