Gene Ontology. Занятие 7.


1. (разбиение относительно и субъективно, так как нумерация в самом задании варьируется от 6 до 7 пунктов)

По распределению мне достался белок с Uniprot AC: A3NKX4. Это тансмембранный белок аппарата секреции типа 3.
Данный белок принадлежит к системе секреции белков из клетки.

ID: GO:0009306 (alt_id: GO:0045166 & GO:0045731).


Система отвечает за контролируемый транспорт белков из клетки.
Наглядно это семейство характеризует Рисунок 1.
see Category:GO:0009306 on the web Рисунок 1.


2.

По базе GO ген ассоциирован со следующими ID:
DR   GO; GO:0016021; C:integral to membrane; IEA:UniProtKB-KW.
DR   GO; GO:0009306; P:protein secretion; IEA:InterPro. 
То есть, как я успел упомянуть, данный ген кодирует белок "белковой секреции" (поле P - биологический процесс); этот белок является "связанным с мембраной" (поле С - компонент клетки). Поле F - функция - отсутствует.
Под "трансмембранным" в GO подразумевается, что белок ассоциирован с фосфолипидным бислоем или лежит в мембране полностью (мы-то знаем, что это трансмембранный белок, так что все верно).


3.

С помощью БД SEED (http://theseed.uchicago.edu/FIG/) и fasta-последовательности с Uniprot из 'Burkholderia pseudomallei (strain 668)' получим выравнивание с E-value: e-104 (Рисунок 2).

Sorry... Рисунок 2.

Как можно заметить, несовпадение есть лишь на одном участке, против которого стоит строка из X-ов, то есть, фактически, выравнивание даже лучше заявленного.
Для себя вынесем, что выбранное лушее выравнивание идет с "Burkholderia pseudomallei (strain 668)".


4.

Получим выравнивания окрестностей гена с его гомологами:
does not matter Рисунок 3.
Из интереса я сразу выставил поиск 7 гомологов...

5.

Расширим окрестность до 30 000, и, играя с параметрами, отберем 12 гомологов:


Рисунок 4.

Рассмотрим гены подробнее:

Во всех выбранных организмах (из разных родов) есть гены 2, 3, 5 (за исключением D/ vulgaris);
4 (за исключением А. avenae);
В семи организмах из 12 есть гены 6 и 7;
более 10 генов представлены в 4-5 организмах, которые при этом удалены от B. pseudomallei на сравнимое расстояние:
Эти гены уже стоит исключить из рассмотрения. Среди генов, распространенных на среднем и низком уровне встречаются уже не только гены транспортной системы III (или белков постройки флагеллы, также включенных в семейство), а, например, большое количество транспозаз.
Если снизить порог до e-15, то гены, обозначенные как 8 и 13 оказываются одинаковыми. В остальном картина не меняется.


6.

Итак, выберем гены, предположительно ко-локолизованные с данным:

Прежде всего это основные гены 2-5 и не консервативный ген (8+13), которые стречаются в 11 из 12 окрестностей.
Кроме основных генов системы III распространены и другие гены (9, 11, 12, 17, 18, 19, 21, 23, 24...).

Причина того, что гены системы III имеют так много ко-локализованных генов средней распространенности кроется в самой системе:
во-первых, это очень большая и сложная система, которая содержит большое количество генов, которые не могут оставаться неизменными.
Во-вторых, рассмотрим пример: к системе III также относится аппарат синтеза флагеллы, но ею обладают далеко не все бактерии, как следствие, и наличие генов системы III сильно варьируется по группам организмов (что и видно на выравнивании).









На страницу 4 семестра


© Aleshin Vasily