Gene Ontology. Занятие 7.
1. (разбиение относительно и субъективно, так как нумерация в самом задании варьируется от 6 до 7 пунктов)
По распределению мне достался белок с Uniprot AC: A3NKX4.
Это тансмембранный белок аппарата секреции типа 3.
Данный белок принадлежит к системе секреции белков из клетки.
ID: GO:0009306 (alt_id: GO:0045166 & GO:0045731).
Система отвечает за контролируемый транспорт белков из клетки.
Наглядно это семейство характеризует Рисунок 1.
Рисунок 1.
2.
По базе GO ген ассоциирован со следующими ID:
DR GO; GO:0016021; C:integral to membrane; IEA:UniProtKB-KW.
DR GO; GO:0009306; P:protein secretion; IEA:InterPro.
То есть, как я успел упомянуть, данный ген кодирует белок "белковой секреции" (поле P - биологический процесс);
этот белок является "связанным с мембраной" (поле С - компонент клетки). Поле F - функция - отсутствует.
Под "трансмембранным" в GO подразумевается, что белок ассоциирован с фосфолипидным бислоем или лежит в мембране
полностью (мы-то знаем, что это трансмембранный белок, так что все верно).
3.
С помощью БД SEED (http://theseed.uchicago.edu/FIG/)
и fasta-последовательности с Uniprot из 'Burkholderia pseudomallei (strain 668)'
получим выравнивание с E-value: e-104 (Рисунок 2).
Рисунок 2.
Как можно заметить, несовпадение есть лишь на одном участке, против которого стоит строка из X-ов,
то есть, фактически, выравнивание даже лучше заявленного.
Для себя вынесем, что выбранное лушее выравнивание идет с "Burkholderia pseudomallei (strain 668)".
4.
Получим выравнивания окрестностей гена с его гомологами:
Рисунок 3.
Из интереса я сразу выставил поиск 7 гомологов...
5.
Расширим окрестность до 30 000, и, играя с параметрами, отберем 12 гомологов:
Рисунок 4.
Рассмотрим гены подробнее:
Во всех выбранных организмах (из разных родов) есть гены 2, 3, 5 (за исключением D/ vulgaris);
4 (за исключением А. avenae);
В семи организмах из 12 есть гены 6 и 7;
более 10 генов представлены в 4-5 организмах, которые при этом удалены от B. pseudomallei на сравнимое расстояние:
Эти гены уже стоит исключить из рассмотрения. Среди генов, распространенных на среднем и низком уровне встречаются
уже не только гены транспортной системы III (или белков постройки флагеллы, также включенных в семейство),
а, например, большое количество транспозаз.
Если снизить порог до e-15, то гены, обозначенные как 8 и 13 оказываются одинаковыми. В остальном картина не меняется.
6.
Итак, выберем гены, предположительно ко-локолизованные с данным:
Прежде всего это основные гены 2-5 и не консервативный ген (8+13), которые стречаются в 11 из 12 окрестностей.
Кроме основных генов системы III распространены и другие гены (9, 11, 12, 17, 18, 19, 21, 23, 24...).
Причина того, что гены системы III имеют так много ко-локализованных генов средней распространенности
кроется в самой системе:
во-первых, это очень большая и сложная система, которая содержит большое количество генов, которые не могут оставаться
неизменными.
Во-вторых, рассмотрим пример: к системе III также относится аппарат синтеза флагеллы, но ею обладают далеко
не все бактерии, как следствие, и наличие генов системы III сильно варьируется по группам организмов (что и видно на выравнивании).
На страницу 4 семестра
© Aleshin Vasily