AC: B2JN06
ID: B2JN06_BURP8
Запись Uniprot
Информация, которую можно извлечь из записи.
Название: белок серкторной системы II и III типа.
Предсказан исходя из полного генома Burkholderia phymatum (strain DSM 17167 / STM815)/
Полная систематика организма:
Bacteria; Proteobacteria; Betaproteobacteria; Burkholderiales;
Burkholderiaceae; Burkholderia.
NCBI_TaxID: 391038
Ссылка на STRING: 391038.Bphy_5321
Ссылка на KEGG:
bph:Bphy_5321
LocusName: Bphy_5321 (для поиска в KEGG).
Сслыка на GO: GO:0009306.
Белок участвует в биологическом процессе белковой секреции
(protein secretion).
Ссылка на Pfam: домен PF00263 или Secretin
Сущестовование белка: предсказан (4: Predicted)
Что дополнительно дает KEGG.
Ортология: K02280 - белок CpaC системы сборки пилей (другое имя rcpA).
Иерархия системы BRITE:
Система секреции, секреторная система II типа, экспортный аппарат плотной адгезии (Tad);
Белки бактериального движения, система пилей; белки системы сборки пилей.
Три мотива (а не один):
Secretin, T2SS-T3SS_pil_N, BON. Первые два подтверждаются значимыми при поиске
по последовательности Pfam, третий (BON) - незначимый.
Домен T2SS-T3SS_pil_N
представляет собой N-конец белка формирования пилей.
Домен Secretin
отвечает за основные функции данного белка.
Домен BON предположительно
выполняет функцию прикрепления к фосфолипидной мембране, найден в семейчстве белков
осмотического шока и в некоторых секретинах.
Расшифровка терминов GO.
Белок участвует в биологическом процессе белковой секреции, синоним -
секреция гликопротеинов.
Определение: контролируемое выведение белков из клетки.
Схема из GO:
Поиск по полным геномам с помощью tblastn дает лучшие совпадения в геномах
Burkholderia phymatum и Burkholderia phytofirmans
(но их почему-то нет в БД SEED). Выбираю находку в геноме Ralstonia solanacearum GMI1000 (перекрытие 69%,
идентичность 59%, E-value: 5e-165). Именно в этом геноме веду поиск по последовательности
blast на SEED.
Поиск с помощью SEED осуществлялся по ссылке: http://seed-viewer.theseed.org/seedviewer.cgi
Нажимаю на лучшую находку, выхожу на такое графическое окно с четырьмя гомологами
этой находки из разных геномов, длина окрестности 16000 нт:
Увеличиваю интервал просмотра до 30 тыс.нт, E-value cutoff уменьшаю до 1e-10,
количество геномов увеличиваю до 20.
Удаляю похожие последовательности, представителей одного рода. Также последоватлеьности с
одним-двумя ортологами не вызывают доверия, удаляю и их.
Полученное окно:
Анализ расположения генов 23 ортологов в составе 14 геномов -
не простая задача, тем более,
что в задании не требуется никаких четких выводов, а,
по-видимому, больше продемонстрировать умение работать с базой данных и
её интерфейсом.
Для упрощения работы информация обрабатывалась частично в Excel.
Файл с результатами.
На первом листе
- информация о регионе в формате таблицы, взятая из SEED. На втором - соответствие "Номер белка - Его описание". На третьем - таблица с разметкой последовательностей.
Каждому столбцу этой таблицы соответствует ген белка с номером, каждой строке - фрагмент генома. В ячейках стоят обозначения: "+" -
ген присутствует на + цепи, "-" - ген присутствует на - цепи, "о" - ген отсутствует.
В случаях, когда ячейка с "о" выделена ярко-красным - делеция явная; бледный цвет означает, что, скорее всего, последовательность его просто не попала
под порог окраски 1e-10. Обозначения в скобках обозначают особенности гена в фрагменте этого генома: "(x2)" - означает дупликацию, например. "(+1)" означает сдвиг
старт-кодона вправо по + цепи, "(-1)" - влево (для "-" цепи обозначения наоборот). Также отмечено, если ген "перепрыгнул" на другое место (за норму
принято то его расположение, которое наблюдается в большинстве случаев). В таблице цветом обозначены особенности геномов, цвет не соответствует гену в графическом окне!
Название подсистемы: Widespread colonization island.
В описании указано, что эта подсистема содержит
кластер Tad (плотной адгезии или сцепления). Этот кластер, например,
необходим для
заселения (колонизации) поверхностей патогеном человека Actinobacillus actinomycetemcomitans.
Большая часть генов Tad необходима для формирования плотных пленок и
синтеза фибрилл Flp пилей, которые опосредуют адгезию (прилипание).
Показано, что гены Tad кодируют белки секреторной системы для экспорта и формирования фибрилл.
Гомологичные Tad кластеры генов обнаружены у многих видов бактерий и архей,
в них возможен горизонтальный перенос.
Табличка того, какие гены относятся к подсистеме:
Из сопоставления таблиц видно, что не все белки из рассматриваемого мною фрагмента относятся
к подсистеме. Например, один из ближайших по локализации ген 7 не относится к подсистеме (кодирует
Von Willebrand factor или какой-то непонятный белок).
Также с генами 12, 13, 15, 16, 17, 18, 19, 21, 22, 23.
Кстати, из анализа таблиц и картинок, хочется высказать некоторые предположения.
Возможно, гены 8 и 14 - ортологи, так как имеют одинаковое относительно других генов
кластера расположение и выполняют схожие функции.
"Скачки" генов 3, 7, 13, 18, 21 и других являются примерами горизонального переноса.
Примечательно, что явные делеции случаются с теми белками, которые не относятся к подсистеме.