<>

Практикум 10


Выбраный домен

Я выбрала домен T-box. Этот домен связывается с ДНК и обеспечивает регуляцию развития той или иной ткани.


Мотивы T-box

Затем я скачала выравнивание seed. Исходно в выравнивание было 87 последовательностей. После удаление практически идентичных последовательностей (90% и выше) их осталось 84.
Из литературы [1] я узнала, что аминокислоты, которые непосредственно распознают нуклеотидную последовательность, находятся далеко друг от друга в последовательности домена, кроме того они не были одинаковыми во всех последовательностях, вероятно, распознаваемый мотив ДНК немного отличается от белка к белку. Каких-то известных мотивов я не нашла для данного домена, поэтому просто покрасила аминокилоты с высокой идентичностью (96% и выше) в выравнивание и выбрала мотив с наиболее высоким IC.

Выбраный мотив.

Паттерн мотива (синтаксис Jalview):F.[AVTS]V[TCS].Y

По этому паттерну затем был произведен поиск во всем выравнивание, всего находок получилось 84. Столько же, сколько и последовательностей, значит это мотив с хорошим IC.

Затем я произвела поиск данного мотива в базе данных Prosite. Паттерн в формате Prosite:F-x-[AVTS]-V-[TCS]-x-Y

Всего находок получилось 708, во всех них паттерн встретился один раз. Паттерн оказался не уникален для домена T-box, в выравнивание было много последовательностей, не содержащих домен. Затем последовательности были выровнены при помощи mafft. Мотив выравнялся с гэпами в большинстве последовательностей, что ожидаемо, поскольку выравнивание содержит множество последовательностей не содержащих T-box домена.

Мотив специфичный для клады

В Jalview было построено выравнивание алгоритмом NJ. Затем я взяла кладу, выделенную красным на картинке:

Дерево для домена T-box.

Я выделила следующий мотив: F[KPTQ]ET[RQ]FIAVTAYQN, который был во всех белках и не встречался больше ни в каком месте последовательности. Оказалось что данный мотив встречается только в этой кладе, следовательно данный мотив является для нее специфичным.
Выбраный мотив (выделен).
Мотив встретился только в выбраной кладе.

PSI-BLAST

Выбраный AC: Q7VDL2
Этотбелок ингибирует клеточное деление, блокируя образование Z-колец за счет предотвращения полимеризации FtsZ. Белок принадлежит бактерии Prochlorococcus marinus (strain SARG / CCMP1375 / SS120)
Итерации произвдились до стабилизации результатов. На 5 итерации новых результатов не появилось, разниа E-value между надпороговой и подпороговой находками также значительно увеличилось Семейство (MinC) выделилось хорошо, однако на 4 итерации добавился один белок из другого семейства.

Таблица 1. Итерации PSI-BLAST
№ итерации Число находок выше порога (0,005) Идентификатор худшей находки выше порога E-value этой находки Идентификатор лучшей находки ниже порога E-value этой находки
1 146 Q9AG20.1 0.005 A8GFG7.1 0.005
2 188 B6JKX0.1 7e-08 - -
3 188 Q9ZM51.1 2e-12 A7H8E6.1 0.014
4 189 A8MHK8.1 0.001 A7H8E6.1 0.013
5 189 A8MHK8.1 4e-10 A7H8E6.1 0.009

Литература

1. Wilson, V., Conlon, F.L. The T-box family. Genome Biol 3, reviews3008.1 (2002). https://doi.org/10.1186/gb-2002-3-6-reviews3008