Сигналы и мотивы, часть 3

|На главную|

|Обо мне|

|Семестры|

|Заметки|

|Ссылки|

Консервативный мотив в выравнивании последовательностей гомологичных белков

Для выполнения задания был взят домен LAP1_C (PF05609) с seed=22. Был выбран консервативный по всем последовательностям мотив E-[TIV]-E-E-K-V-R-D-[LF]-L в выравнивании 22 последовательностей. С помощью MyHits было получено 8 находок в базе данных SwissProt и они пренадежат к семейству LAP1.

Рис .1: Выравнивание с выделенным выбранным мотивом.

Поиск мотива специфичного для клады

С помощью метода NJ в JalView было построено филогенетическое дерево:

Рис. 2: Филогенетическое дерево.

Была выбрана клада из 6 верхних белков. Далее был найден характерный только для неё мотив: E[VA]E[TG]T.

Рис. 3: Характерный для клады паттерн

PSI-BLAST

Был выбран белок C4Z088 - ингибитор клеточного деления Eubacterium eligens ATCC 27750.

Номер итерации Число находок выше порога (0,005) Идентификатор худшей находки выше порога E-value этой находки Идентификатор лучшей находки ниже порога E-value этой находки
1 162 Q2P036.1 0.004 Q5F5V4.1 0.005
2 188 O25693.2 2e-09 - -
3 188 Q9ZM51.1 1e-11 7H8E6.1 0.012
4 188 Q9ZM51.1 5e-13 A7H8E6.1 0.016

Уже на третьей итерации число находок с E-value меньше порогового перестало изменяться, а разница между худшим результатом выше порога и лучшим результатом ниже порога составила значительную величину (9 порядков). Это позволяет нам сделать вывод о том, что группа является хорошо обособленной. Следовательно, выявленное семейство белков обосновано сходством их последовательностей.

Подсчет числа ТА в геноме

Был использован геном Bacillus subtilis strain DSM 10 и скрипт.

Ожидаемое число ТА составило 336256, реальное - 218026 (64,8%).

© Belov Leonid, 2013