Практикум 8. Сигналы и мотивы - 3

Консервативный мотив в выравнивании последовательностей гомологичных белков

Для выполнения задания был взят домен DACZ_N (PF19294). DAC - специфическая диаденилат циклаза, которая катализирует конденсацию 2 молекул АТФ в циклический ди-АМФ. Домен приблизительно соотвествует требованиям. Число последовательностей seed - 55. Я скачала последовательности, открыла выравнивание в Jalview. Далее использовала в меню edit опцию remove redundancy - это помогло немного уменьшить число последовательностей, их стало 45. Я выбрала следующий консервативный мотив: R[IVL]RF[GA].EGA. Произвела поиск данного мотива в выравнивании - он нашелся в 33 последовательностях из 45. Затем осуществляла поиск в базе данных SwissProt на сайте MyHits. Поиск выдал немного находок - всего 3. Все находки относятся к тРНК рибозилтрансферазе-изомеразе.

photo

Рис.1. Выравнивание последовательностей домена DACZ_N.

Поиск мотива, специфичного для данной клады

В JalView было построено филогенетическое дерево с помощью NJ. Я выбрала кладу, состоящую из 10 последовательностей. Был выбран следующий мотив: [VS][ASE]D.D[AG][LV][LCF]LF, который есть почти во всех последовательностях клады. Когда осуществлялся поиск по всему выравниванию, обнаружилось 14 находок.

photo

Рис.2. Выравнивание выбранной клады

PSI-BLAST

Для выполнения этого задания я выбрала AC C4Z088. Этот идентификатор принадлежит вероятному белку MinC, определяющему сайт перегородки. Белок ингибирует клеточное деление, которое блокирует образование полярных кольцевых перегородок Z путем колебания между полюсами клетки для дестабилизации филаментов FtsZ, прежде чем они собрались в полярные Z-кольца.

photo

Рис.3. Результаты итераций PSI-BLAST.

Я провела 4 итерации. Из вышеприведенной таблицы видно, что стабилизация результата очередной итерации достигнута,т.е. список находок выше порога не поменялся по сравнению с предыдущей итерацией. Также можно сказать, что разница между худшей "правильной" находкой и "лучшей" неправильной довльно большая. Значит, высокая вероятность того, что находки состовляют семейство гомологичный белков.

Проверка гипотезы о том, что число TA в геноме меньше ожидаемого по статистике

Для выполнения этого задания был взян геном бактерии Staphylococcus aureus. Предварительно написав код в Python, я выяснила, что ожидаемое число TA сайтов оказалось равным 182317 с учетом GC-состава, а наблюдаемое число - 284240. Различие статистически значимо, тк для проверки был использован тест Хи-квадрат и было получено значение p-value = 0.0.