pano

Сигналы и мотивы - 3

Консервативный мотив в выравнивании последовательностей гомологичных белков

Для работы в данном практикуме было выбрано семейство АВС-транспортеров (ABC2_membrane_7 (PF19055)). Это трансмембранные, АТФ связывающие белки, которые можно встретить например на митохондриях.

Seed для этого семейства содержит 41 последовательность, но для дальнейшего анализа я удалила 5 наиболее похожих (Edit => remove redundancy => 80%), так что осталось всего 36. Выравнивание этих последовательностей довольно хорошее, много консервативных участков. Среди них был выбран участок с 322 по 329 позиции в качестве мотива.

Мотив: YC[VI]TG[MI][AG]Y

Данный мотив довольно хороший: в нём есть лишь одно "послабление"(выбор из похожих аминокислот). Он встречается абсолютно во всех последовательностях.

При запуске myHits было найдено 3 последовательности. Все они относятся к АВС-транспортерам резуховидки.

Мотив, специфичный для одной клады филогенетического дерева

В JalView было построено филогенетическое дерево с помощью NJ. В качестве таргетной клабы была выбрана клада из 9 последовательностей, а в ней следующий мотив: SFAFE (146-150 позиции). Данный мотив встречается 16 раз во всех последовательностях выравнивания: в выбранной и "ближайшей" кладах. Можно допустить, что этот мотив присущ для этой и близкой клад.

Рисунок 1. Распределение последовательностей по кладам и выбранный мотив.

PSI-BLAST

Программа запускалась с белком Q7VDL2 - белок из бактерии Prochlorococcus marinus, описанный как Probable septum site-determining protein.

Номер итерации Число находок выше порога 0.005 Идентификатор худшей находки выше порога E-value этой находки Идентификатор лучшей находки ниже порога E-value этой находки
1 159 Q9K1I0.1 0.005 A8GFG7.1 0.005
2 188 B6JKX0.1 2*E-08 NO NO

Таблица 1. Результаты итераций PSI-BLAST.

Число TA в геноме

Для данной задачи использовался геном одного из штаммов Escherichia coli (K-12, GCF_000005845.2). При подсчёте кол-ва сайтов TA в геноме длиной 4641652 bp было выявлено 212024 таких пары, при этом ожидаемое значение составляет 281000. P-value = z(134), а значит, гипотезу о том, что различий нет, можно отвергнуть.