Для работы в данном практикуме было выбрано семейство АВС-транспортеров (ABC2_membrane_7 (PF19055)). Это трансмембранные, АТФ связывающие белки, которые можно встретить например на митохондриях.
Seed для этого семейства содержит 41 последовательность, но для дальнейшего анализа я удалила 5 наиболее похожих (Edit => remove redundancy => 80%), так что осталось всего 36. Выравнивание этих последовательностей довольно хорошее, много консервативных участков. Среди них был выбран участок с 322 по 329 позиции в качестве мотива.
Мотив: YC[VI]TG[MI][AG]Y
Данный мотив довольно хороший: в нём есть лишь одно "послабление"(выбор из похожих аминокислот). Он встречается абсолютно во всех последовательностях.
При запуске myHits было найдено 3 последовательности. Все они относятся к АВС-транспортерам резуховидки.
В JalView было построено филогенетическое дерево с помощью NJ. В качестве таргетной клабы была выбрана клада из 9 последовательностей, а в ней следующий мотив: SFAFE (146-150 позиции). Данный мотив встречается 16 раз во всех последовательностях выравнивания: в выбранной и "ближайшей" кладах. Можно допустить, что этот мотив присущ для этой и близкой клад.
Рисунок 1. Распределение последовательностей по кладам и выбранный мотив.
Программа запускалась с белком Q7VDL2 - белок из бактерии Prochlorococcus marinus, описанный как Probable septum site-determining protein.
Номер итерации | Число находок выше порога 0.005 | Идентификатор худшей находки выше порога | E-value этой находки | Идентификатор лучшей находки ниже порога | E-value этой находки |
---|---|---|---|---|---|
1 | 159 | Q9K1I0.1 | 0.005 | A8GFG7.1 | 0.005 |
2 | 188 | B6JKX0.1 | 2*E-08 | NO | NO |
Таблица 1. Результаты итераций PSI-BLAST.
Для данной задачи использовался геном одного из штаммов Escherichia coli (K-12, GCF_000005845.2). При подсчёте кол-ва сайтов TA в геноме длиной 4641652 bp было выявлено 212024 таких пары, при этом ожидаемое значение составляет 281000. P-value = z(134), а значит, гипотезу о том, что различий нет, можно отвергнуть.