Задание 1

Для работы было выбрано семейство LAGLIDADG_1 (PF00961). Выравнивание seed включало 42 последовательностей. Был найден мотив G[FL].[DS][GA]E[GA].F (рис.1) в большей части последоваательнстей. Затем был проведен поиск этого мотива с помощью сервиса MyHits. Обнаружилось 10 находок. Среди них большинство эндонулеаз, в остальном неохарактеризованные протеины, однако предполагается, что они имеют схожую функцию. Судя по колличеству находок данным мотивом обладают конкретные эндонуклеазные белки, возможно мотив отвечает за специфику работы найденых белков

aln
Рис.1 Паттерн в выравнивании

Задание 2

Было построено филогенетическое дерево последовательностей из выравнивания seed с помощью метода NJ.

aln
Рис.2 филогенетическое дерево

После чего была выбрана клада выделенная на рисунке 2. По последовательностям составил паттерн мотива [LIV].GF[IVS][DS][GA]E[GA].F.[IVS].

По найденому паттерну осущиствил поиск всех подходящих последовательностей. Мотив был найден только в 6 последоваательнотях клады. Кроме того общее колличество результатов содержащих такой мотив во всем выравнивании тоже 6. Это может говорить о специфисности мотива в выбраной кладе.

Задание 3. PSI-BLAST.

AC белка: Q7VDL2.Выполняет функцию ингибитора клеточного деления, блокирующего образование полярных Z-кольцевых перегородок, выделен из Prochlorococcus marinus.

Таблица 1
Номер итерации Находки выше порога ID худшей находки выше порога E-value ID лучшей находки ниже порога E-value
1 146 Q9AG20.1 0,005 A8GFG7.1 0,005
2 188 B6JKX0.1 7,00e-08 - -
3 188 Q9ZM51.1 2e-12 A7H8E6.1 0.014
4 189 A8MHK8.1 0.001 A7H8E6.1 0.013
5 189 A8MHK8.1 4e-10 A7H8E6.1 0.009
6 189 A8MHK8.1 3e-09 A7H8E6.1 0.014

Результат стабилизировался на 6 итерации. Различие e-value небольшое и далеко от порога в 0.05, кроме того белки от итерации к итерации почти не мнялись. Можно судить о хорошей обособленности группы.

Задание 4

  • штамм : Bacillus subtilis 168
  • Содержание TA: 0.565
  • длина : 4 215 606 bp
  • ожидаемое число слов TA : n= 4215606 * 0.282 * 0.282 = 335248
  • наблюдаемое число : 343299 (с помощью wordcount)
  • отношение наблюдаемого к ожидаемому : ~1.02
  • Ожидаемое число TA незначительно отличается от наблюдаемого.