Практикум 8.

Выбор домена и поиск мотива.

Для анализа я выбрал домен PF02022, Zn-связывающий домен в ретровирусных интегразах и похожих ферментах, кодируемых мобильными генетическими элементами. Выравнивание seed для этого семейства содержит 17 белков. Для поиска консервативных мотивов я открыл выравнивание seed в Jalview и посмотрел на него:

cringe
Рисунок 1. Выравнивание в Jalview.

Увидев 4 полностью консервативных остатка, я составил следующую запись мотива для поиска в SwissProt: H-X(3)-H-X(22,23)-C-X(2)-C.

Воспользовавшись сервисом MyHits, я получил 269 находок из SwissProt, многие из которых - Zn-связывающие ферменты или указаны как белки ретровирусов (122 из них это полипротеин ВИЧ-1 Gag-Pol).

Поиск мотива, специфичного для 1 клады.

Для поиска такого мотива использовал алгоритм NJ Jalview. Выделил интересующую кладу розовым и нашёл в ней мотив T-H-C-X(3)-A-L, характерный только для этой группы. На следующем рисунке показано окно Jalview с выделенной группой:

cringe
Рисунок 2. Выравнивание с выделенной группой из 3-ёх последовательностей.

PSI-BLAST.

Для этого задания я выбрал идентификатор P19954 из предложенного списка. Это белок шпината (Spinacia oleracea), температуро- и светозависимый ингибитор трансляции, взаимодействующий с 16s рРНК. В таблице ниже можно видеть ход итераций PSI-BLAST:

Получившая для последовательных итераций PSI-BLAST таблица.
Номер итерации Число находок выше порога (0,005) Идентификатор худшей находки выше порога E-value этой находки Идентификатор лучшей находки ниже порога E-value этой находки
1 17 P30334.1 0.004 Q0C0T0.1 0.027
2 28 P9WMA8.1 0.003 Q0C0T0.1 0.027
3 28 P9WMA8.1 7E-13 Q0C0T0.1 0.027
4 28 P9WMA8.1 8E-13 Q0C0T0.1 0.027

Поиск недостатка TA-динуклеотида в геноме бактерии.

Для этой части практикума я использовал геном Treponema pallidum, длинною в 1139330 нуклеотидов. Скрипт, аналогичный скрипту из практикума 6, выдал следующие значения: ожидаемое число TA-сайтов: 31740; реальное число: 23475; значение биномиального теста: 0.0, т.е. различия значимы.