Для анализа я выбрал домен PF02022, Zn-связывающий домен в ретровирусных интегразах и похожих ферментах, кодируемых мобильными генетическими элементами. Выравнивание seed для этого семейства содержит 17 белков. Для поиска консервативных мотивов я открыл выравнивание seed в Jalview и посмотрел на него:
Увидев 4 полностью консервативных остатка, я составил следующую запись мотива для поиска в SwissProt: H-X(3)-H-X(22,23)-C-X(2)-C.
Воспользовавшись сервисом MyHits, я получил 269 находок из SwissProt, многие из которых - Zn-связывающие ферменты или указаны как белки ретровирусов (122 из них это полипротеин ВИЧ-1 Gag-Pol).
Для поиска такого мотива использовал алгоритм NJ Jalview. Выделил интересующую кладу розовым и нашёл в ней мотив T-H-C-X(3)-A-L, характерный только для этой группы. На следующем рисунке показано окно Jalview с выделенной группой:
Для этого задания я выбрал идентификатор P19954 из предложенного списка. Это белок шпината (Spinacia oleracea), температуро- и светозависимый ингибитор трансляции, взаимодействующий с 16s рРНК. В таблице ниже можно видеть ход итераций PSI-BLAST:
Номер итерации | Число находок выше порога (0,005) | Идентификатор худшей находки выше порога | E-value этой находки | Идентификатор лучшей находки ниже порога | E-value этой находки |
---|---|---|---|---|---|
1 | 17 | P30334.1 | 0.004 | Q0C0T0.1 | 0.027 |
2 | 28 | P9WMA8.1 | 0.003 | Q0C0T0.1 | 0.027 |
3 | 28 | P9WMA8.1 | 7E-13 | Q0C0T0.1 | 0.027 |
4 | 28 | P9WMA8.1 | 8E-13 | Q0C0T0.1 | 0.027 |
Для этой части практикума я использовал геном Treponema pallidum, длинною в 1139330 нуклеотидов. Скрипт, аналогичный скрипту из практикума 6, выдал следующие значения: ожидаемое число TA-сайтов: 31740; реальное число: 23475; значение биномиального теста: 0.0, т.е. различия значимы.