Мотивы

Поиск консервативных мотивов в выравнивании

Для выполнения практической работы мною был выбран домен SH3 domain (AC - PF00018).

В выравнивании seed этого домена 55 последовательностей, среди них не было очень похожих. В Jalview я выбрала способ покраски Above identity threshold 100%, покрасилась одна колонка. Далее я постепенно снижала порог, чтобы найти самый консервативный мотив. На пороге 58% появился мотив с координатами 2-6. Информационное содержание мотива не очень высокое.

Рис. 1. Выравнивание seed

Паттерн мотива: [AVT][RLVEKIMQA][YFHNKLAS][DESNPAG][FLY]. Паттерн был найден во всех последовательностях.

По паттерну A-L-Y-D-Y в Prosite было получено 333 совпадения в 330 последовательностях. Найденные белки выполняют разные функции и принадлежат разным организмам (и бактериям, и эукариотам), поэтому, скорее всего, нашлись случайно. Выравнивание получилось ужасным, в том числе не выровнялись мотивы.

По выравниванию было построено филогенетическое дерево. Я выбрала одну из клад и построила выравнивание ее последовательностей. В этой кладе много консервативных мотивов, я выбрала FPANYVE (531-537). Я поискала этот мотив во всем выравнивании. Мотив встречается во всех последовательностях клады и не встречается больше нигде в выравнивании. Вывод: мотив специфичен для клады.

PSI-BLAST

Из списка я выбрала белок с идентификатором P19954 (Ribosome-binding factor PSRP1). Он принадлежит Spinacia oleracea, функция - связывается с каналом мРНК малой субъединицы рибосомы хлоропласта и взаимодействует с нуклеотидами 16S рРНК в А-участке и Р-участке.

Номер итерации Число находок выше порога (0,005) Идентификатор худшей находки выше порога E-value этой находки Идентификатор лучшей находки ниже порога E-value этой находки
1 17 P30334.1 0,004
2 28 P9WMA8.1 0,003 Q0C0T0.1 0.028
3 28 P9WMA8.2 8,00E-13
4 28 P9WMA8.3 8,00E-13

Табл. 1. Результаты 4 итераций PSI-BLAST

Список находок сошелся, значит, нашлось обособленное семейство.

Поиск мотивов de novo с помощью MEME

С помощью Pfam скачала последовательности белков, содержащие домен PF00018 (Reviewed). Нашла 4 мотива, используя MEME - выдача. У всех мотивов низкий E-value, среди них был и найденный мною ранее мотив ALYDY, значит, он является важным для домена.

Представленность сайта GATC в геноме бактерии

С помощью cbcalc на kodomo получила представленность сайта GATC в геноме бактерии Vescimonas Coprocola и по результатам построила диаграмму.

Рис. 2. Гистограмма представленности сайтов

Представленность сайта метилирования GATC не очень высокая, возможно, сайтом метилирования является какой-то другой сайт.