Мотивы в белках

Задание 1. Найдите консервативные мотивы в выравнивании

Для работы был выбран домен S-layer (PF07752). Этот домен удобен для составления паттерна по консервативному участку выравнивания seed, так как он содержит 44 последовательности. Methanosarcinales S-layer Tile Proteins (STP) - это семейство белков, встречающихся у членов порядка Methanosarcinales, которые являются метаногенными археями. STP являются основным компонентом структуры защитного белкового поверхностного S-слоя, который покравает снаружи мембрану Methanosarcinales и выполняет многие важные функции, включая защиту от вредных внеклеточных веществ.

Cкачанный файл с выравниванием seed доступен по ссылке. Я открыл его в Jalview и визуально определил интересный мне консервативный участок (выделен на Рис 1). Его паттерн в:
Jalview-формате: [YF]..[IMVL][GPYN][FWL][MFLN][AGCS].[KERPLNQ][YW][FVIA][AVPY];
в PROSITE-формате: [YF]-x-x-[IMVL]-[GPYN]-[FWL]-[MFLN]-[AGCS]-x-[KERPLNQ]-[YW]-[FVIA]-[AVPY]

Рис.1 Консервативный мотив в выравнивании seed.

Я проверил, что паттерн описывает все 44 последовательности. Полученный мотив я загрузил в ScanProsite. В базе SwissProt нашлось 8 находок в 5 последовательностях. При этом 2 находки было из бактерии Porphyromonas gingivalis (белок Major fimbrium subunit FimA type-1 (FimA1) (Fimbrillin)) - это субъединица белков, функция которых связана с микроворсинками на поверхности бактерий. Видна функциональная параллель белков с этим консервативным участком в организмах двух разных доменов - Бактерий и Архей.

Задание 2. В том же выравнивании найдите мотив, специфичный для одной клады филогенетического дерева

При помощи встроенного функционала Jalview было построено филогенетическое древо белков из выравнивания seed. Алгоритм построения дерева - Neighbor Joining. Дерево с выделением цветом части ветвей изображено на Рис 2.

Рис 2 Филогенетическое древо выравнивания seed. Ветви розового цвета и темный фон названий последовательностей выделяют кладу, в которой проходил поиск специфичного для её представителей мотива.

Белки в этой ветви имеют мотив c паттерном [SCPY][VLK][IVML][PY][WL][FML][GCS][KN][KLP]Y[VI]A[VI], этом при этот паттерн отсутствует в других белках выравнивания. Значит, этот мотив содержит отличный от других выравниваний seed паттерн. Цель задания выполнена.

Рис. 3 Выделенное черным - выравнивание ветви, по которому составлялся паттерн.

Задание 3. PSI-BLAST последовательности белка B2V8C0

Z-кольцо — кольцевая органелла грамотрицательных бактерий, расположенная примерно посередине клетки и способная сокращаться, образуя перетяжку между двумя новыми дочерними клетками. Согласно описанию функции белка B2V8C0 в Uniprot, Probable septum site-determining protein MinC - ингибитор деления клеток, который блокирует образование полярных Z-кольцевых перегородок. Он быстро колеблется между полюсами клетки, чтобы дестабилизировать и предотвратить полимеризацию нитей FtsZ, чтобы они не образовали полярные Z-кольца.

Я запустил psi-blast этого белка по базе SwissProt и пронаблюдал за количеством и E-value находок на каждой итерации, продолжая до момента, пока перестали появляться новые находки. Результаты представлены в таблице на Рис 4.

Рис. 4 Таблица итераций psi-blast.

На третьей итерации не было новых находок. Обратим внимание на разницу в E-value ближайших надпороговых и подпороговых находок. Разница растет с каждой итерацией. На первой итерации многие находки близки к порогу, и если бы мы поставили более строгий порог, они бы отсеялись как незначимые. Однако повторный запуск не только находит новые белки, но и усиливает "неслучайность" каждой находки. На третьей итерации разница в E-value ближайших над- и подпороговых находок имеет вид большого скачка значимости, сравнивая их, можно объединить надпороговые находки в довольно обособленное семейство гомологичных белков.