Анализ карты локального сходства белка TALe самого с собой
Представляется интересной карта локального сходства белка TALe с самим собой. Последовательность этого белка представлена в файле tale-seq.fasta
На рисунке 1 представлена карта локального сходства при стандартных параметрах работы сервиса DotHelix на сайте genebee. На рисунке 2 – она же при изменении верхней границы силы шума («power of noise») с 4 до 10, карта в таком виде слегка более ясна для впервые столкнувшегося с ней зрителя.
Рис. 1. Карта локального сходства при стандартных параметрах работы DotHelix.
Рис. 2. Карта локального сходства при максимальном значении силы шума 10.
Карта симметрична относительно побочной диагонали, на которой находится сплошная линия, обозначающая, что последовательности, между которыми ищется локальное сходства, идентичны (это сам белок).
Очевидно, что другие линии на карте обозначают наличие неких повторяющихся частей последовательности. Причем необходимо отметить, что по карте заметно, что эти дублирующиеся кусочки располагаются с определенным периодом, т. к. расстояние между линиями одинаково.
Прямое исследование последовательности показывает, что один мотив встречается в белке 23 раза. Это подтверждается картой локального выравнивания (можно заметить, что линий на карте в самом деле 23). Отметим, что такие повторы возникают в районе 200-900 аминокислотных остатков.
Наличие некоторых других отметок (коротких линий на протяжении нескольких аминокислот) на карте с низким порогом максимальной силы шума обусловлено повторами на дистальных концах молекулы (до 200 и после 900 аминокислотных остатков).