Семейства белковых доменов

Меню

На главную

Второй семестр
Проект с выравниваниями в JalView . Запрос по псоледовательности моего белка 3-dehydroquinate dehydratase бактерии Thermus thermophilus HB8 на сайте Pfam выдал одно семейство дегидрокиназы Ссылка на запрос в Pfam. Seed выравнивания состоит из 191 последовательности и представлен по ссылке .
С помощью сайта http://emboss.bioinformatics.nl/ была создана консенсусная последовательность (по ссылке в формате fasta). В программе JalView тоже можно получить консенсусную последовательность (по ссылке в формате fasta).
Для построения LOGO выбран кластер с координатами 120-137 и загружен на сайт http://weblogo.berkeley.edu/ . LOGO представлено на рисунке 1. Кластер в формате fasta .

Рис.1 LOGO для кластера из seed выравнивания.

* Нахождение последовательности, наиболее похожей на консенсусную, т.е. с наибольшим весом. Для этого я написала bash скрипт (Текс скрипта доступен по ссылке ). Этот скрипт строит в needle выравнивая консенсусной последовательности и каждой последовательности из seed выравнивания. С помощью программы infoalign создает таблицу с информацией о каждом выравнивании. Результат скрипта строка о выравнивании с максимальным весом. (Рис.2)
Name: Q6SFT4_9BACT_3-148 Weight: 71.794868

Рис.2 Глобальное парное выравнивание консенсусной последовательности и максимально на нее похожей.

Построение сильного и слабого паттерна

Сильный паттерн не должен выдавать лишних находок. Т.е. результат должен быть как можно ближе к 191, но не больше. Получилось 185.
[IV]EVH[LI]SNIHAR-ExFR[HR]
Слабый паттерн, наоборот, не должен ничего упускать, поэтому все функционально неконсервативные наборы в квадратных скобках заменила на x - любую аминокислоту. Всего вышло 289 находок.
xxE[VLI]H[LI][ST]N[IVP]xxR-ExFRx

© Корзина Анастасия, 2015