Главная страница Обучение Обо мне Ссылки

PSI-BLAST. Множественное выравнивание.

Практикум представлен в виде Jal-view проекта.

Задание 1.

В Таблице 1 представлена информация об итерациях PSI-BLAST, проведенных для составления семейства гомологов белка антранилат-фосфорибозилтрансферазы археи Pyrobaculum oguniense.

В результате поиска со стандартными параметрами порога E-value в первой итерации после длинного списка антранилат-фосфорибозилтрансфераз шли белки, вряд ли попадающие в искомое семейство (AMP-phosphorylase, thymidine phosphorylase и др.), поэтому был выставлен порог 1е-20, разделяющий эти белки и антранилат-фосфорибозилтрансферазы.

Таблица 1. Данные об итерациях PSI-BLAST
Кол-во находок лучше порогаНаличие новых находокID лучшей находкиScore лучшей находкиE-value лучшей находкиID худшей находкиScore худшей находкиE-value худшей находки
1496да (первая итерация)A4WKR06380.0A6URW342.40.004
2497даA3DDS84915e-173O665851332e-34
3497нетA3DDS85200.0O665851346e-35
4497нетA3DDS85140.0O665852625e-84
5497нетA3DDS85150.0O665852683e-86

Во второй итерации к предыдущим находкам добавилась одна: неохарактеризованный белок c идентификатором O66585 (его параметры см. в Таблице 1). Он был включен в дальнейшие итерации, так как у него достаточно велик query cover (92%) и E-vаluе в принципе достаточно мал, чтобы быть достоверным. В общем-то, результаты стабилизировались уже на третьей итерации.

Задание 3.

Было построено множественное выравнивание семейства с помощью программы muscle по запросу "muscle -in family.fasta -out align_family.fasta". Результат представлен в Jal-view проекте, вкладка align_family_muscle.

Задание 4.

Seed семейства антранилат-фосфорибозилтрансфераз было выбрано с помощью функции Remove Redundancy с порогом 76%, так как только при таком пороге удалось выделить подходящее число последовательностей. Участок seed'а показан на Рис.1 (без выравнивания). В seed вошло 15 белков.

Рис. 1. Фрагмент seed'a семейства антранилат-фосфорибозиотрансфераз.

Выравнивание seed'a программой muscle представлено в Jal-view проекте во вкладке align_seed_muscle.

Задание 5.

Второе выравнивание seed'a было построено с помощью программы mafft на сервере kodomo (запрос mafft seed.fasta > seed_mafft.fasta). Оно представлено в Jal-view проекте во вкладке align_seed_mafft.

Задание 6.

Выравнивание двух предыдущих выравниваний относительно друг друга было построено с помощью программы muscle: "muscle -profile -in1 seed_mafft.fasta -in2 seed_muscle.fasta -out both.fasta". В jar-проекте вкладка align_seed_muscle&mafft. В строке Identical Columns "+" отмечены стоблцы, совпадающие в обоих выравниваниях.

Можно отметить, что в этом выравнивании, по-видимому, программа muscle стремиться сопоставить аминокислоты блоками, то есть так, что получается крупный "блок", внутри которого два выравнивания совпадают (участок самого крупного "блока" показан на рис. 2). Такие "блоки" перемежаются с фрагментами, в которых произошло смещение одного выравнивания на одну позицию. Этот сдвиг возник в результате того, что программа вставила в нижнее выравнивание (сделанное программой muscle), гэпы в первую позицию. Меня это удивило, потому что в начале выравнивания очевидно, что если бы не было этого гэпа, выравнивания бы сошлись. Однако при избавлении от этой колонки гэпов теряется такая сильная схожесть в "блоках".

Рис. 2. Участок выравнивания двух выравниваний. "+" отмечены совпадающие колонки.

На страницу второго семестра



© Alexandra Boyko, 2014. Faculty of Bioengineering and Bioinformatics, MSU.