Учебный сайт Ксении Худяковой

Главная > Семестры > Семестр 2 > Практикум 5

Практикум представлен в виде Jalview проекта.

Задание 1.

В Таблице 1 представлена информация об итерациях PSI-BLAST, проведенных для составления семейства гомологов белка цистеиновой десульфуразы археи Thermococcus barophilus MP.

В результате поиска со стандартными параметрами порога E-value в первой итерации было найдено 247 последовательностей, среди которых после длинного списка цистеиновых десульфураз шли белки, вряд ли попадающие в искомое семейство (L-aspartat decarboxylase, glycine dehydrogenase и др.), поэтому был выставлен порог 1е-05, разделяющий эти белки и цистеиновые десульфиразы. Среди находок с меньшим e-value есть не цистеиновые десульфуразы, но у них высокий query cover (выше 93%).

При запуске PSI-BLAST с изменёнными параметрами было найдено 234 последовательности.

Таблица 1. Данные об итерациях PSI-BLAST
Кол-во находок лучше порогаНаличие новых находокID лучшей находкиScore лучшей находкиE-value лучшей находкиID худшей находкиScore худшей находкиE-value худшей находки
1234да (первая итерация)P57795.13002e-96O83623.150.81e-05
2532даC6DBJ1.15670.0B1JBM5.150.51e-05
32219даC6DBJ1.14962e-173B8GTH6.150.61e-05
44157даC6DBJ1.13931e-132Q9HTF1.150.61e-05
54317даC6DBJ1.13324e-109P10356.250.89e-06

Результаты менялись и на восьмой итерации, поэтому я решила остановиться на пяти необходимых.

Задание 3.

Было построено множественное выравнивание семейства с помощью программы muscle по запросу "muscle -in family.fasta -out align_family.fasta".

Задание 4.

Seed семейства цистеиновых десульфураз был выбран с помощью функции Remove Redundancy с порогом 82%, так как при таком пороге удалось выделить подходящее число последовательностей. Участок seed'а показан на Рис.1 (ещё не выровненный). В seed вошло 18 белков.

Рис. 1. Фрагмент seed'a семейства цистеиновых десульфураз.

Выравнивание seed'a программой muscle представлено в Jalview проекте во вкладке seed_muscle.

Задание 5.

Второе выравнивание seed'a было построено с помощью программы mafft на сервере kodomo (запрос mafft seed.fasta > seed_mafft.fasta). Оно представлено в Jalview проекте во вкладке seed_mafft.

Задание 6.

Выравнивание двух предыдущих выравниваний относительно друг друга было построено с помощью программы muscle: "muscle -profile -in1 seed_mafft.fasta -in2 seed_muscle.fasta -out both.fasta". В проекте вкладка muscle_mafft. В строке matches "+" отмечены стоблцы, совпадающие в обоих выравниваниях.

По-видимому, программа muscle стремиться сопоставить аминокислоты блоками, то есть так, что получается крупный "блок", внутри которого два выравнивания совпадают. Такие "блоки" перемежаются с фрагментами, в которых произошло смещение одного выравнивания часто на одну позицию, а иногда - одной строки на несколько позиций. Этот сдвиг возник в результате того, что программа вставила в нижнее выравнивание (сделанное программой muscle), гэпы в первую позицию. И это правильные гэпы, потому что они обеспечивают максимальное количество консервативных столбцов. На концах блоках иногда присутствуют участки частичного сходства, когда одна колонка совпадает, соседняя нет, а следующая опять совпадает и т.д. Я думаю, что совпадающие колонки в таких участках результат скорее случайности, то есть программа не старается создавать такие колоноки. И блоки, и участки между блоками, и частично совпадающие участки показаны на рис.2. В целом выравнивания очень похожи.

Рис. 2. Участок выравнивания двух выравниваний. "+" отмечены совпадающие колонки.