Учебный сайт Ксении Худяковой |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Главная | О себе | Семестры | Ссылки | ||||||||||||||||||||||||||||||||||||||||||||||||||||||
Практикум представлен в виде Jalview проекта. Задание 1. В Таблице 1 представлена информация об итерациях PSI-BLAST, проведенных для составления семейства гомологов белка цистеиновой десульфуразы археи Thermococcus barophilus MP. В результате поиска со стандартными параметрами порога E-value в первой итерации было найдено 247 последовательностей, среди которых после длинного списка цистеиновых десульфураз шли белки, вряд ли попадающие в искомое семейство (L-aspartat decarboxylase, glycine dehydrogenase и др.), поэтому был выставлен порог 1е-05, разделяющий эти белки и цистеиновые десульфиразы. Среди находок с меньшим e-value есть не цистеиновые десульфуразы, но у них высокий query cover (выше 93%). При запуске PSI-BLAST с изменёнными параметрами было найдено 234 последовательности. Таблица 1. Данные об итерациях PSI-BLAST
Результаты менялись и на восьмой итерации, поэтому я решила остановиться на пяти необходимых. Задание 3. Было построено множественное выравнивание семейства с помощью программы muscle по запросу "muscle -in family.fasta -out align_family.fasta". Задание 4. Seed семейства цистеиновых десульфураз был выбран с помощью функции Remove Redundancy с порогом 82%, так как при таком пороге удалось выделить подходящее число последовательностей. Участок seed'а показан на Рис.1 (ещё не выровненный). В seed вошло 18 белков. Выравнивание seed'a программой muscle представлено в Jalview проекте во вкладке seed_muscle. Задание 5. Второе выравнивание seed'a было построено с помощью программы mafft на сервере kodomo (запрос mafft seed.fasta > seed_mafft.fasta). Оно представлено в Jalview проекте во вкладке seed_mafft. Задание 6. Выравнивание двух предыдущих выравниваний относительно друг друга было построено с помощью программы muscle: "muscle -profile -in1 seed_mafft.fasta -in2 seed_muscle.fasta -out both.fasta". В проекте вкладка muscle_mafft. В строке matches "+" отмечены стоблцы, совпадающие в обоих выравниваниях. По-видимому, программа muscle стремиться сопоставить аминокислоты блоками, то есть так, что получается крупный "блок", внутри которого два выравнивания совпадают. Такие "блоки" перемежаются с фрагментами, в которых произошло смещение одного выравнивания часто на одну позицию, а иногда - одной строки на несколько позиций. Этот сдвиг возник в результате того, что программа вставила в нижнее выравнивание (сделанное программой muscle), гэпы в первую позицию. И это правильные гэпы, потому что они обеспечивают максимальное количество консервативных столбцов. На концах блоках иногда присутствуют участки частичного сходства, когда одна колонка совпадает, соседняя нет, а следующая опять совпадает и т.д. Я думаю, что совпадающие колонки в таких участках результат скорее случайности, то есть программа не старается создавать такие колоноки. И блоки, и участки между блоками, и частично совпадающие участки показаны на рис.2. В целом выравнивания очень похожи. |