|
|
||||||||||||||||||||||||||||
Предсказание парных выравниваний Выравнивание Файл с проектом Задание 1 Рассчет программы (методом главных компонент) показал, что наиболее удаленными друг от друга являются последоваетельности ROSHA и BACST. Задание 4 Дополнительные параметры к повторному выравниванию последовательностей я выбирала так, чтобы лучше понять, как они влияют на построение выравнивания, поэтому взяла очень маленькое значение штрафа за открытие гэпа(1 единица) для глобального выравнивание и максимальное за его продолжение для локального выравнивания(10).При работе с заведомо негомологичными последовательностями я выбрала более "мягкие" параметры - 5 единиц штрафа за открытие гэпа(для глобального), 1 единицу за его продолжение(для локального). Получилось, что программы довольно чувствительны к изменению первого параметра (количество гэпов возрастало даже при небольшом изменении параметра), изменение же второго параметра в случае с негомологичными белками к изменениям в выравнивании не привело. Иденнтификаторы негомологичных последовательностей: YP_004844729.1 YP_001611727.1 Задание 7 Сравнение парных выравниваний 1. (Построенного из множественного и построенного программой needle со стандартными параметрами) Один из различных участков для двух выравниваний - со 126 по 134 аминокислоты(представлен на рисунке ниже). Колонок, не совпавших в двух выравниваниях, 45 штук. Сравнение парных выравниваний 2. (Построенного из множественного и построенного программой water со стандартными параметрами) Участок со значительными отличиями: 38 - 67 аминокислоты (см. рисунок ниже). Различных колонок 59 штук. Сравнение парных выравниваний 3. (Того же и построенного программой water со измененными параметрами). Участок со значительными отличиями: 84 - 96 аминокислоты (см. рисунок ниже). Отличающихся колонок 80 штук. Сравнение парных выравниваний 4. (Того же и построенного программой needle со измененными параметрами). Один из многих отличающихся участков: 97 - 100 аминокислоты (см. рисунок ниже). Различных колонок очень много - 105 штук. Задание 8 Проценты рассчитаны от общей длины(а.о. + гэпы) выравнивания.
Выравнивание, построенное из множественного, содержит в себе следы информации о других последовательностях, которые были удалены в процессе построения парного. Выравнивание, построенное прграммой, эту информацию не учитывает, что более правильно, если нам необходимо сравнение только данных двух последовательностей. Ответить на вопрос "какое выравнивание лучше?" довольно сложно, потому что это зависит от результата, который мы хотим получить. Скажем, локальное выравнивание негомологичных последовательностей (nonhomologous_water.fasta) выявляет короткий, но достаточно схожий в обеих последовательностях, участок. Вероятно, что он отвечает за похожие структуры в обоих белках. Однако, в этом выравнивании нет информации о том, насколько в целом эти последовательности различны - процент идентичных колонок для него очень высок, что не отражает полной картины. Проценты по глобальному выравниванию дают гораздо более правильное представление о схожести данных белков. Вопрос о сравнении парного со множественным опять таки не однозначен. Если нам нужно сравнить более двух последовательностей, то для получения общей картины удобнее использовать множественное выравнивание, чем сравнивать их вручную попарно. Для сравнения же двух конкретных белков использовать множественное выравнивание не имеет никакого смысла. |