С помощью программы blastP на сервере NCBI я нашла в SwissProt пять гомологов своего белка(GLYA_ECOLI), совпадающих на:
Я импортировала выравнивание, полученное с помощью emma, в Genedoc, изменила конфигурацию проекта так, чтобы цветом были выделены только самые консервативные колонки выравнивания, консервативные на 100% - красным, а на 70% - темно-голубым. Колонок, консервативных на 100% получилось 106, а на 70% - 82. Фрагментов, состоящих из последовательно идущих консервативных колонок много, наиболее длинный из них составляет 15 колонок, остальные поменьше и часто разделены только 1 неконсервативной колонкой. Последняя последовательность (GLYA_CHLAB) намного длиннее остальных выравниваемых последовательностей и поэтому программа ставит очень много гэпов, особенно в начале, середине и в конце выравнивания. Посмотреть на раскашенное выравнивание можно здесь.
Сравненивая выравнивания, сделаных с помощью программ emma и muscle, можно найти некоторые отличия. Сильно различается расположение гэпов в начале и в конце выравнивания, в центре же если и есть какие-либо различия, то они совсем не большие и на первый взгляд кажется, что выравнивания идентичны, но это не так, потому что некоторые отличия всё-таки встречаются, хотя максимум их составляет 2-3 гэпа. Наибольшее количество консервативных колонок содержит выравнивание, сделанное с помощью программы muscle, хотя и гэпов эта программа ставит больше, но всё же, если мы руководствуемся целью найти консервативные участки, то эта программа в данном случае подходит больше. Все выводы сделаны с помощью независимого раскрашивания объединения выравниваний.
По данным матрицы, наибольшими отличиями обладают последовательности GLYA_MYCPE и GLYA_CHLAB.
Оптимальное попарное выравнивание, сделанное с помощью программы needle отличается от попарных выравниваний, порождённых множественными выравниваниями. Если "подвинуть" в выравнивание, сделанное с помощью программы needle,на 6 позиций назад (т.е. убрать по 6 гэпов в первой и второй последовательностях выравнивания) , то консервативные столбцы полностью совпадут с консервативными столбцами выравнивания muscle, однако мы потеряем 6 консервативных столбцов, приобретённых за счёт того, что выравнивание needle оптимальное попарное для последовательностей. Это указывает на то, что множественное выравнивание для 5-ти последовательностей не будет порождать оптимального выравнивания для каких-либо 2-х из них. Убедиться в этом можно взглянув на раскрашенное выравнивание
На вход подается файл с множественным выравниванием.(В моём случае muscle) Программа infoalign выдаёт характеристику каждой последовательности выравнивания. Сравнение идёт по последовательности, чьи показатели средние.
Cравнение проводиться по