1.С помощью программы blastP на сервере NCBI были найдены в SwissProt гомологи белка TRMD_ECOLI, сохранённые в следующих файлах: 1)Совпадающие на 60-70% в файле sequences1.fasta 2)Совпадающие на 50-60% в файле sequences2.fasta 3)Совпадающие на 35-45% в файле sequences3.fasta Все выбранные последовательности(10 штук)вместе с последовательностью белка TRMD_ECOLI были сохранены в файле all.fasta
2.Мной было построено множественное выравнивание выбранных последовательностей с помощью программы emma и программы muscle. Результаты сохранены в следующих файлах:
В результате сравнения множественных выравнивания, полученных с помощью вышеуказанных программ было обнаружено, что в случае использования алгоритма ClustalW в основном имеется лишь 3 протяжённые участки гэпов, а при использовании MUSCLE - 4. Других значительных отличий между полученными выравниваниями не было найдено.
3.Выравнивание, полученное с помощью emma, было импортировано в Genedoc. Красным цветом мной были выделены колонки, консервативные на 100%, темно-голубым - на 70%. Результат сохранён в файле Gene1.msf Консервативными на 100% являются 73 колонки Консевативные на 70% - 56 колонок В полученном выравнивании имеется 3 выраженных консервативных фрагмента: 1)67-74 а.о. 2)154-166 а.о. 3)193-202 а.о. Была получена матрица попарной идентичности последовательностей, сохранённая в файле Matrix.txt
4.Выравнивание, полученное с помощью muscle, было импортировано на ту же страницу Genedoc, где расположено раскрашенное выравнивание emma. Раскрашенное объединение выравниваний сохранено в файле emmamuscle.htm
5.По рассмотрении матрицы попарной идентичности, мной были выбраны две наименее похожие последовательности: TRMD_FRATN и TRMD_METFK (процент сходства - 44%). Их последовательности были скопированы в файлы OTRMD_FRATN.fasta и OTRMD_METFK.fasta соответственно. С помощью программы needle было получено оптимальное попарное выравнивание, сохранённое в файле ONEEDLE.fasta. Было осуществлено сравнение оптимального попарного выравнивания последовательностей TRMD_FRATN и TRMD_METFK с их попарным выравниванием, порожденным множественным выравниванием. Раскрашенное объединение 3-х выравниваний сохранено в файле 3needle.htm В результате сравнения данных 3-х выравниваний было установлено, что выравнивания, полученные с помощью needle и muscle очень похожи, и участки, консервативные на 100% в них совпадают всегда, в то время как выравнивание, полученное с помощью emma, иногда отличается от них порядком расположения гэпов и тем, что участки, консервативные на 100% и совпадающие для выравниваний в muscle и emma в некоторых случаях не являются консервативными в выравнивании, полученном с помощью emma.
6.Программе infoalign на вход было подан файл Emma.fasta, содержащий в себе выравнивание, полученное с помощью emma. В результате программой в виде таблицы была выдана информация об этом множественном выравнивании, сохранённая в файле emma.infoalign. Программа осуществляет сравнение поданных ей последовательностей с последовательностью-консенсусом, в результате чего программа выдаёт следующую информацию: 1)Название последовательностей (ID) 2)Длина последовательностей 3)Число гэпов 4)Длина гэпов 5)Число аминокислотных остатков, совпадающих с остатками последовательности консенсуса. 6)Процент сходства последовательностей с последовательностью-консенсусом 7)Число не совпадающих остатков 8)Процент изменения 9)Вес