Задание 1

Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
Cell division protein ZapA ZAPA_ECOLI ZAPA_BACSU 41.5 13.2% 29.8% 48 5
50S ribosomal protein L15 RL15_ECOLI RL15_BACSU 310 46.6% 61.6% 2 2
Peptidase T PEPT_ECOLI PEPT_BACSU 1129 54.1% 72.1% 6 6

Таблица 1. Характеристики глобального парного выравнивания трёх пар белков

Задание 2

Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Cell division protein ZapA ZAPA_ECOLI ZAPA_BACSU 50 16.5% 48.1% 9 3 69.7% 84.7%
50S ribosomal protein L15 RL15_ECOLI RL15_BACSU 312 47.2% 62.5% 1 1 99.3% 98.6%
Peptidase T PEPT_ECOLI PEPT_BACSU 1132 54.8% 73.2% 3 3 98.2% 98.0%

Таблица 2. Характеристики локального парного выравнивания гомологичных белков

Задание 3

Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2

Cell division protein ZapA

50S ribosomal protein L15

ZAPA_ECOLI RL15_BACSU 7.5 13.6% 23.7% 83 9 100% 100%

Cell division protein ZapA

50S ribosomal protein L15

ZAPA_ECOLI RL15_BACSU 28.5 24.6% 43.1% 11 4 50.5% 43.8%

Таблица 3. Характеристики глобального и локального парного выравнивания негомологичных белков

Исходя из полученных данных, можно заключить, что для двух случайно выбранных белков вес выравнивания значительно ниже, чем для гомологичных белков. Также наблюдаются низкие значения идентичности и схожести и большое число гэпов и инделей. Процент покрытия в случае локального выравнивания в среднем ниже, чем в случае с гомологичными белками.

Задание 4

Из трёх имеющихся мнемоник я выбрал PEPT_*. Рекомендуемым полным именем белка для ECOLI является Peptidase T. В Swiss-Prot нашлось 200 записей о белках, из которых я выбрал PEPT_SALTY, PEPT_YERPE, PEPT_VIBVY, PEPT_LACLC, PEPT_LACHE.

Выравнивание делалось с помощью инструментов UniProt по вышеуказанным идентификаторам, с последующим скачиванием файла в формате FASTA без сжатия. Файл с проектом доступен по ссылке.

Все белки достаточно хорошо выровнялись, что свидетельствует об их гомологии. Консервативные участки более-менее равномерно распределены между неконсервативными. Можно выделить сравнительно стабильные фрагменты в столбцах 130-155, 175-183, 226-236, 358-391.