1. Глобальное парное выравнивание гомологичных белков.
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels 50S ribosomal protein L34 RL34_ECOLI RL34_BACSU 146.0 63.0 78.3 2 1 Chemotaxis protein CheA CHEA_ECOLI CHEA_BACSU 1042.5 33.9 56.5 68 12 Phosphoribosyl-AMP cyclohydrolase HIS2_ECOLI HIS2_BACSU 461.5 46.5 62.0 14 4
2. Локальное парное выравнивание гомологичных белков.
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2 50S ribosomal protein L34 RL34_ECOLI RL34_BACSU 146.0 67.4 83.7 0 0 93.5% 97.7% Chemotaxis protein CheA CHEA_ECOLI CHEA_BACSU 1046.5 34.7 57.9 54 11 98.0% 99.7% Phosphoribosyl-AMP cyclohydrolase HIS2_ECOLI HIS2_BACSU 463.5 48.5 64.7 7 2 99.5% 97.6%
3. Результат применения программ выравнивания к неродственным белкам.
Глобальное парное выравнивание негомологичных белков.
ID 1 ID 2 Score % Identity % Similarity Gaps LGOT_ECOLI FLIF_BACSU 8.0 1.3 2.7 877
Локальное парное выравнивание негомологичных белков.
ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2 LGOT_ECOLI FLIF_BACSU 33.5 26.7 37.8 18 1 5.7% 8.2%
Комментарий.
Если сравнить таблицы глобальных парных выравниваний, полученных для гомологичных и негомологичных белков, то можно заметить, что у гомологичных белков значения примерно одного порядка, причем эти же значения в десятки раз отличаются от значений, полученных при негомологичном выравнивании. На основании этого можно сделать вывод, что критерии: процент идентичных букв, процент близких букв, процент гэпов и вес выравнивания - являются универсальными для этого типа выравниваний.
Для локальных выравниваний дело обстоит иначе. Критерии:процент идентичных букв, количество гэпов, процент близких букв и количество инделей - имеют одинаковые порядки числовых значений для гомологичных и негомологичных выравниваний. Однако вес выравниваний и процент покрытия имеют значительно различающиеся значения у гомологичгых и негомологичных белков и могут быть оценены как универсальные критерии для данного типа выравниваний.
4. Сохранение выравнивания в fasta-формате и импорт в Jalview.
Глобальное выравнивание белков LGOT_ecoli и FLIF_bacsu в виде проекта Jalview.5. Множественное выравнивание белков.
Для мнемоники функций - "CHEA" был найдено 12 белков. На мой взгляд, белки выравнялись хорошо и все являются гомологичными, так как в выравнивании встречается много консервативных участков максимальной длиной 6 букв (колонки 521-526), 3 консервативных блока длины 5 (432-436, 469-473, 509-503). Как и следовало ожидать,в последовательностях много отличий, т.е. присутствуют менее консевативные участки, например блок (44 -62) полностью идентичен для CHEA_SALTY и CHEA_ECOLI,несколько менее схож с последвовательностью у CHEA_RHOSH, и сильно отличен для двух оставшихся организмов. Из соображений, что консервативные участики встречаются практически по всей длине белков, что мало вероятно произшёло в ходе конвергентной эволюции, причем последовательности CHEA_SALTY CHEA_ECOLI,CHEA_RHOSH более сходны между собой, в отличие от двух оставшихся.