Protein Name | ID 1 |
ID 2 |
Score |
Identity, % |
Similarity, % |
Gaps |
Indels |
---|---|---|---|---|---|---|---|
Putative regulator AbrB | ABRB_ECOLI | ABRB_BACSU | 5.0 | 0.5 | 0.9 | 420 | 2 |
Flavodoxin 1 | FLAV_ECOLI | FLAV_BACSU | 153.5 | 27.0 | 45.4 | 36 | 9 |
Iron-sulfur cluster assembly protein SufB | SUFB_ECOLI | SUFB_BACSU | 938.0 | 39.6 | 57.9 | 34 | 10 |
В полных названиях белков есть небольшие разночтения:
Protein Name |
ID 1 |
ID 2 |
Score |
Identity, % |
Similarity, % |
Gaps |
Indels |
Coverage ECOLI, % |
Coverage BACSU, % |
---|---|---|---|---|---|---|---|---|---|
Putative regulator AbrB | ABRB_ECOLI | ABRB_BACSU | 27.0 | 36.4 | 81.8 | 0 | 0 | 3.2 | 11.5 |
Flavodoxin 1 | FLAV_ECOLI | FLAV_BACSU | 157.0 | 33.1 | 54.5 | 10 | 4 | 65.9 | 73.4 |
Iron-sulfur cluster assembly protein SufB | SUFB_ECOLI | SUFB_BACSU | 948.0 | 41.1 | 59.7 | 24 | 8 | 96.0 | 97.8 |
Белки ABRB_ECOLI и ABRB_BASCU не являются гомологичными. У них очень маленькие значения Score, Identity и Similarity в выравниваниях, а покрытие локального выравнивания очень маленькое, что говорит об очень низкой гомологии.
Белки FLAV_ECOLI и FLAV_BACSU могут быть гомологичными. Судя по локальному выравниванию они имеют достаточно большой гомологичный участок, который не включает концы белков.
Белки SUFB_ECOLI и SUFB_BACSU скорее всего гомологичные. У них достаточно большой Score и другие параметры выравниваний. Локальное выравнивание содержит в себе почти полностью последовательности белков, за исключением начальных аминокислот.
Мне кажется, что для первой пары белков более информативно глобальное выравнивание, т.к. там особенно хорошо видно полное отсутствие гомологии последовательностей. Для второй и третьей пары белков параметры глобального и локального выравнивания очень схожи, но локальное все-таки точнее определяет гомологичные участки из-за его алгоритма. За счет этого локальное выравнивание получается короче, ведь оно включается только гомологичный участок и по его покрытию удобно судить о величине гомологичного участка.
Локальное выравнивание не пытается обе последовательности "растянуть" одну на другую, а именно ищет участки с наиболее похожим паттерном. Поэтому многие буквы, сопоставленные в локальном выравнивании оказались не сопоставлены в глобальном.
Тип выравнивания | Protein Name 1 | Protein Name 2 | ID 1 | ID 2 | Score | Identity, % | Similarity, % | Gaps | Indels | Coverage ECOLI, % | Coverage BACSU, % |
---|---|---|---|---|---|---|---|---|---|---|---|
Глобальное | Transaldolase A | Putative maltodextrin utilization protein YvdJ | TALA_ECOLI | MALA_BACSU | 8.0 | 3.1 | 5.9 | 474 | 6 | - | - |
Локальное | Transaldolase A | Putative maltodextrin utilization protein YvdJ | TALA_ECOLI | MALA_BACSU | 36.0 | 54.5 | 81.8 | 0 | 0 | 3.5 | 3.7 |
Очень маленькие параметры выравниваний, такие как Score, Identity, Similarity, а также покрытия локального выравнивания, говорят о том, что белки не являются гомологичными и не содержат гомологичных участков.
Я взяла мнемонику FLAV. Рекомендованное полное имя белка из ECOLI: Flavodoxin 1.
Следующим запросом было найдено 35 белков c мнемоникой FLAV:
infoseq 'sw:FLAV_*' -only -name -nohead -out id_FLAV.txt
Помимо FLAV_ECOLI и FLAV_BACSU я выбрала: