Выравнивания. Jalview

Глобальное парное выравнивание гомологичных белков

Protein Name
ID 1

ID 2

Score

Identity, %

Similarity, %

Gaps

Indels
Putative regulator AbrB ABRB_ECOLI ABRB_BACSU 5.0 0.5 0.9 420 2
Flavodoxin 1 FLAV_ECOLI FLAV_BACSU 153.5 27.0 45.4 36 9
Iron-sulfur cluster assembly protein SufB SUFB_ECOLI SUFB_BACSU 938.0 39.6 57.9 34 10

В полных названиях белков есть небольшие разночтения:

Локальное парное выравнивание гомологичных белков


Protein Name

ID 1

ID 2

Score

Identity, %

Similarity, %

Gaps

Indels

Coverage ECOLI, %

Coverage BACSU, %
Putative regulator AbrB ABRB_ECOLI ABRB_BACSU 27.0 36.4 81.8 0 0 3.2 11.5
Flavodoxin 1 FLAV_ECOLI FLAV_BACSU 157.0 33.1 54.5 10 4 65.9 73.4
Iron-sulfur cluster assembly protein SufB SUFB_ECOLI SUFB_BACSU 948.0 41.1 59.7 24 8 96.0 97.8

Комментарии к выравниваниям

Белки ABRB_ECOLI и ABRB_BASCU не являются гомологичными. У них очень маленькие значения Score, Identity и Similarity в выравниваниях, а покрытие локального выравнивания очень маленькое, что говорит об очень низкой гомологии.
Белки FLAV_ECOLI и FLAV_BACSU могут быть гомологичными. Судя по локальному выравниванию они имеют достаточно большой гомологичный участок, который не включает концы белков.
Белки SUFB_ECOLI и SUFB_BACSU скорее всего гомологичные. У них достаточно большой Score и другие параметры выравниваний. Локальное выравнивание содержит в себе почти полностью последовательности белков, за исключением начальных аминокислот.
Мне кажется, что для первой пары белков более информативно глобальное выравнивание, т.к. там особенно хорошо видно полное отсутствие гомологии последовательностей. Для второй и третьей пары белков параметры глобального и локального выравнивания очень схожи, но локальное все-таки точнее определяет гомологичные участки из-за его алгоритма. За счет этого локальное выравнивание получается короче, ведь оно включается только гомологичный участок и по его покрытию удобно судить о величине гомологичного участка.
Локальное выравнивание не пытается обе последовательности "растянуть" одну на другую, а именно ищет участки с наиболее похожим паттерном. Поэтому многие буквы, сопоставленные в локальном выравнивании оказались не сопоставлены в глобальном.

Результат применения программ выравнивания к неродственным белкам

Тип выравнивания Protein Name 1 Protein Name 2 ID 1 ID 2 Score Identity, % Similarity, % Gaps Indels Coverage ECOLI, % Coverage BACSU, %
Глобальное Transaldolase A Putative maltodextrin utilization protein YvdJ TALA_ECOLI MALA_BACSU 8.0 3.1 5.9 474 6 - -
Локальное Transaldolase A Putative maltodextrin utilization protein YvdJ TALA_ECOLI MALA_BACSU 36.0 54.5 81.8 0 0 3.5 3.7

Очень маленькие параметры выравниваний, такие как Score, Identity, Similarity, а также покрытия локального выравнивания, говорят о том, что белки не являются гомологичными и не содержат гомологичных участков.

Множественное выравнивание белков и импорт в Jalview

Я взяла мнемонику FLAV. Рекомендованное полное имя белка из ECOLI: Flavodoxin 1.
Следующим запросом было найдено 35 белков c мнемоникой FLAV:
infoseq 'sw:FLAV_*' -only -name -nohead -out id_FLAV.txt
Помимо FLAV_ECOLI и FLAV_BACSU я выбрала:

Был составлен файл FLAV.txt содержащий ID выбранных белков. Далее был получен файл содержащий fasta всех 7 белков:
seqret @FLAV.txt FLAV.fasta
Далее было сделано множественное выравнивание muscle:
muscle -align FLAV.fasta -output FLAV_alignment.fasta
Полученное выравнивание было загружено в Jalview: проект выравнивания.
Судя по множественному выравниванию белки не гомологичны, однако пара FLAV_ECOLI и FLAV_SALTY скорее всего гомологичны ввиду большой схожести последовательности. Во множественном выравнивании есть более ли менее гомологичные участки с 1-21, 53-59, 80-81, 91-98, 123-124, 167-170, но их мало и паттерн гомологии всех белков не прослеживается.