Выравнивание последовательностей


Глобальное парное выравнивание гомологичных белков


Таблица 1.Глобальное парное выравнивание белков Escherichia coli и Bacillus subtilis

Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
Multifunctional CCA proteinCCA_ECOLICCA_BACSU213,522,6%37,5%12623
Acyl carrier proteinACP_ECOLIACP_BACSU216,060,3%71,8%11
GTPase DerDER_ECOLIDER_BACSU824,036,1%56,2%607

Локальное парное выравнивание гомологичных белков


Таблица 2.Локальное парное выравнивание белков Escherichia coli и Bacillus subtilis

>>>
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Multifunctional CCA proteinCCA_ECOLICCA_BACSU223,024,8%41,5%872190,3%89,4%
Acyl carrier proteinACP_ECOLIACP_BACSU216,061,0%72,7%0098,7%100,0%
GTPase DerDER_ECOLIDER_BACSU831,538,7%60,2%30392,5%97,9%

Глобальное и локальное выравнивание негомологичных белков


Таблица 3.Глобальное парное выравнивание негомологичных белков Escherichia coli и Bacillus subtilis

Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
Transcriptional activatory protein CaiF/Cell shape-determining protein MblCAIF_ECOLIMBL_BACSU17,05.7%10,8%31215

Таблица 4.Локальное парное выравнивание негомологичынх белков Escherichia coli и Bacillus subtilis

>
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Transcriptional activatory protein CaiF/Cell shape-determining protein MblCAIF_ECOLIMBL_BACSU38,023,2%40,6%14445,8%19,2%

Результаты, представленные в таблицах 3 и 4, были получены при выполнении программ выравнивания к неродственным белкам Escherichia coli и Bacillus subtilis. Таким образом, видно, что белок, определяющий форму клеток, Mbl и белок, активирующий транскрипцию, CaiF нисколько не родственны, так как процент идентичности их полных последовательностей составляет 5,7% , а вес выранивания - всего лишь 17,0. Благодаря программе water были произведены сравнительные расчеты более гомологичных участков полипептида, поэтому процент идентичности более близких последовательностей аминоксилот составил 23,2%, а вес выравнивания - 38,0. Исходя из вышеперечисленных фактов, можно сделать вывод о том, что данное выранивание не имеет никакого предназначения и смысла в целом, так как данные белки оказались нисколько не гомологичны, тем более проценты покрытия этих последовательнотей ничтожно малы: 19,2% и 45,8%.


Множественное выравнивание белков и импорт в Jalview


Мнемоника DER была выбрана для множественного выранивания. Помимо белков Escherichia coli и Bacillus subtilis были взяты белки Salmonella typhimurium(der_salty), Leptospira interrogans serogroup Icterohaemorrhagiae serovar Lai(der_lepin), Clostridium botulinum(der_cloba), Chlamydia trachomatis serovar A(der_chlta), Kosmotoga olearia(der_kosot). С помощью команды infoseq 'sw:DER_*' -only -name -nohead -out der.txt был получен список организмов с мнемоникой der. Выранивание было осуществлено с помощью Align и программы Muscle with Defaults. Трудно предположить,что данные белки гомологичны, так как существует очень мало участков, на которых все семь последовательностей идентичны. Однако есть участки, на которых эти последовательности гомологичны: 36,37,39-43,46,47,296-300,317-320. Ссылка на выраванивание в JalView:

Protein alignment