BLAST и E-value


1. 10 последовательностей гомологичных белков, обнаруженных BLAST



Краткая информация


ACRecNameCoverage, %Identity, %E-valueHomology
AMW32606metal-dependent hydrolase [Fervidobacterium islandicum]
A7HKQ7UPF0173 metal-dependent hydrolase Fnod_063598811e-139
B7GGS0UPF0173 metal-dependent hydrolase Aflv_048899506e-71
B1YIR0UPF0173 metal-dependent hydrolase Exig_193499451e-60
A4WJ29UPF0173 metal-dependent hydrolase Pars_081099389e-50
B8IL50UPF0173 metal-dependent hydrolase Mnod_331598348у-41
B5ZMI8UPF0173 metal-dependent hydrolase Rleg2_151998344e-30
Q18EZ9UPF0173 metal-dependent hydrolase HQ_3368A91345e-23
Q57GK0Probable L-ascorbate-6-phosphate lactonase UlaG88220,007
Q58142Uncharacterized protein MJ073278235,0


Выравнивание 10 последовательностей белков JalView с блоками


Ссылка на JalView проект с выравниванием.
Согласно заданию, при помощи программы BLAST было выбрано 9 гомологичных последовательностей, 2 из которых с большим E-value. Для первых семи последовательностей и входящей было найдено несколько коротких блоков, что является аргументом в пользу гомологичности этих белков. Для белков с меньшим Е характерно наличие большего числа блоков. Для последних двух последовательностей было снижено число абсолютно консервативных позиций. С учётом этого допущения было найдено 2, либо 3 (в зависимости от последовательности) небольших блока с неоправданными заменами. Вывод: последние 2 последовательности (с E-value 0,007 и 5,0) не гомологичны входной последовательности. Названия дают намёки на гомологию первых 7 последовательностей, но не последних двух.

2. Перестановка доменов


1) Cro/Cl family transcriptional regulator (Z9JT31)
2) Helix-turn-helix domain protein (F6CLM1)
Эти последовательности были выбраны следующим образом:
В базе данных Pfam было взято семейство HTH-3 (helix-turn-helix), из него выбраны последовательность с 1 HTH-3 и с 3 HTH-3, чтобы изучить трипликацию. HTH-3 имеет длинну в 55 аминокислот. Эти данные получены из Pfam.


А эти результаты получены при помощи BLAST:


1) Z9JT31 (1-59): ABCDEF
2) F6CLM1 (1-186): ABCDEFgDEhBiCD
Согласно построениям BLAST, произошла не простая трипликация HTH-3, а нечто более интересное. Сначала последовательности полностью совпадают(ABCDEF), затем следует участок g. Далее находится дуплицированный участок (DE). После него участок h. И в самом конце стоит дуплицированный участок (BCD), в котором произошла вставка небольшого участка i. Таким образом, в наличии два примера дупликации (а участок D по факту является примером трипликации) и одна вставка. Вероятно в ходе эволюции появилась необходимость в большем колисчестве отдельных фрагментов HTH-3. Источники:
NCBI
Pfam


© Матвеев Андрей, 2017 AD