Множественное выравнивание.

Для множественного выравнивания необходимо из банка Swiss-Prot найти последовательности вирусных белков-дельта-антигенов.

Результат поиска выдал 34 последовательности.delta.fasta

Поместив даный файл в GeneDoc получили такую картину:

Сохранено в delta.msf

Проведём выравнивание программой muscle.Для этого воспользуемся командой: muscle -in delta.fasta -out delta_muscle.fasta .

Теперь полученный файл delta_muscle.fasta запускаем в GeneDoc.Получаем:

 

Сохранено в delta_muscle.msf

Как видно,даже невыравненные последовательности содержат консервативные участки.Но то,что это белки-гомологи блестяще видно после выравнивания.Программа muscle справилась с выравниванием на "отлично",вставив очень небольшое количество гэпов.

2)Произведём поиск белков-гомологов.Найдём белки с E-value меньше 0,001 ;с процентом идентичности от 40% до 80% ;принадлежащим таксону Bacteria и не принадлежащим слишком родственным организмам.

Результаты поиска: найдено 7 белков,удовлетворяющих выше сказанным условиям.

Вот результаты бласта для каждого из них:

sp|Q57M90.1|ECOT_SALCH  RecName: Full=Ecotin; Flags: Precursor
Length=162
Score =  275 bits (702),  Expect = 4e-74, Method: Compositional matrix adjust.
Identities = 129/161 (80%), Positives = 143/161 (88%), Gaps = 2/161 (1%)
 
sp|A1JL79.1|ECOT_YERE8  RecName: Full=Ecotin; Flags: Precursor
Length=168
Score =  207 bits (527),  Expect = 9e-54, Method: Compositional matrix adjust.
Identities = 94/138 (68%), Positives = 109/138 (78%), Gaps = 0/138 (0%)
 
sp|A8GCA1.1|ECOT_SERP5  RecName: Full=Ecotin; Flags: Precursor
Length=170
Score =  203 bits (517),  Expect = 1e-52, Method: Compositional matrix adjust.
Identities = 94/137 (68%), Positives = 108/137 (78%), Gaps = 0/137 (0%)
 
sp|Q02NQ8.1|ECOT_PSEAB  RecName: Full=Ecotin; Flags: Precursor
Length=156
Score =  178 bits (451),  Expect = 6e-45, Method: Compositional matrix adjust.
Identities = 86/160 (53%), Positives = 112/160 (70%), Gaps = 6/160 (3%)
 
sp|Q4UMT9.1|ECOTL_RICFE  RecName: Full=Ecotin-like protein
Length=162
Score =  138 bits (348),  Expect = 6e-33, Method: Compositional matrix adjust.
Identities = 72/140 (51%), Positives = 88/140 (62%), Gaps = 1/140 (0%)
 
sp|Q1H1S3.1|ECOTL_METFK  RecName: Full=Putative ecotin-like protein; Flags: Precursor
Length=161
Score =  131 bits (330),  Expect = 6e-31, Method: Compositional matrix adjust.
Identities = 57/125 (45%), Positives = 81/125 (64%), Gaps = 1/125 (0%)
 
sp|Q8EEQ7.1|ECOT_SHEON  RecName: Full=Ecotin; Flags: Precursor
Length=183
 
Score =  121 bits (303),  Expect = 8e-28, Method: Compositional matrix adjust.
Identities = 61/148 (41%), Positives = 92/148 (62%), Gaps = 2/148 (1%)
 

Сохранено в gomologi.msf

По полученной картине даже невозможно сказать,что данные белки-гомологи!Но проведём выравнивание программой muscle и убедимся,что это не так.

Полученный файл:gomologi_muscle.fasta

Наглядное отображение GeneDoc:

Сохранено в gomologi_muscle.msf.

В данном выравнивании можно обнаружить два промежутка,содержащих консервативные участки.

Это промежутки  со 58 по 143 а.о. и  со 154 по 176 а.о.,что по моему белку ECOT_ECOLI :58-142;152-174.

Можно сказать,что выравнивание недостоверно на  участке со 144 по 150; а также со 179 колонки выравнивание особого смысла не имеет.( по моему белку: 144-148; и с №176.)

Об этих промежутках мы можем сказать,что они содержат гэпы и поэтому выравнивание на этих участках может не нести биологического смысла.

Однако следует помнить,что консервативными являются не только участки,выделенные чёрным цветом.Но об этом сложно судить,возможно некоторые участки можно объединить,но будет ли это участок консервативным со 100%-ной точностью говорить нельзя.


©Терешкова Алеся,2009