Карта локального сходства двух полипротеинов

Рисунок 1. Карта локального сходства

Таблица 1. Характеристики двух лучших выравниваний

Range 1 Range 2
% identity 29 30
% positives 48 44
Length 615|644 410|431
Gaps 55 73
Score 253 bits (646) 159 bits (402)
Protein name Protein 3CD(Protease 3C; RNA-directed RNA polymerase)|Picornain 3C; RNA-directed RNA polymerase 3D-POL Protein 2B; Protein 2C|Protein 2B; Protein 2C

Сравнение веса выравнивания со случайным

Предположительно гомологичные белки (PLSY_ECOLI/PLSY_BACSU)

Таблица 2. Характеристики распределения весов случайных выравниваний и вес оптимального биологического выравнивания
shuffle 100 shuffle 1000
Median 44.25 43.50
Quartile (75%) 49.75 49.00
Score (PLSY_ECOLI/PLSY_BACSU) 253.50
Bit score 39.04 39.18
P-value 1.76*10^-12 1.60*10^-12

Предположительно негомологичные белки (GALU_ECOLI/GALT_BACSU)

Таблица 3. Характеристики распределения весов случайных выравниваний и вес оптимального биологического выравнивания
shuffle 100 shuffle 1000
Median 46.25 47.5
Quartile (75%) 53.25 53.50
Score (GALU_ECOLI/GALT_BACSU) 253.5
Bit score 30.61 35.33
P-value 6.11*10^-10 2.31*10^-11

BLAST: поиск гомологов в банке

Идентификатор белка: AMW06251.1; Gemmatimonas phototrophica

Таблица 4. Характеристики 2 лучших выравниваний
The best The second best
Protein name N-acetylglucosamine-6-sulfatase Extracellular sulfatase SULF-1 homolog
Entry name (ID) GNS_CAPHI SULF1_DROME
UniProt AC P50426 Q9VEX0
Organism Capra hircus HLK1 Drosophila melanogaster
% identity 29 29
% positives 45 48
Length 433|467 367|372
Gaps 66 37
Score 168 bits (425) 171 bits (434)
Expect 4e-45 5e-45
% coverage 95.4 80.8

Интересно что значения Expect отличаются на 5 порядков при частном сравнении двух схожих последовательностей и при поиске всех схожих последовательностей. Так же, видимо в частном сравнении с Extracellular sulfatase SULF-1 homolog была допущена обшибка при записи в поле Query cover при частном сравнении двух последовательностей (91% вместо 81%)