BLAST

Гомологи белка Pectinesterase A организма Dickeya dadantii в Swissprot

Параметры, использованные при поиске гомологов исследуемого белка, представлены в таблице 1.

Table 1.Parameters
Database UniprotKB/Swiss-Prot
Algorithm blastp (protein-protein BLAST)
Max target sequences 100
Expect threshold 0.05
Word size 6
Max matches in a query range 0
Matrix BLOSUM62
Gap Costs Existence: 11 Extension: 1
Compositional adjustments Conditional compositional score matrix adjustment

Текстовую выдачу программы можно найти здесь.

Выбранный белок и его 5 гомологов представлены в таблице 2.

Table 2.Chosen proteins
ID ACCESSION
PMEA_DICD3 P0C1A9
PME3_CITSI P83948
ME17_ARATH O22149
PME23_ARATH Q8GXA1
PME58_ARATH Q9FJ21
PME2_CITSI O04887

Последовательности этих 6 белков были выровнены с помощью программы Jalview, результат можно увидеть здесь. Приведенные белки являются гомологичными, поскольку процент идентичности их парного выравнивания c Pectinesterase A Dickeya dadantii более 30%, а покрытие более 75%.

Однако стоит отметить негомологичность N-концов исследуемых 6 белков.

Гомологи зрелого вирусного белка, вырезанного из полипротеина, в Swissprot

Информация о выбранном вирусе и зрелом протеине, ссылка на проект представлены в таблице 3.
Table 3.Virus
ID POLN_AURAV
AC Q86924
OS Aura virus (AURAV)
mature protein mRNA-capping enzyme nsP1
coordinates 1..539
fasta-file file
blast output file
Jalview progect file

О гомологии протеинов говорят достаточно высокий процент индетичности (более 63%) попарных выравниваний 5 белков с выбранным белком при большом покрытии (более 87%) и значительное количество совпадений при множественном выравнивании в Jalview.

Гомологи зрелого вирусного белка, вырезанного из полипротеина, в Swissprot

Информация о E-value находок в BLAST представленa в таблице 4.
Table 4.E-value
Virus E-value (all DB) E-value (only viruses) E-value (only viruses)/E-value (all DB)
POLN_SLDV 4e-125 2e-126 0,05
POLN_SPDV 2e-124 9e-126 0,045

Поскольку E-value одного конкертного белка прямо пропорциональна размеру банка, используя данные таблицы 4, определим какой процент базы данных Swiss-Prot содержит записи о вирусных белках: примерно 5%.

Поиск "гомологов" бессмысленной последовательности

Использованная бессмысленная последовательность:

DEARIFEARWEREFACINGAPROBLEMYOULOVEMENOLONGERIKNOWANDMAYBETHEREISNOTHINGTHATICANDO

Длина: 81 а.о.

Параметры: по умолчанию

Результат: программа не нашла ни одного выравнивания

Однако после увеличения E-value с 0.05 до 5 было найдено одно выравнивание, а при увеличении E-value до 50 программа выдала 3 выравнивания.