Поиск гипотетических гомологов QUEC_BACSU в разных банках

Результаты поиска представлены в таблице 1.
  Поиск по Swiss-Prot Поиск по PDB Поиск по "nr"

1. Лучшая находка (с последовательностью исходного белка)

Accession O31675.1 NP_389255.1 3BL5_A
E-value 3e-164 3e-165 2e-162
Вес (в битах) 459 459 459
Процент идентичности 100% 100% 100%

2. Число находок с E-value < 10–10

415 2 2819

3. "Худшая из удовлетворительных" находка (последняя в выдаче с E-value < 1)

Номер находки в списке описаний 562 8 3232
Accession Q30SP2.1 2E18 A YP_001736917.1
E-value 0,95 0.78 1,0
Вес (в битах) 33,5 30,4 38,5
% идентичности 29% 29% 31%
% сходства 53% 52% 58%
Длина выравнивания 341 257 260
Координаты выравнивания (от-до, в запросе и в находке) В запросе: 4-120; в находке: 3-118 В запросе: 6-64; в находке: 25-83 В запросе: 3-69; в находке: 13-80
Число гэпов 121 59 68

Табл. 1. Результаты поиска гипотетических гомологов в разных банках.

Исходный белок был найден во всех БД.
Больше всего явных гомологов было найдено в nr, поскольку эта БД включает в себя много источников, в т.ч., надо полагать, и Swiss-Prot с PDB.
Количество находок зависело от максимального e-value, которое я выставлял сам. Количество находок отражено в таблице.

Поиск гипотетических гомологов изучаемого белка с фильтром по таксонам

Для эукариот хитов не было (для е-value меньше 0,001). Первый гомолог был встречен в филуме Actinobacteria.
Таксон Actinobacteria
Accession Q2J7K8.1
E-value 3e-40
Вес (в битах) 139
% идентичности 37%
% сходства 52%
Длина выравнивания 236
Координаты выравнивания (от-до, в запросе и в находке) В запросе: 2-213; в находке: 13-230
Число гэпов 12

Таблица 2. Гомолог из таксона наивысшего порядка, не содержащего при этом вид.

BLAST двух последовательностей

На рис. 1 показано выравнивание QUEC_BACSU и его гомолога Q2J7K8. Выравнивание в .fasta:

>gi|110816226|sp|Q2J7K8.1|QUEC_FRASC/1-236 
MNPTRGAVGGTDPRPAAVVLLSGGLDSATVLAIANQQGFACHALSFRYGQRHEVELAAARRVASALGVVRHV
VVDIDLGVFGGSALTDPTIAVPAAGTAEEIPVTYVPARNTIFLSFGLALAETAGAWDVFIGASSVDYSGYPD
CRPEYLAAYQAMANLATKATVSGERTLSVHAPLMHLSKADTIRLGLSLG-VDY--GLTHSCYDPGPDGRPCG
RCDSCSLRERGFTEVGVPDPAGG
>gi|81341924|sp|O31675.1|QUEC_BACSU/1-219 
-----------MKKEKAIVVFSGGQDSTTCLLWALKEFEEVETVTFHYNQRHSQEVEVAKSIAEKLGVKNHL
LDMSLLNQLAPNALTRNDIEIEV--KDGELPSTFVPGRNLVFLSFASILAYQIGARHIITGVCETDFSGYPD
CRDEFVKSCNVTVNLAM------EKPFVIHTPLMWLNKAETWKLADELGALDFVKNNTLTCYN-GIIADGCG
ECPACHLRSKGYEEYMVMKGERA

На рис. 2 и 3 представлены карты локального сходства Q2J7K8 и QUEC_BACSU.

Рис. 1. Выравнивание белков.

Рис. 2. Карта локального сходства при е-value не более 10.

Рис. 3. Карта локального сходства при е-value не более 0,01.

© Ляпунов Александр, 2012.       Дата последнего изменения: 26.12.2012