Программа BLAST

Гомологи белка TcdB в Swiss-Prot

Параметры, которые были использованы при запуске BLAST:

Было найдено 100 последовательностей (с текстовой выдачей программы можно ознакомиться по ссылке)

Было отобрано 5 находок, затем проведено множественное выравнивание (ознакомиться с ним можно по ссылке), белков, не гомологичных моему, не оказалось. Гомологичность этих пяти белков можно обосновать наличием заметных консервативных участков.


Гомологи зрелого вирусного белка, вырезанного из полипротеина

Я нашла в Swiss-Prot полипротеин с ID – POLN_EEEV1; AC – Q306W6; OS – Eastern equine encephalitis virus (strain PE-0.0155) (EEEV) (Eastern equine encephalomyelitis virus), затем выбрала зрелый белок RNA-directed RNA polymerase nsP4, его координаты: 1864-2471.

grep -B 10000 "^FT.*HELIX\|^//" UP001510562.swiss.gz | grep -A 1 -B 10000 "^FT.*HELIX" | grep "^//" | wc -l

grep -B 10000 "^FT.*TRANSMEM\|^//" UP001510562.swiss.gz | grep -A 1 -B 10000 "^FT.*TRANSMEM" | grep "^//" | wc -l

было установлено, что количество записей, содержащих ключ HELIX и TRANSMEM в поле FT, равно 0.

Это может быть связано с тем, что данный протеом представлен преимущественно нерецензированными записями (TrEMBL), для которых аннотации вторичной структуры и трансмембранных доменов не являются обязательными и часто отсутствуют.


Оценка количества ферментов в протеоме

Поисковый запрос №1: (keyword:KW-0378) AND (proteome:UP001510562)

Количество находок: 252

Находятся только белки, аннотированные ключевым словом Hydrolase, то есть только один класс ферментов (гидролазы).


Поисковой запрос №2: (ec:*) AND (proteome:UP001510562)

Количество находок: 540

Находятся все белки, у которых есть EC-номер (Enzyme Commission number). EC-номер присваивается только белкам с экспериментально подтверждённой ферментативной активностью, независимо от класса фермента.


Разница между оценками (540 vs 245) показывает, что гидролазы составляют около 45% от всех ферментов протеома, а остальные 55% приходятся на другие классы.