Программа BLAST
Гомологи белка TcdB в Swiss-Prot
Параметры, которые были использованы при запуске BLAST:
- Database: UniProtKB/Swiss-Prot(swissprot)
- Algorithm: blastp (protein-protein BLAST)
- Max target sequences: 100
- Automatically adjust parameters for short input sequences: no
- Expect threshold: 10
- Word size: 3
- Max matches in a query range: 0
- Matrix: BLOSUM62
- Gap Costs: Existence: 11, Extension: 1
- Compositional adjustments: Conditional compositional score matrix adjustment
- Filter: Low complexity regions – no
- Mask: Mask for lookup table only – yes; Mask lower case letters – no
Было найдено 100 последовательностей (с текстовой выдачей программы можно ознакомиться по ссылке)
Было отобрано 5 находок, затем проведено множественное выравнивание (ознакомиться с ним можно по ссылке), белков, не гомологичных моему, не оказалось. Гомологичность этих пяти белков можно обосновать наличием заметных консервативных участков.
Гомологи зрелого вирусного белка, вырезанного из полипротеина
Я нашла в Swiss-Prot полипротеин с ID – POLN_EEEV1; AC – Q306W6; OS – Eastern equine encephalitis virus (strain PE-0.0155) (EEEV) (Eastern equine encephalomyelitis virus), затем выбрала зрелый белок RNA-directed RNA polymerase nsP4, его координаты: 1864-2471.
grep -B 10000 "^FT.*HELIX\|^//" UP001510562.swiss.gz | grep -A 1 -B 10000 "^FT.*HELIX" | grep "^//" | wc -l
grep -B 10000 "^FT.*TRANSMEM\|^//" UP001510562.swiss.gz | grep -A 1 -B 10000 "^FT.*TRANSMEM" | grep "^//" | wc -l
было установлено, что количество записей, содержащих ключ HELIX и TRANSMEM в поле FT, равно 0.
Это может быть связано с тем, что данный протеом представлен преимущественно нерецензированными записями (TrEMBL), для которых аннотации вторичной структуры и трансмембранных доменов не являются обязательными и часто отсутствуют.
Оценка количества ферментов в протеоме
Поисковый запрос №1: (keyword:KW-0378) AND (proteome:UP001510562)
Количество находок: 252
Находятся только белки, аннотированные ключевым словом Hydrolase, то есть только один класс ферментов (гидролазы).
Поисковой запрос №2: (ec:*) AND (proteome:UP001510562)
Количество находок: 540
Находятся все белки, у которых есть EC-номер (Enzyme Commission number). EC-номер присваивается только белкам с экспериментально подтверждённой ферментативной активностью, независимо от класса фермента.
Разница между оценками (540 vs 245) показывает, что гидролазы составляют около 45% от всех ферментов протеома, а остальные 55% приходятся на другие классы.