1. Поиск гомологов белка Cpaf из бактерии Chlamydia trachomatis в банке UniProt/SwissProt
Был проведен поиск гомологов последовательности белка Chlamydial protease-like activity factor бактерии Chlamydia trachomatis. Поиск производился с помощью программы protein blast на сайте NCBI.
![](../../images/resultpage.png)
Рис.1. Таблица с найденными гомологами и их параметрами.
Из находок был выбран белок chlamydial protease-like activity factor из бактерии Candidatus Protochlamydia amoebophila. Параметры находки приведены в таблице 1.
Description | Max score | Total score | Query cover | E value | Ident | Accession |
chlamydial protease-like activity factor [Candidatus Protochlamydia amoebophila] | 275 | 275 | 93% | 2x10-80 | 32% | BAM93530.1 |
- Description - имя и описание белка
- Max score - максимальный вес выравнивания найденной последовательности относительно данной
- Total score - суммарный вес выравниваний гомологичных участков данной и найденной последовательностей
- Query cover - сколько процентов от найденной последовательности занято гомологичными данной участками
- E value - число различных выравниваний с весом выравнивания не меньше данного, которые найдутся в базе данных случайным образом.
- Ident - процент идентичных аминокислот.
- Accession - код доступа белка в базе данных.
На том же ресурсе было сделано выравнивание данной последовательности с выбранной.
Query 24 ESLVCKNALQDLSFLEHLLQVKYAPKTWKEQYLGWDLVQSSVSAQQKLRTQENPSTSFCQ 83 E + + ++DL ++H+ V YAP WK+ Y G DL + + + + + Q Sbjct 28 EDIKKGSMIEDLKMIKHVFDVGYAPLEWKKNYTGLDLDEELNKSIDLILSNPTLTHKDFQ 87 Query 84 QVLADFIGGLNDFHAGVTFFAIESAYLPYTVQKSSDGRFY--FVDIMTF---SSEIRVGD 138 +++ +F+ D+H V FF+ E+A LP+ V K + R++ ++D + + I+VGD Sbjct 88 RIVKNFLASTKDYHVDVIFFSTETATLPFDV-KGVNNRYFITWIDELKLPPSTYTIKVGD 146 Query 139 ELLEVDGAPVQDVLATL--YGSNHKGTAAEESAALRTLFSRMASLGHKVPSGRTTLKIRR 196 E++E DG P+ DV+ L GS + +++ A L +R+ LG +P G T+K+ Sbjct 147 EIIEFDGRPLGDVIEELKQQGSKNSNPLTDQALAEIKLTNRLGWLGDIIPQGPVTIKVH- 205 Query 197 PFGTTREV----RVKWRYVPEGVGDLATIAPSIRAPQLQKSMRSFFPKKDDAFHRSSSLF 252 ++EV ++ W Y PE + +PS +++ SFFP K + Sbjct 206 --SRSKEVPLSYQLIWDYRPELI-----FSPSF----FLQTVESFFPNKKISVR------ 248 Query 253 YSPMVPHFWAELRNHYATSGLKSGYNIGSTDGFLPVIGPVIW-------ESEGLFRAYIS 305 SP + L + S K + + F+P +GP +W E E + AYI Sbjct 249 -SPCMTMM--NLTHRKMMSETKRDGTLCARKSFIPTLGPRVWMFDKIDKEKEISWYAYIY 305 Query 306 SVTDGDGKSHKVGFLRIPTYSWQDMEDFDPSGPPPWEEFAKIIQVFSSNTEALIIDQTNN 365 +++ K+G++RIP Y E +EF +++ T+AL+IDQ +N Sbjct 306 KISE----EEKIGYIRIPHYIGYKEES---------KEFGELLNYLEQKTDALVIDQVHN 352 Query 366 PGGSVLYLYALLSMLTDRPLELPKHRMILTQDEVVDALDWLTLLENVDTNVESRLALGDN 425 GG + Y L SML PL+ PKH+M +TQ +V+ A L ++E + ++ D Sbjct 353 GGGYASFQYELASMLALNPLKTPKHQMKITQKDVLTAYQILDVIEKIQQGID------DE 406 Query 426 MEGYTVDLQVAEYLKSFGRQVLNCWSKGDIELSTPIPLFGFEKIHPHPRVQYSKPICVLI 485 +E +D Q +LK+F + W G L+ P L G + I+PH +Y+KPI +LI Sbjct 407 VEEGPIDYQHLLFLKAFYEFTIQEWD-GQRTLTDPTHLEGCDWINPHSDYRYTKPILMLI 465 Query 486 NEQDFSCADFFPVVLKDNDRALIVGTRTAGAGGFVFNVQFPNRTGIKTCSLTGSLAVREH 545 NE DFS DF P +++DN RA++ GTRT+GAGGFV FPN GI S TGS+A R Sbjct 466 NELDFSGGDFMPAIMQDNQRAVLFGTRTSGAGGFVLQASFPNNNGIAAFSYTGSIAERPE 525 Query 546 GAF-IENIGVEPHIDLPFTANDIRYKGYSEYLDKVKKLVCQLI 587 IEN+GV P I T +D++ GY Y V + + LI Sbjct 526 TLLKIENLGVTPDIVYSLTVDDLQ-NGYQGYKAAVNEAIQALI 567
Выровнялись участки с 24 по 587 аминокислотных остатка у данной последовательности и с 28 по 567 у выбранной. Идентичных данной аминокислот в выбранной последовательности 185/583 (32%), схожих аминокислот - 294/583 (50%). Всего с данной последовательностью выровнялось 97% найденной (563 остатка).
2. Карта локального сходства двух последовательностей
С помощью BLAST (опция Align two sequences) была построена карта локального сходства данной и выбранной последовательностей. Она приведена на рисунке 2.
![](../../images/hit_matrix.png)
Рис.2. Карта локального сходства последовательностей белка CPAF Chlamydia trachomatis (по горизонтали) и Protochlamydia amoebophila (по вертикали). Сплошной линией отмечены соотнесенные участки. Разрывы - гэпы в первой или во второй последовательности.
Судя по карте, на всем выровненном участке последовательности прослеживается гомология, за исключением коротких гэпов. Это правдоподобно, поскольку белки выполняют одну и ту же функцию, а бактерии находятся в одном классе.
Гомологи в других таксонах
Результаты были отфильтрованы по таксону с помощью опции Organism из вкладки Formatting options на странице результатов. Сначала я посмотрела наличие гомологов в эукариотах, но их не было. Я выбрала тип Proteobacteria. Среди них оказалось 23 последовательности, из них все протеазы/пептидазы или их функция неизвестна.
![](../../images/proteobacteria.png)
Рис.3. Гомологи белка CPAF среди представителей типа Proteobacteria.
Хотя Ident лежит в пределах 31-39%, что схоже с белком из Protochlamydia amoebophila, параметр Query cover гораздо ниже - видимо, виды достаточно удалены от хламидии, и гомология прослеживается только в определенных консервативных областях белка.
Из находок было выбрано 9 последовательностей и произведено множественное выравнивание (опция Multiple alignment в разделе Descriptions). Его можно скачать здесь.
![](../../images/proteoconservative.png)
Рис.4. Участок множественного выравнивания гомологов CPAF среди Proteobacteria в JalView. Раскраска ClustalX с консервативностью 100%.
В выравнивании заметны участки (ближе к концу последовательностей) с большим числом совпадающих аминокислот. Видимо, в эти участки входит активный центр белков, или они играют важную роль в структуре.