1. Поиск гомологов белка Cpaf из бактерии Chlamydia trachomatis в банке UniProt/SwissProt

Был проведен поиск гомологов последовательности белка Chlamydial protease-like activity factor бактерии Chlamydia trachomatis. Поиск производился с помощью программы protein blast на сайте NCBI.

Рис.1. Таблица с найденными гомологами и их параметрами.

Из находок был выбран белок chlamydial protease-like activity factor из бактерии Candidatus Protochlamydia amoebophila. Параметры находки приведены в таблице 1.

Description Max score Total score Query cover E value Ident Accession
chlamydial protease-like activity factor [Candidatus Protochlamydia amoebophila] 275 275 93% 2x10-80 32% BAM93530.1
Расшифровка столбцов выходной таблицы:
  • Description - имя и описание белка
  • Max score - максимальный вес выравнивания найденной последовательности относительно данной
  • Total score - суммарный вес выравниваний гомологичных участков данной и найденной последовательностей
  • Query cover - сколько процентов от найденной последовательности занято гомологичными данной участками
  • E value - число различных выравниваний с весом выравнивания не меньше данного, которые найдутся в базе данных случайным образом.
  • Ident - процент идентичных аминокислот.
  • Accession - код доступа белка в базе данных.

На том же ресурсе было сделано выравнивание данной последовательности с выбранной.

Query  24   ESLVCKNALQDLSFLEHLLQVKYAPKTWKEQYLGWDLVQSSVSAQQKLRTQENPSTSFCQ  83
            E +   + ++DL  ++H+  V YAP  WK+ Y G DL +    +   + +    +    Q
Sbjct  28   EDIKKGSMIEDLKMIKHVFDVGYAPLEWKKNYTGLDLDEELNKSIDLILSNPTLTHKDFQ  87

Query  84   QVLADFIGGLNDFHAGVTFFAIESAYLPYTVQKSSDGRFY--FVDIMTF---SSEIRVGD  138
            +++ +F+    D+H  V FF+ E+A LP+ V K  + R++  ++D +     +  I+VGD
Sbjct  88   RIVKNFLASTKDYHVDVIFFSTETATLPFDV-KGVNNRYFITWIDELKLPPSTYTIKVGD  146

Query  139  ELLEVDGAPVQDVLATL--YGSNHKGTAAEESAALRTLFSRMASLGHKVPSGRTTLKIRR  196
            E++E DG P+ DV+  L   GS +     +++ A   L +R+  LG  +P G  T+K+  
Sbjct  147  EIIEFDGRPLGDVIEELKQQGSKNSNPLTDQALAEIKLTNRLGWLGDIIPQGPVTIKVH-  205

Query  197  PFGTTREV----RVKWRYVPEGVGDLATIAPSIRAPQLQKSMRSFFPKKDDAFHRSSSLF  252
                ++EV    ++ W Y PE +      +PS       +++ SFFP K  +        
Sbjct  206  --SRSKEVPLSYQLIWDYRPELI-----FSPSF----FLQTVESFFPNKKISVR------  248

Query  253  YSPMVPHFWAELRNHYATSGLKSGYNIGSTDGFLPVIGPVIW-------ESEGLFRAYIS  305
             SP +      L +    S  K    + +   F+P +GP +W       E E  + AYI 
Sbjct  249  -SPCMTMM--NLTHRKMMSETKRDGTLCARKSFIPTLGPRVWMFDKIDKEKEISWYAYIY  305

Query  306  SVTDGDGKSHKVGFLRIPTYSWQDMEDFDPSGPPPWEEFAKIIQVFSSNTEALIIDQTNN  365
             +++      K+G++RIP Y     E          +EF +++      T+AL+IDQ +N
Sbjct  306  KISE----EEKIGYIRIPHYIGYKEES---------KEFGELLNYLEQKTDALVIDQVHN  352

Query  366  PGGSVLYLYALLSMLTDRPLELPKHRMILTQDEVVDALDWLTLLENVDTNVESRLALGDN  425
             GG   + Y L SML   PL+ PKH+M +TQ +V+ A   L ++E +   ++      D 
Sbjct  353  GGGYASFQYELASMLALNPLKTPKHQMKITQKDVLTAYQILDVIEKIQQGID------DE  406

Query  426  MEGYTVDLQVAEYLKSFGRQVLNCWSKGDIELSTPIPLFGFEKIHPHPRVQYSKPICVLI  485
            +E   +D Q   +LK+F    +  W  G   L+ P  L G + I+PH   +Y+KPI +LI
Sbjct  407  VEEGPIDYQHLLFLKAFYEFTIQEWD-GQRTLTDPTHLEGCDWINPHSDYRYTKPILMLI  465

Query  486  NEQDFSCADFFPVVLKDNDRALIVGTRTAGAGGFVFNVQFPNRTGIKTCSLTGSLAVREH  545
            NE DFS  DF P +++DN RA++ GTRT+GAGGFV    FPN  GI   S TGS+A R  
Sbjct  466  NELDFSGGDFMPAIMQDNQRAVLFGTRTSGAGGFVLQASFPNNNGIAAFSYTGSIAERPE  525

Query  546  GAF-IENIGVEPHIDLPFTANDIRYKGYSEYLDKVKKLVCQLI  587
                IEN+GV P I    T +D++  GY  Y   V + +  LI
Sbjct  526  TLLKIENLGVTPDIVYSLTVDDLQ-NGYQGYKAAVNEAIQALI  567

Выровнялись участки с 24 по 587 аминокислотных остатка у данной последовательности и с 28 по 567 у выбранной. Идентичных данной аминокислот в выбранной последовательности 185/583 (32%), схожих аминокислот - 294/583 (50%). Всего с данной последовательностью выровнялось 97% найденной (563 остатка).

2. Карта локального сходства двух последовательностей

С помощью BLAST (опция Align two sequences) была построена карта локального сходства данной и выбранной последовательностей. Она приведена на рисунке 2.

Рис.2. Карта локального сходства последовательностей белка CPAF Chlamydia trachomatis (по горизонтали) и Protochlamydia amoebophila (по вертикали). Сплошной линией отмечены соотнесенные участки. Разрывы - гэпы в первой или во второй последовательности.

Судя по карте, на всем выровненном участке последовательности прослеживается гомология, за исключением коротких гэпов. Это правдоподобно, поскольку белки выполняют одну и ту же функцию, а бактерии находятся в одном классе.

Гомологи в других таксонах

Результаты были отфильтрованы по таксону с помощью опции Organism из вкладки Formatting options на странице результатов. Сначала я посмотрела наличие гомологов в эукариотах, но их не было. Я выбрала тип Proteobacteria. Среди них оказалось 23 последовательности, из них все протеазы/пептидазы или их функция неизвестна.

Рис.3. Гомологи белка CPAF среди представителей типа Proteobacteria.

Хотя Ident лежит в пределах 31-39%, что схоже с белком из Protochlamydia amoebophila, параметр Query cover гораздо ниже - видимо, виды достаточно удалены от хламидии, и гомология прослеживается только в определенных консервативных областях белка.

Из находок было выбрано 9 последовательностей и произведено множественное выравнивание (опция Multiple alignment в разделе Descriptions). Его можно скачать здесь.

Рис.4. Участок множественного выравнивания гомологов CPAF среди Proteobacteria в JalView. Раскраска ClustalX с консервативностью 100%.

В выравнивании заметны участки (ближе к концу последовательностей) с большим числом совпадающих аминокислот. Видимо, в эти участки входит активный центр белков, или они играют важную роль в структуре.


© Kholina Tatiana, 2013