BLAST

Гомологи белка "Type IV secretion system protein" бактерии Bartonella krasnovii

В практикуме 7 мы рассматривали белок системы секреции IV бактерии Bartonella krasnovii,который участвует в бактериальной конъюгации и доставке бактериальных эффекторных белков в цитоплазму клеток-хозяев млекопитающих с целью нарушения клеточных функций хозяина. Поэтому ещё интереснее будет изучить гомологичные белки у других патогенных бактерий, это может продвинуть нас в понимании работы белков системы секреции IV и навести на идеи новых антибиотиков.

Было решено производить поиск по FASTA последовательности

search
search2

Затем был установлен фильтр на процент идентичности от 30%, чтобы отсеять часть случайно гомологичных белков. Получилось 14 последовательностей. Уже можно сделать вывод, что этот белок довольно специфичен.

текстовый файл результатов поиска

Интересно, что наибольший процент идентичности - у неохарактеризованного белка из Methanocaldococcus jannaschii. термофильная метаногенная архея. Выглядит он следующим образом:

MJ0781
Рис.1 Uncharacterized protein MJ0781 из Methanocaldococcus jannaschii
T4SS
Рис.2 Type IV secretion system protein из Bartonella krasnovii
выравнивание 3D структуры
Рис.3 Совмещение гомологичных белков из археи (красный) и бактерии (голубой)

Для выравнивания мы выбрали:
-- Q58191.1 RecName: Full=Uncharacterized protein MJ0781; Contains: RecName: Full=Mja klbA intein [Methanocaldococcus jannaschii DSM 2661] - чтобы оценить гомологию с наиболее идентичным белком
-- Q6FYW0.1 RecName: Full=Type IV secretion system protein VirB11 [Bartonella quintana str. Toulouse] - чтобы сравнить с бактерией того же рода что и наша B. krasnovii
-- Q9RNC7.1 RecName: Full=Type IV secretion system protein VirB11 [Bartonella henselae str. Houston-1]
-- Q8FXK7.1 RecName: Full=Type IV secretion system protein VirB11 [Brucella suis 1330] - сравнить с бактерией другого рода
-- Q7WDT5.1 RecName: Full=Type IV secretion system protein PtlH homolog [Bordetella bronchiseptica RB50] - сравнить с гомологом нашего белка

Выравнивание производим в Jalview с помощью Web Service - Alignment - Muscle with defaults

Белок из археи в два раза длинее - 721 аминокислота, в то время как у белков T4SS примерно 360 АА. Вероятно, такой разницей в длине и объясняется высокая степень идентичности.
В выравнивании получилось очень много гэпов. Хотя есть и консервативные участки: 209-282 ; 322-327 ; 336-351; 364-374; 408-439. Удалим его из выравнивания, заменим белком бактерии из рода Brucella: Type IV secretion system protein VirB11 [Brucella abortus bv. 1 str. 9-941].

Видим, что белок из Bordetella bronchiseptica RB50 действительно гомологичен. Эта бактерия может привести к инфекционному бронхиту, но редко заражает людей. Микроорганизм находится в эволюционном родстве с Bordetella pertussis, вызывающей коклюш у человека. Факт патагенности бактерии объясняет наличие сисемы секреции IV типа.

файл Jalview с выравниванием белков системы сикреции IV

Гомологи вирусного белка

Мы выбрали New York virus (NYV):

ID: GP_NYV

AC: Q83887; Q83886; Q83888

выбрали отдельную цепь - Glycoprotein N (18..652)

Извлекаем последовательность в файл:

extractseq -sequence Q83887.txt -outseq Glycoprotein_N.fasta -regions 18-652

Выбрали следующие белки: Q83887.1 (наш NYV),Q9E006.1, P41265.1, P27315.1, P16853.1, P16493.1, P17880.1.

файл Jalview с выравниванием вирусных белков

Можно уверенно заявить, что все белки гомологичны. Выделять какие-то отдельные участки консервативности нет смысла, так как они раполагаются почти на всём протяжении. Инделей также очень немного.

Исследование Е-value

Для всех найденных белков E-value 0.00, то есть находки сверхдостоверны. Для этого задания выберем другой белок. Например, Glycoprotein_C того же вируса NYV.

При обоих вариантах поиска нашлось 22 белка. После череды E-value = 0.00, то есть 18 почти идентичных белков, идут 4 менее похожих. Например, oдин из них - A6XIP3.1 идентичен на 25.21% нашему. Без указания среди каких организмов искать E-value = 1e-04, с указанием Viruses (taxid:10239) - 4e-06.

  E-value = Kmne-λS    

При указании таксона мы изменили только n - размер базы данных, по которой ищем, m - длина исходной последовательности мы не меняли, как и S - вес, K и λ вообще константы. Отношениие n(+viruses) к n(standart) будет показателем додли вирусных белков в базе:

n (+viruses)/ n (standart) = 4*10-6 / 1*104 *100%= 4%