BLAST
Гомологи белка "Type IV secretion system protein" бактерии Bartonella krasnovii
В практикуме 7 мы рассматривали белок системы секреции IV бактерии Bartonella krasnovii,который участвует в бактериальной конъюгации и доставке бактериальных эффекторных белков в цитоплазму клеток-хозяев млекопитающих с целью нарушения клеточных функций хозяина. Поэтому ещё интереснее будет изучить гомологичные белки у других патогенных бактерий, это может продвинуть нас в понимании работы белков системы секреции IV и навести на идеи новых антибиотиков.
Было решено производить поиск по FASTA последовательности


Затем был установлен фильтр на процент идентичности от 30%, чтобы отсеять часть случайно гомологичных белков. Получилось 14 последовательностей. Уже можно сделать вывод, что этот белок довольно специфичен.
текстовый файл результатов поискаИнтересно, что наибольший процент идентичности - у неохарактеризованного белка из Methanocaldococcus jannaschii. термофильная метаногенная архея. Выглядит он следующим образом:



Для выравнивания мы выбрали: -- Q58191.1 RecName: Full=Uncharacterized protein MJ0781; Contains: RecName: Full=Mja klbA intein [Methanocaldococcus jannaschii DSM 2661] - чтобы оценить гомологию с наиболее идентичным белком -- Q6FYW0.1 RecName: Full=Type IV secretion system protein VirB11 [Bartonella quintana str. Toulouse] - чтобы сравнить с бактерией того же рода что и наша B. krasnovii -- Q9RNC7.1 RecName: Full=Type IV secretion system protein VirB11 [Bartonella henselae str. Houston-1] -- Q8FXK7.1 RecName: Full=Type IV secretion system protein VirB11 [Brucella suis 1330] - сравнить с бактерией другого рода -- Q7WDT5.1 RecName: Full=Type IV secretion system protein PtlH homolog [Bordetella bronchiseptica RB50] - сравнить с гомологом нашего белка
Выравнивание производим в Jalview с помощью Web Service - Alignment - Muscle with defaults
Белок из археи в два раза длинее - 721 аминокислота, в то время как у белков T4SS примерно 360 АА. Вероятно, такой разницей в длине и объясняется высокая степень идентичности. В выравнивании получилось очень много гэпов. Хотя есть и консервативные участки: 209-282 ; 322-327 ; 336-351; 364-374; 408-439. Удалим его из выравнивания, заменим белком бактерии из рода Brucella: Type IV secretion system protein VirB11 [Brucella abortus bv. 1 str. 9-941].
Видим, что белок из Bordetella bronchiseptica RB50 действительно гомологичен. Эта бактерия может привести к инфекционному бронхиту, но редко заражает людей. Микроорганизм находится в эволюционном родстве с Bordetella pertussis, вызывающей коклюш у человека. Факт патагенности бактерии объясняет наличие сисемы секреции IV типа.
файл Jalview с выравниванием белков системы сикреции IVГомологи вирусного белка
Мы выбрали New York virus (NYV):
ID: GP_NYV
AC: Q83887; Q83886; Q83888
выбрали отдельную цепь - Glycoprotein N (18..652)
Извлекаем последовательность в файл:
extractseq -sequence Q83887.txt -outseq Glycoprotein_N.fasta -regions 18-652
Выбрали следующие белки: Q83887.1 (наш NYV),Q9E006.1, P41265.1, P27315.1, P16853.1, P16493.1, P17880.1.
файл Jalview с выравниванием вирусных белковМожно уверенно заявить, что все белки гомологичны. Выделять какие-то отдельные участки консервативности нет смысла, так как они раполагаются почти на всём протяжении. Инделей также очень немного.
Исследование Е-value
Для всех найденных белков E-value 0.00, то есть находки сверхдостоверны. Для этого задания выберем другой белок. Например, Glycoprotein_C того же вируса NYV.
При обоих вариантах поиска нашлось 22 белка. После череды E-value = 0.00, то есть 18 почти идентичных белков, идут 4 менее похожих. Например, oдин из них - A6XIP3.1 идентичен на 25.21% нашему. Без указания среди каких организмов искать E-value = 1e-04, с указанием Viruses (taxid:10239) - 4e-06.
E-value = Kmne-λS
При указании таксона мы изменили только n - размер базы данных, по которой ищем, m - длина исходной последовательности мы не меняли, как и S - вес, K и λ вообще константы. Отношениие n(+viruses) к n(standart) будет показателем додли вирусных белков в базе:
n (+viruses)/ n (standart) = 4*10-6 / 1*104 *100%= 4%