Работа с протеомами и изучение EMBOSS


Сравнение протеомов

В этой части задания необходимо было сравнить состав протеомов бактерии Escherichia coli strain K-12 и бактерии Helicobacter himalayensis, изученной нами в прошлом семестре. К сожалению, в базе данных Uniprot не оказалось протеома для данной бактерии, поэтому вместо него был взят протеом близкородственного организма Helicobacter ailurogastricus.

Далее было проведено сравнение долей белков функциональных групп в двух организмах, в частности, трансмембранных белков, ферментов и уреаз.
Результаты сравнения приведены в таблице 1.

Таблица 1. Сравнение протеомов бактерий
Escherichia coli Helicobacter ailurogastricus
Proteome ID UP000000625 UP000041394
Количество белков 4391 1595
Количество белков в Swiss-Prot 4389 0
Количество трансмембранных белков 946 (21.54%) 270 (16.92%)
Количество ферментов 1676 (38.16%) 512 (32.10%)
Количество уреаз 0 (0%) 2 (0.13%)
Количество ферментов, работающих с полисахаридами(4.2.2.* - acting on polysaccharides) 9 (0.2%) 2 (0.13%)

Ниже можно увидеть запросы в UniProt, результаты которых представлены в таблице.
Уреазы
ec:3.5.1.5 AND organism:"Escherichia coli (strain K12) [83333]" AND proteome:up000000625
ec:3.5.1.5 AND organism:"Helicobacter ailurogastricus [1578720]" AND proteome:up000041394

Трансмембранные белки
annotation:(type:transmem) AND organism:"Escherichia coli (strain K12) [83333]" AND proteome:up000000625
annotation:(type:transmem) AND organism:"Helicobacter ailurogastricus [1578720]" AND proteome:up000041394

Ферменты
ec:* AND organism:"Escherichia coli (strain K12) [83333]" AND proteome:up000000625
ec:* AND organism:"Helicobacter ailurogastricus [1578720]" AND proteome:up000041394


Ферменты,работающие с полисахаридами
ec:4.2.2.* AND organism:"Escherichia coli (strain K12) [83333]" AND proteome:up000000625
ec:4.2.2.- AND organism:"Helicobacter ailurogastricus [1578720]" AND proteome:up000041394


Выводы

Видно, что количество ферментов и трансмембранных белков у Escherichia coli превосходит таковое y Helicobacter Ailurogastricus как в абсолютном количестве (это объясняется тем, что геном кишечной палочки в 2.75 раза больше генома геликобактерии), так и в относительном(по процентам).
Уреаза является ферментом, играющим ключевую роль в механизме патогенности Helicobacter. Этот фермент разлагает мочевину до аммиака и углекислого газа, создавая щелочную среду. Разлагая мочевину, содержащуюся в желудочном соке, Helicobacter создает вокруг себя область нейтрального pH и потому способна выжить на эпителии желудка.
В то же время существуют сведения о чрезвычайно низкой патогенности Helicobacter ailurogastricus[1]. Поэтому был проведен поиск этого фермента в протеоме двух бактерий, чтобы определить, не является ли отсутствие фермента причиной данного явления. Как оказалось, фермент всё-таки присутствует в протеоме, и справедливо было бы написать количество уреаз равным единице, так как на запрос было выдано 2 субъединицы одного фермента.
В Escherichia coli такого фермента обнаружено не было, что представляется логичным, так как кишечная палочка приспособлена к существованию в щелочной среде и дополнительное защелачивание среды не требуется.
Escherichis coli и Helicobacter ailurogastricus являются грамотрицательными бактериями, соответственно, в их клеточной стенке много липополисахаридов. Поэтому было решено просмотреть ферменты, работающие с полисахаридами. По большей части это оказались муреиновые трансгликозилазы - ферменты, осуществляющие ветвление полисахарида муреина. Видно, что в Escherichia coli этих ферментов всё же больше.Примечательно, что в протеоме E.coli наблюдается большее разнообразие трансгликозилаз - есть как эндолитические, так и экзолитические ферменты. В то же время у Helicobacter alilurogastricus есть только эндолитические ферменты.

Получение зрелого белка вируса MERS

В этой части задания необходимо было получить последовательность одного из зрелых белков вируса. В нашем случае это вирус MERS - Коронавирус ближневосточного респираторного синдрома. В качестве искомого зрелого белка была выбрана гуанинметилтрансфераза. Для получения fasta-файла были использованы следующие команды:
1. Скачивание полной записи для полипротеина из UniProt
entret 'sw:K9N7C7' 'r1ab_cvemc.entret'
2. Получение списка всех участков из таблицы локальных особенностей с ключом "CHAIN"
grep 'FT CHAIN' r1ab_cvemc.entret
Результаты выполнения команды №2

FT   CHAIN           1..193
FT   CHAIN           194..853
FT   CHAIN           854..2740
FT   CHAIN           2741..3247
FT   CHAIN           3248..3553
FT   CHAIN           3554..3845
FT   CHAIN           3846..3928
FT   CHAIN           3929..4127
FT   CHAIN           4128..4237
FT   CHAIN           4238..4377
FT   CHAIN           4378..5310
FT   CHAIN           5311..5908
FT   CHAIN           5909..6432
FT   CHAIN           6433..6775
FT   CHAIN           6776..7078

3. Cохранение одной выбранной цепи
seqret 'sw:K9N7C7[5909:6432]' 'transferase.fasta'
4. Редактирование строки заголовка fasta
descseq transferase.fasta transferase.fasta -name "Guanine-N7 methyltransferase PRO_0000422451"

Полученный файл можно посмотреть здесь

Описание утилиты fuzzpro из пакета EMBOSS

Утилита fuzzpro ищет заданный паттерн в белковой последовательности. У неё есть несколько аргументов:

-sequence - аргумент, указывающий белковую последовательность,в которой будет искаться паттерн.

-pattern - задаёт паттерн. В нем используются однобуквенные обозначения аминокислот. Если допустима любая кислота, то ставится знак x. Если аминокислота в какой-то позиции может варьироваться, то на этой позиции в квадратных скобках записываются все варианты. Если вариантов аминокислот так много, что легче указать, какие кислоты не встречаются в этой позиции, то они записываются в фигурных скобках. Повторение можно указывать цифрой в скобках после определённой аминокислоты (С(3) = ССС). Если последовательность может идти как в направлении N-C, так и в C-N, то она заключается в угловые скобки.

-outport - файл, куда записывается отчет о результатах поиска.

Был произведён поиск паттерна F{AT}KX{S} в последовательности метилтрансферазы коронавируса MERS. Результаты поиска можно посмотреть тут

Список литературы
[1] - Divergence between the Highly Virulent Zoonotic Pathogen Helicobacter heilmannii and Its Closest Relative, the Low-Virulence “Helicobacter ailurogastricus” sp. nov. doi: 10.1128/IAI.01300-15