В этой части задания необходимо было сравнить состав протеомов бактерии Escherichia coli strain K-12 и бактерии
Helicobacter himalayensis, изученной нами в прошлом семестре.
К сожалению, в базе данных Uniprot
не оказалось протеома для данной бактерии, поэтому вместо него был взят протеом близкородственного организма Helicobacter ailurogastricus.
Далее было проведено сравнение долей белков функциональных групп в двух организмах, в частности, трансмембранных белков, ферментов и уреаз.
Результаты сравнения приведены в таблице 1.
Escherichia coli | Helicobacter ailurogastricus | |
Proteome ID | UP000000625 | UP000041394 |
Количество белков | 4391 | 1595 |
Количество белков в Swiss-Prot | 4389 | 0 |
Количество трансмембранных белков | 946 (21.54%) | 270 (16.92%) |
Количество ферментов | 1676 (38.16%) | 512 (32.10%) |
Количество уреаз | 0 (0%) | 2 (0.13%) |
Количество ферментов, работающих с полисахаридами(4.2.2.* - acting on polysaccharides) | 9 (0.2%) | 2 (0.13%) |
Ниже можно увидеть запросы в UniProt, результаты которых представлены в таблице.
Уреазы
ec:3.5.1.5 AND organism:"Escherichia coli (strain K12) [83333]" AND proteome:up000000625
ec:3.5.1.5 AND organism:"Helicobacter ailurogastricus [1578720]" AND proteome:up000041394
Трансмембранные белки
annotation:(type:transmem) AND organism:"Escherichia coli (strain K12) [83333]" AND proteome:up000000625
annotation:(type:transmem) AND organism:"Helicobacter ailurogastricus [1578720]" AND proteome:up000041394
Ферменты
ec:* AND organism:"Escherichia coli (strain K12) [83333]" AND proteome:up000000625
ec:* AND organism:"Helicobacter ailurogastricus [1578720]" AND proteome:up000041394
Ферменты,работающие с полисахаридами
ec:4.2.2.* AND organism:"Escherichia coli (strain K12) [83333]" AND proteome:up000000625
ec:4.2.2.- AND organism:"Helicobacter ailurogastricus [1578720]" AND proteome:up000041394
Выводы
Видно, что количество ферментов и трансмембранных белков у Escherichia coli превосходит таковое y Helicobacter Ailurogastricus как в абсолютном количестве
(это объясняется тем, что геном кишечной палочки в 2.75 раза больше генома геликобактерии), так и в относительном(по процентам).
Уреаза является ферментом, играющим ключевую роль в механизме патогенности Helicobacter. Этот фермент разлагает мочевину до аммиака и углекислого газа,
создавая щелочную среду. Разлагая мочевину, содержащуюся в желудочном соке, Helicobacter создает вокруг себя область нейтрального pH и потому способна
выжить на эпителии желудка.
В то же время существуют сведения о чрезвычайно низкой патогенности Helicobacter ailurogastricus[1]. Поэтому был проведен поиск этого фермента в протеоме
двух бактерий, чтобы определить, не является ли отсутствие фермента причиной данного явления. Как оказалось, фермент всё-таки присутствует в протеоме, и справедливо
было бы написать количество уреаз равным единице, так как на запрос было выдано 2 субъединицы одного фермента.
В Escherichia coli такого фермента обнаружено не было, что представляется логичным, так как кишечная палочка приспособлена к существованию в щелочной среде
и дополнительное защелачивание среды не требуется.
Escherichis coli и Helicobacter ailurogastricus являются грамотрицательными бактериями, соответственно, в их клеточной стенке много
липополисахаридов. Поэтому было решено просмотреть ферменты, работающие с полисахаридами. По большей части это оказались муреиновые
трансгликозилазы - ферменты, осуществляющие
ветвление полисахарида муреина. Видно, что в Escherichia coli этих ферментов всё же больше.Примечательно, что в протеоме E.coli наблюдается
большее разнообразие трансгликозилаз - есть как эндолитические, так и экзолитические ферменты. В то же время у Helicobacter alilurogastricus есть только
эндолитические ферменты.
В этой части задания необходимо было получить последовательность одного из зрелых белков вируса. В нашем случае это вирус MERS - Коронавирус ближневосточного
респираторного синдрома. В качестве искомого зрелого белка была выбрана гуанинметилтрансфераза.
Для получения fasta-файла были использованы следующие команды:
1. Скачивание полной записи для полипротеина из UniProt
entret 'sw:K9N7C7' 'r1ab_cvemc.entret'
2. Получение списка всех участков из таблицы локальных особенностей с ключом "CHAIN"
grep 'FT CHAIN' r1ab_cvemc.entret
Результаты выполнения команды №2
FT CHAIN 1..193 FT CHAIN 194..853 FT CHAIN 854..2740 FT CHAIN 2741..3247 FT CHAIN 3248..3553 FT CHAIN 3554..3845 FT CHAIN 3846..3928 FT CHAIN 3929..4127 FT CHAIN 4128..4237 FT CHAIN 4238..4377 FT CHAIN 4378..5310 FT CHAIN 5311..5908 FT CHAIN 5909..6432 FT CHAIN 6433..6775 FT CHAIN 6776..7078
3. Cохранение одной выбранной цепи
seqret 'sw:K9N7C7[5909:6432]' 'transferase.fasta'
4. Редактирование строки заголовка fasta
descseq transferase.fasta transferase.fasta -name "Guanine-N7 methyltransferase PRO_0000422451"
Утилита fuzzpro ищет заданный паттерн в белковой последовательности. У неё есть несколько аргументов:
-sequence - аргумент, указывающий белковую последовательность,в которой будет искаться паттерн.
-pattern - задаёт паттерн. В нем используются однобуквенные обозначения аминокислот. Если допустима любая кислота, то ставится знак x.
Если аминокислота в какой-то позиции может варьироваться, то на этой позиции в квадратных скобках записываются все варианты.
Если вариантов аминокислот так много, что легче указать, какие кислоты не встречаются в этой позиции, то они записываются в фигурных скобках.
Повторение можно указывать цифрой в скобках после определённой аминокислоты (С(3) = ССС).
Если последовательность может идти как в направлении N-C, так и в C-N, то она заключается в угловые скобки.
-outport - файл, куда записывается отчет о результатах поиска.
Был произведён поиск паттерна F{AT}KX{S} в последовательности метилтрансферазы коронавируса MERS. Результаты поиска можно посмотреть
тут
Список литературы
[1] - Divergence between the Highly Virulent Zoonotic Pathogen Helicobacter heilmannii and Its Closest Relative,
the Low-Virulence “Helicobacter ailurogastricus” sp. nov. doi: 10.1128/IAI.01300-15