Учебный сайт Ксении Березиной

Протокол по Uniprot

Uniprot — база данных последовательностей белков. Она делится на два сегмента. Первый - это SwissProt, куда включены последовательности белков, для которых аннотация была сделана экспертом. Второй - TrEMBL - содержит последовательности, полученные с помощью компьютерной трансляции. Аннотация TrEMBL создаётся автоматически, и последовательностей в TrEMBL во много раз больше, чем в SwissProt.

С помощью ID Mapping идентификатор Refseq заданного белка был переведен в код доступа в Uniprot. Идентификатор в банке Uniprot — Q9YEQ6_AERPE.

Ортологи — белки общего происхождения из геномов представителей, например, одного рода, которые появляются в процессе видообразования. Необходимо найти два таких организмов рода Aeropyrum. Это гипертермофильные археи.

Поисковой запрос был таким:

go:"RNA binding" AND taxonomy:Aeropyrum NOT taxonomy:pernix

Поиск происходит по одному имеющему белку A.pernix — hypothetical protein (Q9YEQ6_AERPE). Поскольку название белка не связано с функцией (оно говорит лишь о том, что существование белка теоретическое, то есть предсказано по гену), поиск идет по полю Gene Ontology (GO): RNA binding [связывание РНК].

Uniprot выдал записи белков с такой функцией только еще одного вида — A.camini (отсюда берем белок с ID U3T8L7_9CREN), и они все из TrEMBL. Чтобы найти еще один похожий белок в другом (но близком) таксоне, я воспользовалась сервисом Blastp, который нашел гомологов первой последовательности. Из них мы возьмем белок Pyrolobus fumarii c ID G0EEX4_PYRF1. Это архея другого рода, но того же порядка Desulfurococcaceales.

Для каждого из трех белков был скачан файл со всей информацией о них:

Aeropyrum pernix

Aeropyrum camini

Pyrolobus fumarii

Эти данные структурированы в таблице 1.

Таблица 1. Сравнение белков трех ортологов.

Метка поляСодержание
Гипотетический белок Aeropyrum pernixГипотетический белок Aeropyrum caminiСодержащий домен PUA белок Pyrolobus fumarii
Идентификатор записиIDQ9YEQ6_AERPEU3T8L7_9CREN G0EEX4_PYRF1
Код доступа первый ("Accession number")ACQ9YEQ6U3T8L7G0EEX4
Код(ы) доступа остальныеACнетНетнет
Дата создания документаDT01-NOV-199911-DEC-201319-OCT-2011
Дата последнего исправления аннотацииDT16-OCT-201316-APR-201416-OCT-2013
Название (краткое описание) белкаDEUnchacterized proteinPredicted RNA-binding proteinPUA domain containing protein
Название организмаOSAeropyrum pernix (stin ATCC 700893 / DSM 11879 / JCM 9820 / NBRC 100138 / K1).Aeropyrum camini SY1 = JCM 12091Pyrolobus fumarii (strain DSM 11204 / 1A)
ТаксономияOCArchaea; Crenarchaeota; Thermoprotei; Desulfurococcales; Desulfurococcacea; Aeropyrum.Archaea; Crenarchaeota; Thermoprotei; Desulfurococcales; Desulfurococcaceae; Aeropyrum.Archaea; Crenarchaeota; Thermoprotei; Desulfurococcales; Pyrodictiaceae; Pyrolobus.
Название локуса генаGNAPE_0525.1ACAM_0403Pyrfu_0216
Номер публикцииRXPubMed=10382966; DOI=10.1093/dnares/6.2.83PubMed=23872576; DOI=10.1128/AEM.01089-13PubMed=21886865
Автор(-ы) публикацииRAKawabayasi Y., Hino Y., Horikawa H., Yamazaki S., Haikawa Y., Jin-no K., Takahashi M., Sekine M., Baba S., Ankai A., Kosugi H., Hosoyama A., Fukui S., Nagai Y., Nishijima K., Nakazawa H., Takamiya M., Masuda S., Funahashi T., Tanaka T., Kudoh Y.,Yamazaki J., Kushida N., Oguchi A., Aoki K., Kubota K., Nakamu Y., Nomu N., Sako Y., Kikuchi H.;Daifuku T., Yoshida T., Kitamura T., Kawaichi S., Inoue T., Nomura K., Yoshida Y., Kuno S., Sako Y.;Anderson I., Goker M., Nolan M., Lucas S., Hammon N., Deshpande S., Cheng J.F., Tapia R., Han C., Goodwin L., Pitluck S., Huntemann M., Liolios K., Ivanova N., Pagani I., Mavromatis K., Ovchinikova G., Pati A., Chen A., Palaniappan K., Land M., Hauser L., Brambilla E.M., Huber H., Yasawong M., Rohde M., Spring S., Abt B., Sikorski J., Wirth R., Detter J.C., Woyke T., Bristow J., Eisen J.A., Markowitz V., Hugenholtz P., Kyrpides N.C., Klenk H.P., Lapidus A.;
Название публикацииRT1) "Complete genome sequence of an aerobic hyper-thermophilic crenarchaeon, Aeropyrum pernix K1."; 2) "The structure of gene product APE0525 from Aeropyrum pernix."; 3) "Crystal structure of a PUA domain (APE0525) from the Aeropyrum pernix K1 (sulfate complex)."; 4) "Crystal structure of a PUA domain (APE0525) from the Aeropyrum pernix K1 (tartrate complex).";"Variation of the Virus-Related Elements within Syntenic Genomes of the Hyperthermophilic Archaeon Aeropyrum.""Complete genome sequence of the hyperthermophilic chemolithoautotroph Pyrolobus fumarii type strain (1A).
ЖурналRLDNA Res. 6:83-101(1999).Appl. Environ. Microbiol. 79:5891-5898(2013)Stand. Genomic Sci. 4:381-392(2011)
Чем обосновано существование белкаPEEvidence at protein levelPredictedPredicted
Ссылка (-и) на базу 3D структур PDBDR2ZX7, 2CX0, 2CX1нетнет
Реакция, катализируемая ферментомCC: CATALYTIC ACTIVITYнетнетнет
Расположение фермента внутри клеткиCC: SUBCELLULAR LOCATIONнетнетнет

Как видно по таблице, о белках известно нет так уж и много. Нет трехмерных PDB-структур у двух ортологов. Судя по всему, названия (Description) белков практически синонимичны: функция и домен у них одинаковые.

Ответы на вопросы из списка.

Предложите мутацию, которая, на Ваш взгляд, сильно повлияет на активность белка.

Активность белка в лице способности связывать РНК обеспечивает домен PUA. Он есть во всех трех белках. Можно поменять несколько аминокислот в нем (см. рисунок 1)

Рис.1. Участок мотива PUA, который можно удалить с целью уменьшения активности.

Какие ионы связываются с белком?

Для последовательности есть несколько структур в PDB. Самая богатая ионами — 2SZ7. Там есть 5 фосфат-ионов и один ион калия. Сайты связывания — это, в основном, кислород в карбониле и амидная группа (см. рисунок 2).

Рис.2. Сайты связывания ионов.

Укажите аминокислотный остаток (русское название, трехбуквенный код, номер в цепи), который модифицируется в белке после его трансляции, и охарактеризуйте эту модификацию.

В структуре 2SZ7 есть три модифицированных остатка: это селенометионин (MSE) в позициях 1, 111, 140. Это модификация метионина, в котором сера заменяется на селен (см. рисунок 3). Модификация делается намеренно для получения кристаллической структуры белка методом рентгеноструктурного анализа.

Рис.3. MSE.

Назад к второму семестру