Учебный сайт Николаевой Дарьи

Главная Первый семестр Второй семестр Ссылки Обо мне Заметки

Базы последовательностей белков


В данном практикуме произведен анализ записей белка аспартатаминотрансферазы (идентификатор в базе Refseq NP_214350.1) из организма бактерии Aquifex aeolicus VF5 в различных базах данных.
Задание 1. Поиск идентификаторов записей белка аспартатаминотраснферазы в базах данных Uniprot, Uniref50, RefSeq Proteins, PDB.
В Таблице 1 приведены идентификаторы записей белка аспартатаминотрансферазы в базах данных Uniprot, Uniref50, RefSeq Proteins, PDB.
Таблица 1. Идентификаторы записей белка NP_214350.1 (аспартатаминотрансферазы) Aquifex aeolicus VF5 в разных базах данных.

База данных Идентификатор
Uniprot (ID) AAT_AQUAE
Uniprot (AC) O67781
Uniref50 UniRef100_O67781, UniRef90_O67781, UniRef50_O67781
RefSeq Proteins NP_214350.1. WP_010881286.1, AAC07746.1, AE000657.1, NC_000918.1
PDB -

Задание 2. Описание истории изменений записи Uniprot для белка аспартатаминотрансферазы.

Дата создания первой версии: 01/08/1998
Дата создания последней версии: 11/03/2015

Комментарий некоторых произошедших изменений:
  1. В 8 записях добавлена информация об особенностях частей последовательности (о цепи и сайтах связывания):

    Изображение не загрузилось
    Рис.1. Пример добавления информации об особенностях частей последовательности.

  2. Добавлены 32 новые ссылки на другие базы данных:

    Изображение не загрузилось
    Рис.2. Пример добавления ссылок на другие базы данных.

  3. Добавлена аннотация: 1 запись о номере публикации, 3 записи об авторах публикации, 2 записи о названии публикации, 1 запись о журнале и 10 записей с комментариями:

    Изображение не загрузилось
    Рис.3. Пример добавления информации о публикации и комментариев.



Задание 3. Сравнение записи в Uniprot белка аминотрансферазы и белков-гомологов.

В этом задании рассматривались записи белка аспартатаминотрансферазы и 3 белков-гомологов: аспартатаминотрансферазы, аминотрансферазы I и II и аспартаттрансаминазы в организмах рода Thermus, родственным роду Aquifex. При анализе сравнивались функции, особенности строения, длина белка, наличие записи в PDB и источник появления записи.
Были обнаружены следующие сходства и различия:
  • Проверенным экспериментально является только белок гомолога, по которому был произведен поиск остальных гомологов, последовательность остальных установлена аналитическим способом с помощью компьютерных методов по гомологии.
  • Длина белка примерно одинакова у всех гомологов.
  • Функции ни у одной записи не определены.
  • Черты строения описаны только у аспартатаминострасферазы Aquifex aeolicus и Thermus thermophilus, при этом стуктуры Aquifex совпадают с частью структур thermophilus.
  • PBD есть только для thermophilus.

В Таблице 2 представлены вышеупомянутые черты.

Задание 4. Пример обозначения полиморфизма в Uniprot.

  1. В Uniprot в строке FT (Feature Table) представлена информация об особенностях частей последовательности. В этой строке словом VARIANT обозначаются полиморфизмы, варианты в последовательности нуклеиновой кислоты.
    Пример обозначения в Uniprot данного явления:
    FT VARIANT 49 49 A -> P (in dbSNP:rs713598).

    Пример взят из нуклеотидной последовательности геномной ДНК (идентификатор в Uniprot T2R38_HUMAN).
  2. В поле FT словом NON_STD обозначаются нестандартные (неканонические) аминокислоты: селеноцистеин и пирролизин - с соответствующими ключами (Selenocysteine, Pyrrolysine).
    Пример обозначения в Uniprot данных явлений:
    • Селеноцистеин: FT NON_STD 196 196 Selenocysteine.
      Пример взят из аминокислотной последовательности большой субъединицы формиатдегидрогеназы у организма Escherichia coli (strain K12) (идентификатор в Uniprot FDNG_ECOLI).
    • Пирролизин: FT NON_STD 356 356 Pyrrolysine. {ECO:0000250}.
      Пример взят из последовательности белка диметиламинметилтрансферазы MtbB1 у организма Methanosarcina acetivorans (strain ATCC 35395 / DSM 2834 / JCM 12185 / C2A) (идентификатор в Uniprot MTBB1_METAC).
  3. Пример обозначения посттрансляционной модификации белка (обозначается словом MOD_RES - модифицированный аминокислотный остаток) на примере фосфорилирования тирозина в последовательности опухолевого белка p73 у человека (идентификатор в Uniprot P73_HUMAN):
    FT MOD_RES 28 28 Phosphotyrosine; by SRC and HCK.
  4. Пример обозначения изоформ белка - продуктов альтернативного сплайсинга (обозначение VAR_SEQ) в последовательности опухолевого белка p73 у человека (идентификатор в Uniprot P73_HUMAN):
    FT VAR_SEQ 400 636 Missing (in isoform 11).
  5. В той же последовательности присутствует пример аминокислотного остатка, участвующего в связывании иона (обозначение в FT - METAL):
    FT METAL 262 262 Zinc. {ECO:0000250}.
  6. Сайты белка, участвующие в связывании с ДНК, обозначаются DNA_BIND (на примере белка STE12 в организме Kluyveromyces lactis (strain ATCC 8585 / CBS 2359 / DSM 70799 / NBRC 1267 / NRRL Y-1140 / WM37) (Yeast) (Candida sphaerica), идентификатор в Uniprot STE12_KLULA).
    FT DNA_BIND 51 161 {ECO:0000250}.
  7. Дисульфидные связи в белке (обозначаются DISULFID) покажем на примере белка 108 у организма Solanum lycopersicum (Tomato) (Lycopersicon esculentum), идентификатор в Uniprot 108_SOLLC).
    FT DISULFID 41 77 {ECO:0000250}.
  8. Удаление инициаторного метионина обозначается словом INIT_MET с ключом Removed (на примере неохарактеризованного человеческого белка C1orf198, идентификатор в Uniprot CA198_HUMAN).
    FT INIT_MET 1 1 Removed. {ECO:0000269|PubMed:12665801,
    FT ECO:0000269|PubMed:22814378}.

© 2014 Дарья Николаева