1.
Извлечение из банка Uniprot документа,
содержащего информацию о моём белке
- На сервере kodomo программа entret способна извлечь информацию о
необходимом белке из локальных баз
данных
- Командой cd последовательно переходим в рабочую директорию
- Командой (entret sw:this_bacsu > this_bacsu.entret) записали
информацию о моём белке в файл this_bacsu.entret
2.
Открытие документа программой less и заполнение
таблицы
|
Метка поля
|
Содержание
|
Код(ы) доступа ("Accession number")
|
AC
|
O31607
|
Идентификатор записи в БД
|
ID
|
THIS_BACSU
|
Название (краткое описание) белка
|
DE
|
RecName: Full=Sulfur carrier protein ThiS;
AltName: Full=Thiamine biosynthesis protein ThiS
|
Дата создания документа
|
DT
|
02-MAR-2010, integrated into UniProtKB/Swiss-Prot.
|
Дата последнего исправления аннотации
|
DT
|
25-JAN-2012, entry version 62.
|
Число публикаций, использованных при создании документа
|
RN
|
4
|
Журнал и год самой поздней публикации
|
RL
|
Chem. Biol. 11:1373-1381(2004)
|
Ключевые слова
|
KW
|
3D-structure; Complete proteome;
Nucleotide-binding; Reference proteome;
Thiamine biosynthesis.
|
Что содержит поле комментариев?
|
CC
|
FUNCTION: Is the sulfur donor in the synthesis of the
thiazole phosphate moiety of thiamine
phosphate.
PATHWAY: Cofactor biosynthesis; thiamine diphosphate
biosynthesis.
SUBUNIT: Forms heterodimers with thiG.
PTM: C-terminal thiocarboxylation occurs in 2 steps,
it is first acyl-adenylated (-COAMP) by
thiF, then thiocarboxylated (-COSH) by
thiI (By similarity).
SIMILARITY: Belongs to the sulfur carrier protein
ThiS family.
-----------------------------------------------------------------------
Copyrighted by the UniProt Consortium, see
http://www.uniprot.org/terms
Distributed under the
Creative Commons
Attribution-NoDerivs
License
Расшифровка содержания
поля комментариев: «function»
– функция, «subunit»
- в каком метаболическом пути участвует,
«ptm» - где в клетке находится, «similarity»
- к какому семейству белков относится,
а также пара слов об авторских правах и
типе лицензии
|
Идентификаторы записей PDB
|
DR
|
1TYG
|
3.
Ответы на
вопросы о моём белке
Вопрос №9:
Какой функции белка посвящена одна из
статей, упомянутых в документе?
Ответ:
В третьей статье говорится о функции
серы в переносе триазола (line 58/134)
|
Вопрос №13:
Получите последовательность 2-й
альфа-спирали, используя команду seqret
пакета EMBOSS.
Ответ:
-IQDLLAS-
В моём белке только
одна спираль, поэтому мы не можем
получить последовательность 2-й
альфа-спирали. В таком случае получим
последовательность этой единственной
спирали моего белка с помощью команды (seqret
sw:this_bacsu first_helix.fasta -sbegin
18 -send 24). Эта последовательность
будет записана в файл
first_helix.fasta в fasta-формате.
|
Вопрос №14.1:
Получите последовательность 3-го
бета-тяжа, используя команду seqret
пакета EMBOSS.
Ответ:
-IVER-
Последовательность
3-ого бета-тяжа мы можем получить
командой (seqret sw:this_bacsu
third_strand.fasta -sbegin 33 -send 36).
Эта последовательность запишется в файл
third_strand.fasta в fasta-формате.
|
Вопрос №14.2:
Последовательности большинства белков
начинаются с метионина. Почему? После
биосинтеза в процессе созревания белка
метионин может быть удален. Указан ли
метионин в начальной позиции заданного
белка? А удаляется ли он потом?
Ответ:
Трансляции всех мРНК и , соответственно,
синтез белка в большинстве случаев
начинается с AUG-кодона (стартового
кодона), кодирующего метионин. (бактериальные белки начинаются с N-формилметионина,
потому что их старт-кодоны соответствуют
тРНК, несущей его). В последовательности
аминокислот моего белка метионин стоит в
начальной позиции (на первом месте).
Информация о последующем удалении
метионина отсутствует, но думаю, что он
отщепляется уже после трансляции.
|
4.
Определение количества белков в UniProt, имеющих тот же код белка или
примерно то же описание (DE), что и мой белок. Заполнение таблицы
Для поиска
белков в банке
SwissProt
мы можем воспользоваться командой
infoseq:
- Выполнили следующую команду (infoseq sw:this_*
-only -description -noheading | wc --line).
Параметрами (-only -description -noheading)
задали команде выдать только описание белков без заголовков, а командой
(wc --line) подсчитали количество строк.
- В результате получили всего два белка с кодом "this".
Для поиска на сайте
UniProt:
- в верхней части страницы есть комбобокс «Search in...» и поле для
ввода запроса или команды «Query...»
- в «Search in» выбираем UniProtKB, а в поле «Query» вводим запрос* —
несколько слов из описания моего белка
- нажимаем на кнопку «Search»
- вверху страницы находим интересующую нас информацию о числе находок в
SwissProt и в TrEMBL
*Кроме запроса можно вводить различные команды, используя “name”, “AND”,
“OR” и др.
Запрос/Команда
|
Число записей в SwissProt
|
Число записей в TrEMBL
|
infoseq sw:this_* -only -description -noheading
| wc --line
|
2
|
-
|
"sulfur carrier protein"
|
840
|
3 677
|
"biosynthesis protein"
|
6 144
|
81 633
|
"thiamine
biosynthesis protein"
|
739
|
5 806
|
"sulfur carrier protein" "thiamine
biosynthesis protein"
|
290
|
1 540
|
name:"sulfur carrier protein"
|
364
|
1 992
|
name:"biosynthesis protein"
|
6 129
|
81 362
|
name:"sulfur carrier protein" AND
name:"biosynthesis protein"
|
294
|
1 512
|
name:"sulfur carrier protein" OR
name:"biosynthesis protein"
|
6 199
|
81 842
|
5.
Сравнение записи моего белка с записью другого
белка с похожим описанием
- Командой (entret sw:this_ecoli > this_ecoli.entret) записали информацию о
белке с похожим описанием в файл
this_ecoli.entret
- Заполнили таблицу, имея текстовые файлы с информацией
о двух схожих белках.
|
Метка поля
|
THIS_BACSU
|
THIS_ECOLI
|
Первый код доступа
|
AC
|
O31617
|
O32583; Q2M8S8
|
Идентификатор последовательности в БД
|
ID
|
THIS_BACSU
|
THIS_ECOLI
|
Название (краткое описание) белка
|
DE
|
RecName:
Full=Sulfur carrier protein ThiS;
AltName:
Full=Thiamine biosynthesis protein ThiS
|
RecName:
Full=Sulfur carrier protein ThiS;
AltName:
Full=Thiamine biosynthesis protein ThiS
|
Дата создания документа
|
DT
|
02-MAR-2010
|
15-JUL-1998
|
Дата последнего исправления аннотации
|
DT
|
25-JAN-2012
|
25-JAN-2012
|
Название организма
|
OS
|
Bacillus subtilis
|
Escherichia coli (strain K12)
|
Классификация организма (список таксонов)
|
OC
|
Bacteria;
Firmicutes; Bacillales; Bacillaceae;
Bacillus
|
Bacteria;
Proteobacteria; Gammaproteobacteria;
Enterobacteriales;
Enterobacteriaceae; Escherichia
|
Длина последовательности
|
SQ
|
66 AA
|
66 AA
|
Молекулярная масса белка
|
SQ
|
7626 MW
(MW – Molar
Weight)
|
7311 MW
|
Число публикаций, использованных при создании документа
|
RN
|
4
|
9
|
Журнал и год самой поздней публикации
|
RL
|
Biochemistry 43:11647-11657(2004)
|
Biochemistry 45:11-19(2006)
|
Описание вторичной структуры
|
FT
|
STRAND: 2-4; 12-14; 33-36; 39-41; 53-62
HELIX: 18-24
TURN: 44-48
|
STRAND:
3-5; 8-10;
32-36; 56-61
HELIX: 18-25; 43-45
TURN: 46-48
|
Ключевые слова
|
KW
|
3D-structure;
Complete proteome; Nucleotide-binding;
Reference
proteome; Thiamine biosynthesis
|
3D-structure;
Complete proteome; Nucleotide-binding;
Reference
proteome; Thiamine biosynthesis;
Thioester bond
|
Темы, освещённые в комментариях
|
CC
|
FUNCTION; PATHWAY; SUBUNIT; PTM; SIMILARITY
|
FUNCTION;
PATHWAY; PTM;
MASS SPECTROMETRY; SIMILARITY
|
Особенности последовательности
|
FT
|
нет
|
нет
|
Идентификаторы записей PDB
|
DR
|
1TYG
|
1F0Z; 1ZUD
|
Сравнивая
эти два белка можем заметить, что у них есть как сходства, так и
различия.
Сходства:
- код белка у обоих "this"
- краткое описание
- дата последнего исправления аннотации
- длина последовательности
- журнал самой поздней публикации
Различия:
- первых кодов доступа у второго белка 2, а у моего только 1
- дата создания документа (у моего белка на 12 лет позже)
- молекулярная масса моего белка больше (7626>7311)
- у второго белка публикаций, использованных в создании документа больше
(9>4)
- последняя публикация у второго белка была на два года позже (в 2006
году)
- тем, освещённых в комментариях у второго белка немного больше
В Ы В О Д:
Оба белка хорошо исследованы и сходны по
строению, поэтому на основании исследований E.coli можно делать выводы о
функционировании белка Bacillus subtilis.
|
Главная |