![]() | ![]() | ![]() | ![]() |
Протеомы в Uniprot |
Вернуться на страницу семестра Работа с протеомами в UniprotВ данной работе сравниваются протеомы Escherichia coli (штамма K12) [1] и Caulobacter crescentus (штамм NA1000 / CB15N) [2]. Также подробнее о Caulobacter crescentus вы можете узнать из моей предыдущей работы. Немного определений: Протеом — совокупность белков организма, производимых клеткой, тканью или организмом в определённый период времени. Или, более строго, это совокупность экспрессированных белков в данном типе клеток или в организме, в данный период времени при данных условиях. Протеом часто бывает больше, чем геном. Это связано с альтернативным сплайсингом, а также с посттрансляционной модификацией белков, например, их гликозилированием и фосфорилированием. В то время как геном определяется последовательностью нуклеотидов, протеом не сводится к сумме последовательностей аминокислот. Протеом включает в себя также пространственные структуры всех содержащихся в нём белков и функционального взаимодействия между ними [3]. Таблица 1. Идентификаторы и общие сведения
Таблица 2. Частоты остатков в протеомах
Красным в таблице отмечены разности, в которых преобладает Caulobacter crescentus. Сразу замечу, что в E. coli встретилось 3 селеноцистеина (U), но в таблице эта нестандартная аминокислота не приведена. Отмечу, что 3 самые встречаемые аминокислоты у бактерий одинаковые - аланин, лейцин, глицин. 3 самые редкие аминокислоты также совпадают - гистидин, триптофан, цистеин. Из таблицы видно, что в большинстве случаев процент какой-либо аминокислоты больше у E. coli, при этом разница в соотношении очень мала - меньше 1,5%. Только в исключительном случае разница довольно велика - 4,35% преобладание аланина у Caulobacter. В пользу E. coli самая большая разница - 1,59% изолейцина. Минимальная разница в содержаниях триптофана и треонина - 0,1%. Можно сделать вывод, что встречаемость аминокислот у этих бактерий очень близка, но в некоторых случаях довольно сильно отличается (аланин). Cправка о разнице между программами wordcount и compseqКоманда compseq выдаёт куда более полную информацию о встречаемости данного "слова", то есть команда может быть очень полезна, когда
нужно быстро понять особенности процентного распределения по "словам". Однако в команде wordcount есть большое преимущество - она выдаёт "слово" и число его встречаемости в порядке убывания встречаемости слов,
в то время как compseq выдаёт все возможные последовательности, даже с нулевой встречаемостью, но слова располагаются по алфавиту.
Источники [1] Proteomes - Escherichia coli (strain K12) [2] Proteomes - Caulobacter crescentus (strain NA1000 / CB15N) [3] Протеом, Wikipedia |