МГУ Учебная страница
Жуковой Надежды

Студентки факультета биоинженерии
и биоинформатики МГУ им. Ломоносова
ФББ

Сравнение аминокислотного состава протеомов E. coli (штамм K12) и Haloarcula marismortui (штамм ATCC 43049)

Протеом E. coli K 12: ID UP000000625, 4313 последовательностей, 1351630 ао

Протеом H. marismortui ATCC 43049: ID UP000001169, 4234 последовательностей, 1200597 ао


Таблица сравнения протеомов

АминокислотаE. coli, %H. marismortui, %Различия
A9.5114810.41482-0.90334
C1.160890.757120.40377
D5.149128.32636-3.17724
E5.765938.08964-2.32372
F3.892633.254130.63850
G7.370438.27805-0.90761
H2.267712.005250.26245
I6.009784.386481.62330
K4.405722.001172.40455
L10.675708.810371.86534
M2.822521.877820.94470
N3.936882.586301.35058
O0.000000.000000.00000
P4.428284.59055-0.16227
Q4.443383.123951.31943
R5.518606.11421-0.59561
S5.796635.95487-0.15824
T5.394016.91556-1.52155
U0.000220.000000.00022
V7.073028.64845-1.57543
W1.531851.147100.38476
Y2.844642.717810.12682

Комментарии к таблице:

  • В протеомах обоих организмов наиболее распостранены гидрофобные аминокислоты аланин и лейцин. В составе протеома H. marismortui наиболее распространены аланин (A), лейцин (L) и валин (V), а у E. coli самыми распостранёнными остатками являются лейцин (L), аланин (A) и глицин (G).
  • В протеомах обоих организмов наименее распостранены аминокислоты триптофан и цистеин. Самыми редкими аминокислотами у археи являются метионин (M), триптофан (W), цистеин (C), а у бактерии - гистидин (H), триптофан(W) и цистеин (C).
  • Наиболее значимо различаются протеомы по содержанию лизина (K) и аспартата (D): лизина на 2,41% больше в протеоме E. coli, аспартата на 3,18% больше в протеоме H. marismortui.
  • В записях протеомов в явном виде не представлено пирролизина (O), с помощью команды compseq было показано его отсутствие в протеоме H. marismortui, в протеоме E. coli compseq обнаруживает 8 аминокислот, отмеченных как X, поскольку пирролизин свойственен метаногенным археям, скорее всего он не входит в эти 8 остаков. Селеноцистеин (U) есть только у E. coli, всего 3 ао.

Материалы и методы:

  • Протеомы были скачаны из банка UniProt Proteomes.
  • Подсчет количества записей в геноме был произведен с помощью команды grep -c ">" Ecoli.fasta. Команда grep служит для поиска строк, которые содержат заданный пользователем образец. Опция -c позволяет вывести не строки, содержащие заданный образец, а их количество. Анализ содержания аминокислотных остатков в геноме Escherichia coli был произведен с помощию команды wordcount -sequence "Ecoli.fasta" -wordsize 1 -outfile "Ecoli_ak.wordcount". wordcount - команда из пакета EMBOSS для подсчета слов в молекулярных последовательностях. После -sequence указывается ссылка на анализируемую последовательность, -wordsize указывает на количество символов в одном слове. После -outfile в кавычках указывается имя выходного файла, в который будет записан результат работы.
  • Таблица создана вручную.