Учебный сайт Птицыной Елены

Cтудентки первого курса факультета биоинженерии и биоинформатики Московского государственного университета имени М.В. Ломоносова

Семестр 2, практикум 7

Назад на учебную страницу Птицыной Елены

EMBOSS и протеомы

На этом практикуме мы учились анализировать протеомы, используя командную строку Linux.

Записи

Для подсчета количества записей в геноме Escherichia coli была использована команда grep -c ">" Ecoli.fasta и то же для Rhodospirillum rubrum с другим именем файла. Команда grep служит для поиска строк, которые содержат заданный пользователем образец. Опция -c позволяет выводить не строки, содержащие заданный образец, а их количество.

Результаты представлены в Таблице 1.

Таблица 1. Количество записей в протеомах
Бактерия Escherichia coli (strain K12) (Strain: K12 / MG1655 / ATCC 47076) Rhodospirillum rubrum (strain ATCC 11170 / ATH 1.1.1 / DSM 467 / LMG 4362 / NCIB 8255 / S1)
Proteome ID UP000000625 UP000001929
Количество записей 4352 3835

Аминокислоты

Для анализа содержания аминокислотных остатков в геноме Escherichia coli была использована команда wordcount -sequence "Ecoli.fasta" -wordsize 1 -outfile "Ecoli_ak.wordcount" и то же для Rhodospirillum rubrum с другим именем файла. wordcount - команда из пакета EMBOSS для подсчета слов в молекулярных последовательностях. После -sequence указывается ссылка на анализируемую последовательность, -wordsize указывает на количество символов в одном слове. После -outfile в кавычках указывается имя выходного файла, в который будет записан результат работы. Полученные файлы, в каждом их которых содержится столбец однобуквенных названий аминокислот и столбец содержания аминокислотных остатков в штуках, Вы можете скачать по ссылкам: Ecoli_ak.wordcount, Rhodo_ak.wordcount.

Файлы были обработаны с помощью Excel (pr7_tabl.xlsx). Сравнительная таблица была переведена в html-код c помощью онлайн-конвертера. Чтобы было удобнее анализировать сравнительную таблицу, мы добавили столбец, в котором находятся значения, соответствующие не модулю разности процентного содержания, а разности процентного содержания.

Общее количество аминокислотных остатков представлено в Таблице 2.

Таблица 2. Количество аминокислотных остатков
Бактерия Escherichia coli (strain K12) (Strain: K12 / MG1655 / ATCC 47076) Rhodospirillum rubrum (strain ATCC 11170 / ATH 1.1.1 / DSM 467 / LMG 4362 / NCIB 8255 / S1)
Proteome ID UP000000625 UP000001929
Количество аминокислотных остатков 1353357 1292602

Сравнение содержания аминокислотных остатков в геномах E.coli и R.rubrum представлено в Таблице 3.

Таблица 3. Сравнение процентного содержания аминокислотных остатков в протеомах E.coli и R.rubrum
АК E.coli [%АК] R.rubrum [%АК] |Разность %| Разность %
A 9,5072 13,2759 3,7687 -3,7687
L 10,6763 11,2048 0,5285 -0,5285
G 7,3661 9,0766 1,7104 -1,7104
R 5,5205 7,5521 2,0316 -2,0316
V 7,0703 7,4988 0,4285 -0,4285
D 5,1469 5,7968 0,6499 -0,6499
P 4,4288 5,6843 1,2555 -1,2555
E 5,7623 5,4236 0,3387 0,3387
T 5,3945 5,2883 0,1062 0,1062
S 5,7991 5,0836 0,7155 0,7155
I 6,0115 4,7155 1,2960 1,2960
F 3,8944 3,4031 0,4913 0,4913
Q 4,4427 2,8232 1,6195 1,6195
K 4,4070 2,7891 1,6179 1,6179
M 2,8253 2,2616 0,5637 0,5637
N 3,9383 2,0477 1,8906 1,8906
H 2,2695 1,9694 0,3001 0,3001
Y 2,8449 1,9338 0,9112 0,9112
W 1,5321 1,2589 0,2733 0,2733
C 1,1621 0,9130 0,2491 0,2491
U 0,0002   0,0002 0,0002

Наиболее отличающиеся по содержанию аминокислотные остатки: в пользу E.coli - аспарагина, в пользу R.rubrum - аланина.

Самыми редкими аминокислотными остатками у E.coli являются остатки цистеина, триптофана и гистидина, у R.rubrum - цистеина, триптофана и тирозина. Может быть, это связано с тем, что триптофан, гистидин и тирозин - аминокислоты ароматические, со сложным путём биосинтеза, а цистеин содержит серу.

Самыми частными аминокислотными остатками у R.rubrum являются остатки глицина, аланина и лейцина, у R.rubrum - глицина, лейцина и аланина. Эти аминокислоты имеют несложный путь биосинтеза. Кроме того, глицин (вместе с серином) - основной источник одноуглеродных групп в клетке, предшественник пуриновых оснований и порфиринов, а также многих других соединений.

Linux - удобная операционная система со множеством полезных пакетов.