Семестр 2, практикум 7
Назад на учебную страницу Птицыной ЕленыEMBOSS и протеомы
На этом практикуме мы учились анализировать протеомы, используя командную строку Linux.
Записи
Для подсчета количества записей в геноме Escherichia coli была использована команда grep -c ">" Ecoli.fasta и то же для Rhodospirillum rubrum с другим именем файла. Команда grep служит для поиска строк, которые содержат заданный пользователем образец. Опция -c позволяет выводить не строки, содержащие заданный образец, а их количество.
Результаты представлены в Таблице 1.
Бактерия | Escherichia coli (strain K12) (Strain: K12 / MG1655 / ATCC 47076) | Rhodospirillum rubrum (strain ATCC 11170 / ATH 1.1.1 / DSM 467 / LMG 4362 / NCIB 8255 / S1) |
---|---|---|
Proteome ID | UP000000625 | UP000001929 |
Количество записей | 4352 | 3835 |
Аминокислоты
Для анализа содержания аминокислотных остатков в геноме Escherichia coli была использована команда wordcount -sequence "Ecoli.fasta" -wordsize 1 -outfile "Ecoli_ak.wordcount" и то же для Rhodospirillum rubrum с другим именем файла. wordcount - команда из пакета EMBOSS для подсчета слов в молекулярных последовательностях. После -sequence указывается ссылка на анализируемую последовательность, -wordsize указывает на количество символов в одном слове. После -outfile в кавычках указывается имя выходного файла, в который будет записан результат работы. Полученные файлы, в каждом их которых содержится столбец однобуквенных названий аминокислот и столбец содержания аминокислотных остатков в штуках, Вы можете скачать по ссылкам: Ecoli_ak.wordcount, Rhodo_ak.wordcount.
Файлы были обработаны с помощью Excel (pr7_tabl.xlsx). Сравнительная таблица была переведена в html-код c помощью онлайн-конвертера. Чтобы было удобнее анализировать сравнительную таблицу, мы добавили столбец, в котором находятся значения, соответствующие не модулю разности процентного содержания, а разности процентного содержания.
Общее количество аминокислотных остатков представлено в Таблице 2.
Бактерия | Escherichia coli (strain K12) (Strain: K12 / MG1655 / ATCC 47076) | Rhodospirillum rubrum (strain ATCC 11170 / ATH 1.1.1 / DSM 467 / LMG 4362 / NCIB 8255 / S1) |
---|---|---|
Proteome ID | UP000000625 | UP000001929 |
Количество аминокислотных остатков | 1353357 | 1292602 |
Сравнение содержания аминокислотных остатков в геномах E.coli и R.rubrum представлено в Таблице 3.
АК | E.coli [%АК] | R.rubrum [%АК] | |Разность %| | Разность % |
---|---|---|---|---|
A | 9,5072 | 13,2759 | 3,7687 | -3,7687 |
L | 10,6763 | 11,2048 | 0,5285 | -0,5285 |
G | 7,3661 | 9,0766 | 1,7104 | -1,7104 |
R | 5,5205 | 7,5521 | 2,0316 | -2,0316 |
V | 7,0703 | 7,4988 | 0,4285 | -0,4285 |
D | 5,1469 | 5,7968 | 0,6499 | -0,6499 |
P | 4,4288 | 5,6843 | 1,2555 | -1,2555 |
E | 5,7623 | 5,4236 | 0,3387 | 0,3387 |
T | 5,3945 | 5,2883 | 0,1062 | 0,1062 |
S | 5,7991 | 5,0836 | 0,7155 | 0,7155 |
I | 6,0115 | 4,7155 | 1,2960 | 1,2960 |
F | 3,8944 | 3,4031 | 0,4913 | 0,4913 |
Q | 4,4427 | 2,8232 | 1,6195 | 1,6195 |
K | 4,4070 | 2,7891 | 1,6179 | 1,6179 |
M | 2,8253 | 2,2616 | 0,5637 | 0,5637 |
N | 3,9383 | 2,0477 | 1,8906 | 1,8906 |
H | 2,2695 | 1,9694 | 0,3001 | 0,3001 |
Y | 2,8449 | 1,9338 | 0,9112 | 0,9112 |
W | 1,5321 | 1,2589 | 0,2733 | 0,2733 |
C | 1,1621 | 0,9130 | 0,2491 | 0,2491 |
U | 0,0002 | 0,0002 | 0,0002 |
Наиболее отличающиеся по содержанию аминокислотные остатки: в пользу E.coli - аспарагина, в пользу R.rubrum - аланина.
Самыми редкими аминокислотными остатками у E.coli являются остатки цистеина, триптофана и гистидина, у R.rubrum - цистеина, триптофана и тирозина. Может быть, это связано с тем, что триптофан, гистидин и тирозин - аминокислоты ароматические, со сложным путём биосинтеза, а цистеин содержит серу.
Самыми частными аминокислотными остатками у R.rubrum являются остатки глицина, аланина и лейцина, у R.rubrum - глицина, лейцина и аланина. Эти аминокислоты имеют несложный путь биосинтеза. Кроме того, глицин (вместе с серином) - основной источник одноуглеродных групп в клетке, предшественник пуриновых оснований и порфиринов, а также многих других соединений.
Linux - удобная операционная система со множеством полезных пакетов.