На данной странице представлен краткий анализ протеомов двух бактерий: Nitrosomonas europaea и Escherichia coli. В таблице 1 рассмотрены осоновные характеристики протеомов.
Таблица 1Бактерия | Идентификатор протеома | Число последовательностей | Общее число аминокислот |
Nitrosomonas europaea | UP000001416 | 2375 | 777646 |
Escherichia coli | UP000000625 | 4313 | 1351619 |
В таблице 2 представлено процентное распеределение 20 основных аминокислот в протеомах двух бактерий, а также разница между процентым содержанием каждой аминокислоты в двух протеомах. Таблица Excel
Таблица 210.71 | 10.68 | 0.03% | |
9.28 | 9.51 | -0.23% | |
7.21 | 7.37 | -0.17% | |
6.71 | 7.07 | -0.36% | |
6.42 | 6.01 | 0.41% | |
6.36 | 5.52 | 0.85% | |
6.01 | 5.80 | 0.22% | |
6.00 | 5.77 | 0.24% | |
5.46 | 5.39 | 0.07% | |
5.35 | 5.15 | 0.21% | |
4.59 | 4.43 | 0.17% | |
4.31 | 4.44 | -0.14% | |
4.06 | 4.41 | -0.35% | |
3.93 | 3.89 | 0.04% | |
3.56 | 3.94 | -0.38% | |
2.81 | 2.84 | -0.03% | |
2.49 | 2.27 | 0.23% | |
2.44 | 2.82 | -0.38% | |
1.32 | 1.53 | -0.21 | |
0.96 | 1.16 | -0.20 |
Основные различия протеомов:
а) Наиболее часто встречающиеся аминокислоты: ►N.europaea Лейцин (10.71%) Аланин (9.28%) Глицин (7.21%) ►E.coli Лейцин (10.68%) Аланин (9.51%) Глицин (7.37%) |
б) Наиболее редко встречающиеся аминокислоты: ►N.europaea Цистеин (0.96%) Триптофан (1.32%) Метионин (2.44%) ►E.coli Цистеин (1.16%) Триптофан (1.53%) Гистидин (2.27%) |
Очевидно, что наиболее часто встречающиеся аминокислоты совпадают в двух протеомах, в то время как наиболее редкие остатки различаются. Если говорить о процентом различии во встречаемости остатков, то наибольший перевес в сторону бактерии N.europaea провляется в количестве аминокислоты Аргинина (больше на 0.85%). В протеоме бактерии E.coli, в свою очередь, на 0.38% больше аминокислот Тирозина и Метионина.
Команда Compseq
Команды wordcount и compseq Emboss предназначены для поиска слов различной длины в указанном файле. При этом:
► Команда wordcount подсчитывает число всех возможных слов заданной длины и записывает полученные данные в две колонки текстового файла по убыванию числа встречаемости. В командной строке может быть указана длина искомых слов и имя файла, в который будет записан результат. Пример:
% wordcount file1 -wordsize=1 file2
данная команда посчитает количесво всех слов длины 1 из файла file1 и запишет результат в file2
► Команда compseq подсчитывет число всех возможных слов заданной длины и записывает результат в указанный файл, раcполагая слова в алфавитном порядке. Кроме того, подсчитывается доля встречаемости каждого слова в файле, ожидаемая доля, отношение этих значений. Команда имеет большее количество аргументов, чем wordcount. Например, аргумент -frame позволяет регулировать рамку считывания. Аргумент -nozero убирает из списка слова, не встречающиеся в файле (если проводить подсчет слов длины 1 (аминокислот), то иногда в резульате отображается строка с количеством селеноцистеина, даже если этой аминокислоты нет в последовательности. -nozero убирает эту строку).
©Машковская Анна, 2018