Практикум №7. Пакет EMBOSS, grep.

Скачивание протеомов:

Подсчет последовательностей и аминокислот

Подсчет количества последовательностей

В файлах fasta формата каждая последовательность начинается с символа ">", который мы и будем искать в файлах , содержащих белки. Для функции grep была также взята опция -c, которая выдает количество совпадений.

Подсчет количества аминокислот

Для подсчета аминокислот была использована функция wordcount, которая считает и собирает в отдельном файле уникальные слова заданной длины (в нашем случае длины 1). На рисунке ниже видно как задается данная функция и содержание выданного функцией файла.

Сравнение wordcount и compseq


Составление таблицы