EMBOSS: пакет программ для анализа последовательностей


Что было сделано:

с помощью bash на базе программ пакета EMBOSS был написан скрипт, решающий следующие задачи:


Все это можно сделать одной командой - extractfeat. Она выводит желаемые последовательности (в нашем случае, кодирующие последовательности) опцией -type CDS и добавляет к ним особенности. Чтобы вывести функции белка, необходимо было ввести опцию -describe product. Пример кода можно увидеть на картинке ниже или скачать см. "Примечания"


extractfeat

Я проверила, работает ли код на примере файла с последовательностями в формате gb организма Agrobacterium tumefaciens. Результат работы программы можно увидеть на картинке.


extractfeat_results

Примечания:

Скачать скрипт можно здесь

up

Правильный CSS!