"Когда мне плохо, я работаю, — сказал он. — Когда у меня неприятности, когда у меня хандра, когда мне скучно жить, — я сажусь работать. Наверное, существуют другие рецепты, но я их не знаю. Или они мне не помогают. Хочешь моего совета — пожалуйста: садись работать."

Аркадий и Борис Стругацкие, За миллиард лет до конца света

Добро пожаловать!

Скрипт на питоне

В ходе выполнения данного практикума был написан скрипт на python для выполнения задания 4: по аннотированному файлу в формате gb или embl создать файл с кодирующими последовательностями в формате fasta, добавив в описание каждой последовательности функцию белка.

Запуск скрипта из командной строки: python python.py [имя входного файла] [имя выходного файла] [опционально: опция join]

Скрипт в ходе своей работы обращается к программе extractfeat из пакета EMBOSS, которая выделяет кодирующие последовательности (CDS) из аннотированного генома в отдельный файл. Затем полученные данные обрабатываются до красивого вида, а файл выдачи EMBOSS удаляется с помощью модуля OS. Скрипт использует модуль subprosess для запуска подпроцесса, в котором идет работа команды. Также возможно слияние экзонов у эукариот в одну выдачу с помощью опции "join".

Входной файл

Скрипт

Выходной файл

Небольшое лирическое отступление

В ходе выполнения данного практикума я долго и мучительно копалась в документации к питону и нашла там безумное количество удивительных вещей, которые мне безумно понравились. Я всегда знала, что у python есть огромное количество функций, но напрямую с ними столкнулась только сейчас. И это оказалось безумно круто!

Я всегда думала, что шла на ФББ больше капать, чем прогать, и до этого года это скорее ощущалось так. Но небольшие забросы в биоинформатику немного двигают мышление, и сейчас прогать мне хочется ровно в той же степени, что и капать. А посему, в ближайшее время я планирую начать копать в эту сторону! (если не умру)

Конец лирического отступления