Учебная страница курса биоинформатики,
год поступления 2011
Задания
Напоминаем, что задание должно быть выполнено в репозитории. Несоблюдение этого требования карается штрафом в 0.5 балла.
(1 балл) Напишите программу, которая читает файл в формате FASTA (имя файла может быть задано переменной в первых строках программы). Файл должен содержать нуклеотидные последовательности. Программа должна вычислить для них комплементарные и напечатать в другой файл в формате FASTA.
(1 балл) Скрипт получает на вход два файла. В одном ids.txt друг под другом указаны id-шники SwissProt белков, а во втором находится фрагмент банка SwissProt. Нужно выбрать из файла с банком SwissProt последовательности для id-шников, которые перечислены в первом файле, и напечатать файл в fasta-формате
(2.5 балла) Написать программу, которая получает на вход фрагмент банка PFAM в формате Stockholm (лежит на kodomo в /srv/databases/pfam) и набор id белков (в качестве позиционных аргументов командной строки). Программа ищет среди заданных белков белки, имеющие структуры в PDB, и вырезает из выравнивания только те части, для которых есть PDB-структуры. (Привязки к базам данных лежат в SeqRecord в атрибуте dbxrefs, и вам придётся разобраться с тем, как из того, что там написано и как это соотносится с названием последовательности, и вытащить диапазон остатков).