Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2012

Python скрипты для заданий блока 3

Опция "-h" или "--help" выдает подсказки по параметрам

Скрипт для скачивания

Что делает

Входные данные

Комментарии

разъяснения

swisspfam-to-xls.py

Преобразует информацию о доменах в последовательности из файла swisspfam в таблицу для Excel

Pfam AC или файл со списком Pfam ACs

Адрес swisspfam на kodomo указан по умолчанию. Сохраняются данные о последовательностях, содержащих хоть один из указанных доменов

Используйте опцию -z, т.к. файл swisspfam заархивирован

uniprot-to-taxonomy.py

Преобразует информацию о таксономии из записей Uniprot в таблицу Excel

Файл с последовательностями в формате Uniprot

filter-alignment.py

Оставляет только те последовательности из входного файла, ID которых входит в список, поданный на вход

Файл в формате fasta (можно и в другом, если установлен EMBOSS); список имен последовательностей

На своем компьютере используйте fasta формат для входного и выходного файлов! (Для иных опций нужен доступ ко всем командам EMBOSS)

Для отделения имени последовательности от координат в домене в выравнивании Pfam (пример: >A2RVY6_BURM9/21-304) следует использовать опцию -a "/"