Работа с биологическими данными: Деревья; Структуры
Содержание
План
Работа со структурами
Библиотека biophython(Bio.PDB)
- Разборщик PDB-файлов (PDBParser) + аннотация файла (header и trailer)
- Хранение информации о макромолекуле (Архитектура):
- structure
- model
- chain
- residue
- atom
- Получение характеристик обьекта
- Изменение структуры
Работа с деревьями
Библиотека biophython(Bio.Phylo)
- I/O функции:
- parse()
- read()
- write()
- convert()
- Визуализация деревьев:
- Phylo.draw_ascii()
- Phylo.draw_graphviz()
Библиотека dendropy
- Организация данных:
- Data Set
- Character Matrix
- Tree List
- Tree
- Taxon Set
- Taxon
- Data Set
- I функции
- Спецификация форматов
- O функции
- Описание и Визуализация деревьев:
- description()
- as_ascii_plot()
Заметки
Архитектура SMCRA (Structure/Model/Chain/Residue/Atom)
Structure['1g59'] | +---- Model[0] | +---- Chain['A'] | | | +---- Residue[' ', 1, ' '] | | | | | +---- Atom['N'] | | | | | +---- [...] | | | | | +---- Atom['CE'] | | | +---- [...] | | | +---- Residue[' ', 468, ' '] [...] | +---- Chain['B'] [...] | +---- Chain['C'] [...] | +---- Chain['D'] [...] | +---- Chain[' '] | +---- Residue['W', 1, ' '] | | | +---- Atom['O'] | +---- [...] | +---- Residue['W', 283, ' '] [...]
Ссылки
Деревья
Структуры
Контрольная работа
Дан файл в fasta-формате. Напишите регулярное выражение, которое выделяет в группу sequence тело последовательности с именем cyb5_mouse
- Поставьте галочки напротив множеств, которые можно задать ортодоксальными регулярными выражениями и перловскими регекспами. Напишите соответствующие выражения:
Множество
р.в.?
pcre?
выражение
ab, abab, ababab, ...
c, abc, aabbc, aaabbbc, ...
b, aba, aabaa, aaabaaa, ...
(, (), ((), ())), ...
(), (()), (()()), ()()