Работа с биологическими данными: Деревья; Структуры
Содержание
План
Работа со структурами
Библиотека biophython(Bio.PDB)
- Разборщик PDB-файлов (PDBParser) + аннотация файла (header и trailer)
- Хранение информации о макромолекуле (Архитектура):
- structure
- model
- chain
- residue
- atom
- Получение характеристик обьекта
- Изменение структуры
Работа с деревьями
Библиотека biophython(Bio.Phylo)
- I/O функции:
- parse()
- read()
- write()
- convert()
- Визуализация деревьев:
- Phylo.draw_ascii()
- Phylo.draw_graphviz()
Библиотека dendropy
- Организация данных:
- Data Set
- Character Matrix
- Tree List
- Tree
- Taxon Set
- Taxon
- Data Set
- I функции
- Спецификация форматов
- O функции
- Описание и Визуализация деревьев:
- description()
- as_ascii_plot()
Заметки
Архитектура SMCRA (Structure/Model/Chain/Residue/Atom)
Structure['1g59']
|
+---- Model[0]
|
+---- Chain['A']
| |
| +---- Residue[' ', 1, ' ']
| | |
| | +---- Atom['N']
| | |
| | +---- [...]
| | |
| | +---- Atom['CE']
| |
| +---- [...]
| |
| +---- Residue[' ', 468, ' '] [...]
|
+---- Chain['B'] [...]
|
+---- Chain['C'] [...]
|
+---- Chain['D'] [...]
|
+---- Chain[' ']
|
+---- Residue['W', 1, ' ']
| |
| +---- Atom['O']
|
+---- [...]
|
+---- Residue['W', 283, ' '] [...]
Ссылки
Деревья
Структуры
Контрольная работа
Дан файл в fasta-формате. Напишите регулярное выражение, которое выделяет в группу sequence тело последовательности с именем cyb5_mouse
- Поставьте галочки напротив множеств, которые можно задать ортодоксальными регулярными выражениями и перловскими регекспами. Напишите соответствующие выражения:
Множество
р.в.?
pcre?
выражение
ab, abab, ababab, ...
c, abc, aabbc, aaabbbc, ...
b, aba, aabaa, aaabaaa, ...
(, (), ((), ())), ...
(), (()), (()()), ()()
