BioPython
Рекомендуется скачать и установить BioPython (для Windows 64bit).
SeqIO
- Такой модуль есть в Perl. В чём-то создатели вдохновлялись им.
- Включение Bio.SeqIO и Bio.AlignIO в Biopython привело к дупликации некоторых функций, например, с Bio.Nexus.
- Используется для работы с данными, представленными в виде последовательностей.
- Можно работать с выравниваниями как с файлами последовательностей, но для этого есть специальный модуль - Bio.AlignIO.
- Список форматов обширен. (Нас интересуют больше всего такие, как fasta, stockholm. STOCKHOLM используется базами данных Pfam (for protein family alignments) и Rfam (for RNA family alignments).
По ходу занятия познакомимся со следующими функциями:
Bio.SeqIO.parse(),
Bio.SeqIO.read(),
SeqIO.write(),
SeqIO.convert().
Обратим внимание на особенности работы с ними, а также научимся читать выборочные последовательности, конвертировать форматы, генерировать случаную последовательность на основе реальных данных,
Ссылки:
AlignIO
- Работа с файлами, содержащими одно или несколько выравниваний. В чём-то похож на Bio.SeqIO (функции ввода/вывода, имена форматов файлов).
- Мы рассмотрим работу с такими файлами, которые содержат 1 выравнивание. Файл может содержать несколько выравниваний. В таких случаях задача становится немного сложнее, однако не вносит никаких новых принципов работы с AlignIO.
В процессе занятия мы узнаем о следующих аспектах работы с выравниваниями в BioPython:
Функции Bio.AlignIO.read(), Bio.AlignIO.parse() и Bio.AlignIO.write(), а также Bio.AlignIO.convert().
- Конвертация форматов, работа с набором последовательностей как со списком, работа с выравниваниями, работа с колонками, участками, блоками в выравнивании.
- Знакомство с инструментами для выравнивания последовательностей. Использование BLAST.