Учебная страница курса биоинформатики,
год поступления 2017

Что нужно знать для сдачи коллоквиума

Уметь заходить на kodomo через PuTTy
Обозначение папок (., .., /, ~)
Команды (в квадратных скобочках опции, значение которых тоже нужно знать):
- pwd, cd, ls [-la], exit
- mv, cp, rm [-r], touch, echo, mkdir [-p], rmdir [-p]
- cat [-A], less, wc [-l], sort [-u]
- grep [-Evc], sed [-Ene]
- chmod (+ два типа изменения прав)
- man и стандартные опции команд для получения справки
Перенаправление потоков stdin, stdout, stderr:
- >, 2>, &>
- >>, 2>>, &>>
- |
Маски имен файлов:
- *, ?
Экранирование специальных символов bash:
- '', \
Базовые синтаксические конструкции bash:
- переменные
- перенаправление вывода (stdout) команды в переменную
- цикл for
А еще:
- уметь использовать все перечисленные выше знания!
- уметь использовать <Tab> и стрелочки ⬆⬇ в командной строке
- понимать вывод ls -l, включая первый столбец (тип файла и права rwx)

Уметь переключать sed в режим работы с расширенными регулярными выражениями (ERE)
Знать и уметь применять 3 основных команды: d, p, s
Уметь быстро выполнить задание аналогичное упражнениям из практикума 6
Уметь составлять регулярные выражения ERE:
- ., [Symbols], [Symb-ols], [^Symbols], [[:space:]]
- *, +, ?, {n}, {n,m}
- |, ()
- ^, $
Понимать отличие регулярных выражений от масок (имен файлов, идентификаторов баз данных, т.д.)

Команды (не только знать теоретически, но и уметь их все использовать):
- seqret, entret
- infoseq, wordcount
- wossname, tfm
Методы получения справки по команде EMBOSS (в идеале 4 штуки)
Знать формат и уметь использовать USA
Нужно уметь быстро проделать упражнения, аналогичные тем, которые были в практикуме 6

Общие представления о базах данных, устройство (на самом примитивном уровне), классификация
Представление о том, откуда берется информация о белках и где она хранится
Основные факты из истории развития методов секвенирования
Основные базы: GenBank, ENA, DDBJ, RefSeq, PDB, PubMed, UniProt
Устройство UniProt, какие базы данных в себя включает
Способы борьбы с избыточностью информации в NCBI (RefSeq) и UniProt
Формат (текстовый) записи Swiss-Prot/TrEMBL, основные поля
Отличие и предназначение UniProt AC и UniProt ID