Учебная страница курса биоинформатики,
год поступления 2017
Что нужно знать для сдачи коллоквиума
Linux / bash
- Уметь заходить на kodomo через PuTTy
Обозначение папок (., .., /, ~)
- Команды (в квадратных скобочках опции, значение которых тоже нужно знать):
pwd, cd, ls [-la], exit
mv, cp, rm [-r], touch, echo, mkdir [-p], rmdir [-p]
cat [-A], less, wc [-l], sort [-u]
grep [-Evc], sed [-Ene]
chmod (+ два типа изменения прав)
man и стандартные опции команд для получения справки
Перенаправление потоков stdin, stdout, stderr:
>, 2>, &>
>>, 2>>, &>>
|
- Маски имен файлов:
*, ?
- Экранирование специальных символов bash:
'', \
- Базовые синтаксические конструкции bash:
- переменные
- перенаправление вывода (stdout) команды в переменную
- цикл for
- А еще:
уметь использовать все перечисленные выше знания!
уметь использовать <Tab> и стрелочки ⬆⬇ в командной строке
понимать вывод ls -l, включая первый столбец (тип файла и права rwx)
sed
- Уметь переключать sed в режим работы с расширенными регулярными выражениями (ERE)
- Знать и уметь применять 3 основных команды: d, p, s
Уметь быстро выполнить задание аналогичное упражнениям из практикума 6
Уметь составлять регулярные выражения ERE:
., [Symbols], [Symb-ols], [^Symbols], [[:space:]]
*, +, ?, {n}, {n,m}
|, ()
^, $
- Понимать отличие регулярных выражений от масок (имен файлов, идентификаторов баз данных, т.д.)
EMBOSS
- Команды (не только знать теоретически, но и уметь их все использовать):
seqret, entret
infoseq, wordcount
wossname, tfm
- Методы получения справки по команде EMBOSS (в идеале 4 штуки)
- Знать формат и уметь использовать USA
Нужно уметь быстро проделать упражнения, аналогичные тем, которые были в практикуме 6
UniProt
- Общие представления о базах данных, устройство (на самом примитивном уровне), классификация
- Представление о том, откуда берется информация о белках и где она хранится
- Основные факты из истории развития методов секвенирования
Основные базы: GenBank, ENA, DDBJ, RefSeq, PDB, PubMed, UniProt
Устройство UniProt, какие базы данных в себя включает
Способы борьбы с избыточностью информации в NCBI (RefSeq) и UniProt
- Формат (текстовый) записи Swiss-Prot/TrEMBL, основные поля
Отличие и предназначение UniProt AC и UniProt ID
Программа предварительная и будет пополняться до 28 марта!
— ИР