Учебная страница курса биоинформатики,
год поступления 2018
Что нужно для успешной сдачи коллоквиума
Linux / bash
- Уметь заходить на kodomo через PuTTy
Знать обозначения папок (., .., /, ~)
- Знать команды (в квадратных скобочках опции, значение которых тоже нужно знать):
pwd, cd, ls [-la], exit
mv, cp, rm [-r], touch, echo, mkdir [-p], rmdir [-p]
cat [-A], less, wc [-l], sort [-u]
grep [-Evc], sed [-Ene]
chmod (+ два типа изменения прав)
man и стандартные опции команд для получения справки
Знать перенаправление потоков stdin, stdout, stderr:
>, 2>, &>
>>, 2>>, &>>
|
- Уметь составлять маски имен файлов:
*, ?
- Уметь экранировать специальные символы bash:
'', \
- Знать базовые синтаксические конструкции bash:
- переменные
перенаправление вывода (stdout) команды в переменную
- цикл for
- А еще:
уметь применять все перечисленные выше знания!
уметь использовать <Tab> и стрелочки ⬆⬇ в командной строке
понимать вывод ls -l, включая первый столбец (тип файла и права rwx)
grep, sed
- Уметь переключать grep и sed в режим работы с расширенными регулярными выражениями (ERE)
Знать и уметь применять 3 основных команды sed: d, p, s
Уметь быстро выполнить задание аналогичное упражнениям по grep и по sed
Уметь составлять регулярные выражения ERE:
., [Symbols], [Symb-ols], [^Symbols], [[:space:]]
*, +, ?, {n}, {n,m}
|, ()
^, $
- Понимать отличие регулярных выражений от масок (имен файлов, идентификаторов баз данных, т.д.)
EMBOSS
- Команды (не только знать теоретически, но и уметь их все использовать):
seqret, entret
infoseq, wordcount
tfm
- Методы получения справки по команде EMBOSS (в идеале 4 штуки)
- Знать формат и уметь использовать USA
Нужно уметь быстро проделать упражнения по командам EMBOSS
UniProt
- Общие представления о базах данных, устройство (на самом примитивном уровне), классификация
- Представление о том, откуда берется информация о белках и где она хранится
- Основные факты из истории развития методов секвенирования
Основные базы: GenBank, ENA, DDBJ, RefSeq, PDB, PubMed, UniProt
Устройство UniProt, какие базы данных в себя включает
Способы борьбы с избыточностью информации в UniProt
- Формат (текстовый) записи Swiss-Prot/TrEMBL, основные поля
- Формат таблицы локальных особенностей (Feature Table, поле FT)
Отличия и предназначение UniProt AC и UniProt ID