Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2017

Что нужно знать для сдачи коллоквиума

Linux / bash

  1. Уметь заходить на kodomo через PuTTy
  2. Обозначение папок (., .., /, ~)

  3. Команды (в квадратных скобочках опции, значение которых тоже нужно знать):
    • pwd, cd, ls [-la], exit

    • mv, cp, rm [-r], touch, echo, mkdir [-p], rmdir [-p]

    • cat [-A], less, wc [-l], sort [-u]

    • grep [-Evc], sed [-Ene]

    • chmod (+ два типа изменения прав)

    • man и стандартные опции команд для получения справки

  4. Перенаправление потоков stdin, stdout, stderr:

    • >, 2>, &>

    • >>, 2>>, &>>

    • |

  5. Маски имен файлов:
    • *, ?

  6. Экранирование специальных символов bash:
    • '', \

  7. Базовые синтаксические конструкции bash:
    • переменные
    • перенаправление вывода (stdout) команды в переменную
    • цикл for
  8. А еще:
    • уметь использовать все перечисленные выше знания!

    • уметь использовать <Tab> и стрелочки ⬆⬇ в командной строке

    • понимать вывод ls -l, включая первый столбец (тип файла и права rwx)

sed

  1. Уметь переключать sed в режим работы с расширенными регулярными выражениями (ERE)
  2. Знать и уметь применять 3 основных команды: d, p, s
  3. Уметь быстро выполнить задание аналогичное упражнениям из практикума 6

  4. Уметь составлять регулярные выражения ERE:

    • ., [Symbols], [Symb-ols], [^Symbols], [[:space:]]

    • *, +, ?, {n}, {n,m}

    • |, ()

    • ^, $

  5. Понимать отличие регулярных выражений от масок (имен файлов, идентификаторов баз данных, т.д.)

EMBOSS

  1. Команды (не только знать теоретически, но и уметь их все использовать):
    • seqret, entret

    • infoseq, wordcount

    • wossname, tfm

  2. Методы получения справки по команде EMBOSS (в идеале 4 штуки)
  3. Знать формат и уметь использовать USA
  4. Нужно уметь быстро проделать упражнения, аналогичные тем, которые были в практикуме 6

UniProt

  1. Общие представления о базах данных, устройство (на самом примитивном уровне), классификация
  2. Представление о том, откуда берется информация о белках и где она хранится
  3. Основные факты из истории развития методов секвенирования
  4. Основные базы: GenBank, ENA, DDBJ, RefSeq, PDB, PubMed, UniProt

  5. Устройство UniProt, какие базы данных в себя включает

  6. Способы борьбы с избыточностью информации в NCBI (RefSeq) и UniProt

  7. Формат (текстовый) записи Swiss-Prot/TrEMBL, основные поля
  8. Отличие и предназначение UniProt AC и UniProt ID