Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2018

Что нужно для успешной сдачи коллоквиума

Linux / bash

  1. Уметь заходить на kodomo через PuTTy
  2. Знать обозначения папок (., .., /, ~)

  3. Знать команды (в квадратных скобочках опции, значение которых тоже нужно знать):
    • pwd, cd, ls [-la], exit

    • mv, cp, rm [-r], touch, echo, mkdir [-p], rmdir [-p]

    • cat [-A], less, wc [-l], sort [-u]

    • grep [-Evc], sed [-Ene]

    • chmod (+ два типа изменения прав)

    • man и стандартные опции команд для получения справки

  4. Знать перенаправление потоков stdin, stdout, stderr:

    • >, 2>, &>

    • >>, 2>>, &>>

    • |

  5. Уметь составлять маски имен файлов:
    • *, ?

  6. Уметь экранировать специальные символы bash:
    • '', \

  7. Знать базовые синтаксические конструкции bash:
    • переменные
    • перенаправление вывода (stdout) команды в переменную

    • цикл for
  8. А еще:
    • уметь применять все перечисленные выше знания!

    • уметь использовать <Tab> и стрелочки ⬆⬇ в командной строке

    • понимать вывод ls -l, включая первый столбец (тип файла и права rwx)

grep, sed

  1. Уметь переключать grep и sed в режим работы с расширенными регулярными выражениями (ERE)
  2. Знать и уметь применять 3 основных команды sed: d, p, s

  3. Уметь быстро выполнить задание аналогичное упражнениям по grep и по sed

  4. Уметь составлять регулярные выражения ERE:

    • ., [Symbols], [Symb-ols], [^Symbols], [[:space:]]

    • *, +, ?, {n}, {n,m}

    • |, ()

    • ^, $

  5. Понимать отличие регулярных выражений от масок (имен файлов, идентификаторов баз данных, т.д.)

EMBOSS

  1. Команды (не только знать теоретически, но и уметь их все использовать):
    • seqret, entret

    • infoseq, wordcount

    • tfm

  2. Методы получения справки по команде EMBOSS (в идеале 4 штуки)
  3. Знать формат и уметь использовать USA
  4. Нужно уметь быстро проделать упражнения по командам EMBOSS

UniProt

  1. Общие представления о базах данных, устройство (на самом примитивном уровне), классификация
  2. Представление о том, откуда берется информация о белках и где она хранится
  3. Основные факты из истории развития методов секвенирования
  4. Основные базы: GenBank, ENA, DDBJ, RefSeq, PDB, PubMed, UniProt

  5. Устройство UniProt, какие базы данных в себя включает

  6. Способы борьбы с избыточностью информации в UniProt

  7. Формат (текстовый) записи Swiss-Prot/TrEMBL, основные поля
  8. Формат таблицы локальных особенностей (Feature Table, поле FT)
  9. Отличия и предназначение UniProt AC и UniProt ID