Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2017

Вопросы к коллоквиуму 18 декабря 2018

Каждому студенту необходимо будет ответить на десять вопросов, по одному из каждого раздела.

  1. Секвенирование по Сэнгеру

    1. ПЦР: необходимые компоненты для реакции и результат;
    2. Компоненты реакции для проведения секвенирования по Сэнгеру;
    3. На что надо обращать внимание при визуальном анализе хроматограммы. Пример ситуации, требующей разбора;
    4. Смысл качества прочтения нуклеотида (формула);
    5. Что учитывает программа, рассчитывающая качество прочтения?
  2. Банки нуклеотидных последовательностей

    1. История секвенирования (примерные даты): первая последовательность белка, первая последовательность РНК, секвенирование по Сэнгеру, первый геном бактерии, геном человека.
    2. Примерные размеры геномов человека, бактерии, вируса.
    3. Перечислите основные банки нуклеотидных последовательностей.
    4. Биопроект, биообразец, сборка (assembly), SRA — объясните термины
  3. BLAST

    1. Что такое вес в битах, и чем он лучше обычного веса выравнивания?
    2. E-value (Expected) — объясните смысл этого параметра. Для случайной последовательности сколько находок с E-value < 0.1 найдется в нуклеотидном банке данных? с порогом E < 10?

    3. За счет чего BLAST работает быстро?
    4. Перечислите все разновидности BLAST в зависимости от типа входной последовательности и базы данных.
    5. Зачем нужны разновидности нуклеотидного (НК против НК) BLAST?
    6. Приведите примеры трех задач, для решения которых нужны разные виды BLAST.
    7. Перечислите входные параметры, которые надо контролировать при запуске BLAST.
  4. EMBOSS

    • Для всех: выполнить указанную команду из задания практикума 9 (без *).
    • Универсальный адрес последовательности — приведите примеры
    • Что такое Listfile? Как его указывать во входных параметрах?
    • Какие help'ы предусмотрены в EMBOSS и как их вызывать?
    • Трансляция: вход и параметры; что значит * в результате?
    • (*) Частоты кодонов: зачем нужна такая программа?
    • Даны CDS гомологичных белков и последовательности тех же белков. В чем отличие выравнивания CDS как нуклеотидных последовательностей и выравнивания CDS, построенного по выравниванию белков? Какое из них правильнее и почему?
  5. Выравнивание геномов

    1. На примере объясните карту локального сходства для двух геномов бактерий
    2. Перечислите крупные эволюционные события, наблюдающиеся в геномах. Приведите примеры (можно - из головы)
  6. NGS секвенирование

    1. Сколько фотографий будет получено при секвенировании парнокоцевых чтений длины 100 нуклеотидов на секвенаторе фирмы Illumina?
    2. Объясните основной графический выход программы FastQC
    3. Какой на сегодня принятый нижний порог Phred quality score при анализе качества чтений?
  7. Что и зачем секвенируют?

    1. Геном, экзом, транскриптом, метилом — объясните термины.
    2. Зачем нужны полные геномы? Приведите пример.
    3. Для решения какой задачи необходимо секвенировать и анализировать транскрибируемые спейсеры?
  8. Картирование

    1. Что такое SNP?
    2. Какую информацию о полиморфизме можно узнать из базы 1000 genomes?
    3. В чем отличие при картировании чтений, полученных при секвенировании экзома и транскриптома?
    4. Какую информацию хранят в файлах с расширениями: fasta, fastq, sam, bam, vcf, bed?
  9. Транскриптом

    1. В каком году появились первые работы по секвенированию транскриптома?
    2. Приведите примеры фракций РНК, которые выделяют для секвенирования (4 типа).
    3. Где важнее глубина секвенирования: при анализе экзома или транскриптома?
  10. Сборка de novo

    1. Дан размер генома, число чтений и длина каждого чтения. Как рассчитать ожидаемое количество нуклеотидов, не покрытых ни одним чтением (в предположении равномерного распределения чтений по геному)?
    2. Прочтения (риды), контиги, скэффолды, покрытие, N50, L50 — объясните термины
    3. Что такое парные чтения и как они используются при сборке генома?
    4. Что такое встречноконцевые чтения (mate pair reads)?
    5. Что такое k-меры и граф де Брюйна, используемый большинством сборщиков?