Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2021

Программа коллоквиума 20 декабря 2022

Каждому студенту необходимо будет ответить на десять вопросов, по одному из каждого раздела.

  1. Секвенирование по Сэнгеру

    1. ПЦР: необходимые компоненты для реакции и результат.
    2. Компоненты реакции для проведения секвенирования по Сэнгеру.
    3. На что надо обращать внимание при визуальном анализе хроматограммы. Пример ситуации, требующей разбора (схематично нарисовать).
    4. Смысл качества прочтения нуклеотида (формула).
  2. Банки нуклеотидных последовательностей

    1. Что хранится в базах данных GenBank, ENA, DDBJ, RefSeq, в чем их сходство и различие?

    2. Что такое аннотация нуклеотидной последовательности, из каких основных этапов она состоит? Приведите примеры свойств нуклеотидной последовательности, которые размечаются при аннотации.
  3. BLAST

    1. Какие версии BLAST можно использовать, если у Вас есть нуклеотидная последовательность в качестве запроса, и в каких случаях?
    2. Какие версии BLAST можно использовать, если у Вас есть белковая последовательность в качестве запроса, и в каких случаях?
    3. Почему BLASTN плохо подходит для поиска гомологов белок-кодирующих генов?
    4. Как может повлиять увеличение параметра "word size" на скорость работы BLASTN и на число находок? Ответ обоснуйте.
  4. Выравнивание геномов

    1. Дана карта локального сходства геномов. Какие эволюционные события на ней видны?
    2. Для данного типа глобальной перестройки генома нарисовать примерный вид карты локального сходства.
  5. NGS секвенирование

    1. Сколько фотографий будет получено при секвенировании парноконцевых чтений длины 100 нуклеотидов на секвенаторе фирмы Illumina?
    2. Объясните основной графический выход программы FastQC (рисунок с боксплотами).
    3. Phred Quality Score нуклеотида = 30. Какова вероятность того, что этот нуклеотид прочитан неверно?
    4. Опишите кратко основной принцип работы секвенатора фирмы Illumina в случае парноконцевых и одноконцевых чтений.
    5. Вы получили чтения для анализа. Что об источнике этих данных необходимо узнать прежде, чем браться за анализ? Приведите 3-5 важных пунктов.
  6. Что и зачем секвенируют?

    1. Геном, экзом, транскриптом — объясните термины.
    2. Для решения какой задачи необходимо секвенировать и анализировать транскрибируемые спейсеры?
    3. Какие мутации можно изучать с помощью секвенирования?
    4. Какие задачи вы решали в рамках блока по анализу NGS?
    5. На качество каких данных стоит обращать внимание при работе с результатами NGS помимо самих чтений? Приведите 2-3 примера.
  7. Картирование

    1. Что такое SNP?
    2. В чем отличие при картировании чтений, полученных при секвенировании экзома и транскриптома?
    3. Какую информацию хранят в файлах с расширениями: fasta, fastq, sam, bam, vcf, gvcf, bed, gtf?
    4. Опишите основные манипуляции с данными, предшествующие картированию чтений на референсный геном.
  8. Ответьте на вопрос по работе программного конвейера (обязательный для всех)

  9. Транскриптом

    1. Для чего при секвенировании транскриптома бывает нужно большое покрытие?
    2. Приведите примеры фракций РНК, которые выделяют для секвенирования (4 типа).
    3. Какие задачи можно решать с помощью секвенирования РНК (2-3 примера)?
    4. Какие бывают реплики и зачем они нужны?
  10. Сборка de novo

    1. Дан размер генома, число чтений и длина каждого чтения. Как рассчитать ожидаемое количество нуклеотидов, не покрытых ни одним чтением (в предположении равновероятного распределения чтений по геному)?
    2. Чтения (reads), контиги, скэффолды, покрытие, N50, L50 — объясните термины.
    3. Что такое парные чтения и как они используются при сборке генома?
    4. Что такое встречноконцевые чтения (mate pair reads)?
    5. Что такое граф де Брёйна?
    6. Опишите основные манипуляции с данными, предшествующие сборке de novo.

2021/3/colloquium (последним исправлял пользователь sas 2022-12-12 14:48:21)