Учебная страница курса биоинформатики,
год поступления 2021
Программа коллоквиума 20 декабря 2022
Каждому студенту необходимо будет ответить на десять вопросов, по одному из каждого раздела.
Секвенирование по Сэнгеру
- ПЦР: необходимые компоненты для реакции и результат.
- Компоненты реакции для проведения секвенирования по Сэнгеру.
- На что надо обращать внимание при визуальном анализе хроматограммы. Пример ситуации, требующей разбора (схематично нарисовать).
- Смысл качества прочтения нуклеотида (формула).
Банки нуклеотидных последовательностей
Что хранится в базах данных GenBank, ENA, DDBJ, RefSeq, в чем их сходство и различие?
- Что такое аннотация нуклеотидной последовательности, из каких основных этапов она состоит? Приведите примеры свойств нуклеотидной последовательности, которые размечаются при аннотации.
BLAST
- Какие версии BLAST можно использовать, если у Вас есть нуклеотидная последовательность в качестве запроса, и в каких случаях?
- Какие версии BLAST можно использовать, если у Вас есть белковая последовательность в качестве запроса, и в каких случаях?
- Почему BLASTN плохо подходит для поиска гомологов белок-кодирующих генов?
- Как может повлиять увеличение параметра "word size" на скорость работы BLASTN и на число находок? Ответ обоснуйте.
Выравнивание геномов
- Дана карта локального сходства геномов. Какие эволюционные события на ней видны?
- Для данного типа глобальной перестройки генома нарисовать примерный вид карты локального сходства.
NGS секвенирование
- Сколько фотографий будет получено при секвенировании парноконцевых чтений длины 100 нуклеотидов на секвенаторе фирмы Illumina?
- Объясните основной графический выход программы FastQC (рисунок с боксплотами).
- Phred Quality Score нуклеотида = 30. Какова вероятность того, что этот нуклеотид прочитан неверно?
- Опишите кратко основной принцип работы секвенатора фирмы Illumina в случае парноконцевых и одноконцевых чтений.
- Вы получили чтения для анализа. Что об источнике этих данных необходимо узнать прежде, чем браться за анализ? Приведите 3-5 важных пунктов.
Что и зачем секвенируют?
- Геном, экзом, транскриптом — объясните термины.
- Для решения какой задачи необходимо секвенировать и анализировать транскрибируемые спейсеры?
- Какие мутации можно изучать с помощью секвенирования?
- Какие задачи вы решали в рамках блока по анализу NGS?
- На качество каких данных стоит обращать внимание при работе с результатами NGS помимо самих чтений? Приведите 2-3 примера.
Картирование
- Что такое SNP?
- В чем отличие при картировании чтений, полученных при секвенировании экзома и транскриптома?
- Какую информацию хранят в файлах с расширениями: fasta, fastq, sam, bam, vcf, gvcf, bed, gtf?
- Опишите основные манипуляции с данными, предшествующие картированию чтений на референсный геном.
Ответьте на вопрос по работе программного конвейера (обязательный для всех)
Транскриптом
- Для чего при секвенировании транскриптома бывает нужно большое покрытие?
- Приведите примеры фракций РНК, которые выделяют для секвенирования (4 типа).
- Какие задачи можно решать с помощью секвенирования РНК (2-3 примера)?
- Какие бывают реплики и зачем они нужны?
Сборка de novo
- Дан размер генома, число чтений и длина каждого чтения. Как рассчитать ожидаемое количество нуклеотидов, не покрытых ни одним чтением (в предположении равновероятного распределения чтений по геному)?
- Чтения (reads), контиги, скэффолды, покрытие, N50, L50 — объясните термины.
- Что такое парные чтения и как они используются при сборке генома?
- Что такое встречноконцевые чтения (mate pair reads)?
- Что такое граф де Брёйна?
- Опишите основные манипуляции с данными, предшествующие сборке de novo.