Учебная страница курса биоинформатики,
год поступления 2016
Вопросы
Для всех: ответить на не зачтенные вопросы контрольных блока 2.
Секвенирование по Сангеру
- ПЦР: необходимые компоненты для реакции и результат
- Компоненты реакции для проведения секвенирования
- На что надо обращать внимание при визуальном анализе хроматограммы. Пример ситуации, требующей разбора
- Смысл качества прочтения нуклеотида (Формула); что учитывает программа, рассчитывающая качество прочтения
Банки нуклеотидных последовательностей
- История секвенирования (примерные даты): первая последовательность белка, секвенирование по Сангеру, первый геном бактерии, геном человека
- Примерные размеры геномов человека, бактерии, вируса
- Перечислите основные банки нуклеотидных последовательностей
- Биопроект, биообразец, сборка (assembly), SRA — объясните термины
BLAST
- Что такое вес в битах, и чем он лучше обычного веса выравнивания?
E-value (Expected) — объясните смысл этого параметра. Для случайной последовательности сколько "достоверных" находок с E-value < 0.1 найдется в нуклеотидном банке данных? с порогом E < 10?
- За счет чего BLAST работает быстро?
- Перечислите все разновидности BLAST в зависимости от типа входной последовательности и базы данных.
- Зачем нужны разновидности нуклеотидного (НК против НК) BLAST?
- Приведите примеры трех задач, для решения которых нужны разные виды BLAST
- Перечислите входные параметры, которые надо контролировать при запуске BLAST
EMBOSS
- Для всех: выполнить указанную команду из задания практикума 9 (без *).
- Универсальный адрес последовательности — приведите примеры
- Что такое Listfile? Как его указывать во входных параметрах?
- Назовите группы параметров. Как вызывать help'ы?
- Трасляция: вход и параметры; что значит * в последовательности белка?
- (*) Частоты кодонов: зачем нужна такая программа?
- Даны CDS гомологичных белков и последовательности тех же белков. В чем отличие выравнивания CDS как нуклеотидных последовательностей и выравнивания CDS, построенного по выравниванию белков? Какое из них правильнее и почему?
Выравнивание геномов
- На примере объясните карту локального сходства для двух геномов бактерий
- Перечислите крупные эволюционные события, наблюдающиеся в геномах. Приведите примеры (можно - из головы)
NGS секвенирование
- Сколько фотографий будет получено при секвенировании парнокоцевых чтений длины 100 нуклеотидов на секвенаторе фирмы Illumina?
- Рассчитать значение Phred quality score при значении вероятности ошибки 0,02.
- Объясните основной графический выход программы FastQC
- Какой на сегодня принятый нижний порог Phred quality score при анализе качества чтений?
Что и зачем секвенируют?
- Геном, экзом, транскриптом, метилом — объясните термины.
- Зачем нужны полные геномы? Приведите пример.
- Для решения какой задачи необходимо секвенировать и анализировать транскрибируемые спейсеры?
Картирование
- Что такое SNP?
- Какую информацию о полиморфизме можно узнать из базы 1000 genomes?
- В чем отличие при картировании чтений, полученных при секвенировании экзома и транскриптома?
- Какую информацию хранят в файлах с расширениями: fasta, fastq, sam, bam, vcf, bed?
Транскриптом
- В каком году появились первые работы по секвенированию транскриптома?
- Приведите пример фракций РНК, которые выделяют для секвенирования (4 типа).
- Где важнее глубина секвенирования: при анализе экзома или транскриптома?
Сборка de novo
- Дан размер генома, число чтений и длина каждого чтения. Как рассчитать ожидаемое количество нуклеотидов, не покрытых ни одним чтением (в предположении равномерного распределения чтений по геному)?
- Прочтения (риды), контиги, скэффолды, покрытие, N50, L50 — объясните термины
Что такое парные риды и как они используются при сборке генома? (Еще бывает mate pair sequencing, но этого не было в лекциях, и я не знаю как принято переводить на русский :( ААл)
- Что такое k-меры и граф де Брюйна, используемый большинством сборщиков?
Возможно, список будет уточнен - но не увеличен!