Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2016

Вопросы

Для всех: ответить на не зачтенные вопросы контрольных блока 2.

  1. Секвенирование по Сангеру

    1. ПЦР: необходимые компоненты для реакции и результат
    2. Компоненты реакции для проведения секвенирования
    3. На что надо обращать внимание при визуальном анализе хроматограммы. Пример ситуации, требующей разбора
    4. Смысл качества прочтения нуклеотида (Формула); что учитывает программа, рассчитывающая качество прочтения
  2. Банки нуклеотидных последовательностей

    1. История секвенирования (примерные даты): первая последовательность белка, секвенирование по Сангеру, первый геном бактерии, геном человека
    2. Примерные размеры геномов человека, бактерии, вируса
    3. Перечислите основные банки нуклеотидных последовательностей
    4. Биопроект, биообразец, сборка (assembly), SRA — объясните термины
  3. BLAST

    1. Что такое вес в битах, и чем он лучше обычного веса выравнивания?
    2. E-value (Expected) — объясните смысл этого параметра. Для случайной последовательности сколько "достоверных" находок с E-value < 0.1 найдется в нуклеотидном банке данных? с порогом E < 10?

    3. За счет чего BLAST работает быстро?
    4. Перечислите все разновидности BLAST в зависимости от типа входной последовательности и базы данных.
    5. Зачем нужны разновидности нуклеотидного (НК против НК) BLAST?
    6. Приведите примеры трех задач, для решения которых нужны разные виды BLAST
    7. Перечислите входные параметры, которые надо контролировать при запуске BLAST
  4. EMBOSS

    • Для всех: выполнить указанную команду из задания практикума 9 (без *).
    • Универсальный адрес последовательности — приведите примеры
    • Что такое Listfile? Как его указывать во входных параметрах?
    • Назовите группы параметров. Как вызывать help'ы?
    • Трасляция: вход и параметры; что значит * в последовательности белка?
    • (*) Частоты кодонов: зачем нужна такая программа?
    • Даны CDS гомологичных белков и последовательности тех же белков. В чем отличие выравнивания CDS как нуклеотидных последовательностей и выравнивания CDS, построенного по выравниванию белков? Какое из них правильнее и почему?
  5. Выравнивание геномов

    1. На примере объясните карту локального сходства для двух геномов бактерий
    2. Перечислите крупные эволюционные события, наблюдающиеся в геномах. Приведите примеры (можно - из головы)
  6. NGS секвенирование

    1. Сколько фотографий будет получено при секвенировании парнокоцевых чтений длины 100 нуклеотидов на секвенаторе фирмы Illumina?
    2. Рассчитать значение Phred quality score при значении вероятности ошибки 0,02.
    3. Объясните основной графический выход программы FastQC
    4. Какой на сегодня принятый нижний порог Phred quality score при анализе качества чтений?
  7. Что и зачем секвенируют?

    1. Геном, экзом, транскриптом, метилом — объясните термины.
    2. Зачем нужны полные геномы? Приведите пример.
    3. Для решения какой задачи необходимо секвенировать и анализировать транскрибируемые спейсеры?
  8. Картирование

    1. Что такое SNP?
    2. Какую информацию о полиморфизме можно узнать из базы 1000 genomes?
    3. В чем отличие при картировании чтений, полученных при секвенировании экзома и транскриптома?
    4. Какую информацию хранят в файлах с расширениями: fasta, fastq, sam, bam, vcf, bed?
  9. Транскриптом

    1. В каком году появились первые работы по секвенированию транскриптома?
    2. Приведите пример фракций РНК, которые выделяют для секвенирования (4 типа).
    3. Где важнее глубина секвенирования: при анализе экзома или транскриптома?
  10. Сборка de novo

    1. Дан размер генома, число чтений и длина каждого чтения. Как рассчитать ожидаемое количество нуклеотидов, не покрытых ни одним чтением (в предположении равномерного распределения чтений по геному)?
    2. Прочтения (риды), контиги, скэффолды, покрытие, N50, L50 — объясните термины
    3. Что такое парные риды и как они используются при сборке генома? (Еще бывает mate pair sequencing, но этого не было в лекциях, и я не знаю как принято переводить на русский :( ААл)

    4. Что такое k-меры и граф де Брюйна, используемый большинством сборщиков?