Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2017

Задания

Для получения зачета за Практикум 13 нужно выполнить обязательную часть задания и еще выполнить 3 любые дополнительные задачи.

В отчете должны присутствовать все команды, которые Вы использовали при выполнении задания, прокомментированы все параметры и необходимость их использования.

(!) Описывайте входные и выходные файлы, что у Вас получается на выходе! Приводите примеры (!)

Друзья, проявляйте фантазию! Если в задании в явном виде не сказано, какие параметры нужно использовать, используйте (или не используйте) все, что Вам захочется пощупать, только объясните зачем и что получилось =)

Обязательная часть

Задача: какие гены и насколько глубоко оказались покрыты чтениями, которые Вы анализировали в Практикуме 12. Опишите эти гены: размер, координаты, функция, количество экзонов и интронов, направление, любая дополнительная информация.

Файл с разметкой генов по версии Gencode для генома человека сборки hg19 лежит тут: /P/y14/term3/block4/SNP/rnaseq_reads/gencode.genes.bed

Программа bedtools лежит тут: /P/y14/term3/block4/SNP/bedtools2/bin

Пример запуска: /P/y14/term3/block4/SNP/bedtools2/bin/bedtools intersect -h

Подсказка: предлагается из файла с выравниваем достать координаты каждого выровненного чтения (.bed), а затем пересечь эти координаты с разметкой генов. Подумайте, в каком порядке пересекать файлы и какую опцию стоит добавить, чтобы сразу посчитать количество чтений.

Дополнительные задачи

1. Получите из файла в выравниванием файл с чтениями в формате fastq

2. Получите файл с нуклеотидной последовательностью (.fasta) для одного из покрытых Вашими чтениями генов.

3. Разбейте свою хромосому на фрагменты по 1 млн нуклеотидов. Какова длина хромосомы в нуклеотидах? Сколько в результате получилось интервалов?

4. Объедините Ваши чтения в кластеры (используйте bed файл с выровненными чтениями из Обязательной части задания).

5. Наберите из Вашей хромосомы 1000 случайных фрагментов по 200 нуклеотидов.

6. Получите координаты 3`-области одного из покрытых Вашими чтениями генов длиной в 1000 нуклеотидов.

7. Получите координаты одного из покрытых Вашими чтениями генов, расширенные на 1000 нуклеотидов в обе стороны.

8. Получите координаты одного из покрытых Вашими чтениями генов, сдвинутые на 500 нуклеотидов ближе к началу хромосомы.

9. Получите непересекающиеся фрагменты, соответствующие области, покрытой Вашими чтениями (используйте bed файл с выровненными чтениями из Обязательной части задания).

10. Получите файл с координатами интервалов, покрытых Вашими чтениями, с информацией о покрытии в любом формате.