Учебная страница курса биоинформатики,
год поступления 2017
Задания
Для получения зачета за Практикум 13 нужно выполнить обязательную часть задания и еще выполнить 3 любые дополнительные задачи.
В отчете должны присутствовать все команды, которые Вы использовали при выполнении задания, прокомментированы все параметры и необходимость их использования.
Описывайте входные и выходные файлы, что у Вас получается на выходе! Приводите примеры
Друзья, проявляйте фантазию! Если в задании в явном виде не сказано, какие параметры нужно использовать, используйте (или не используйте) все, что Вам захочется пощупать, только объясните зачем и что получилось =)
Обязательная часть
Задача: какие гены и насколько глубоко оказались покрыты чтениями, которые Вы анализировали в Практикуме 12. Опишите эти гены: размер, координаты, функция, количество экзонов и интронов, направление, любая дополнительная информация.
Файл с разметкой генов по версии Gencode для генома человека сборки hg19 лежит тут: /P/y14/term3/block4/SNP/rnaseq_reads/gencode.genes.bed
Программа bedtools лежит тут: /P/y14/term3/block4/SNP/bedtools2/bin
Пример запуска: /P/y14/term3/block4/SNP/bedtools2/bin/bedtools intersect -h
Подсказка: предлагается из файла с выравниваем достать координаты каждого выровненного чтения (.bed), а затем пересечь эти координаты с разметкой генов. Подумайте, в каком порядке пересекать файлы и какую опцию стоит добавить, чтобы сразу посчитать количество чтений.
Дополнительные задачи
1. Получите из файла в выравниванием файл с чтениями в формате fastq
2. Получите файл с нуклеотидной последовательностью (.fasta) для одного из покрытых Вашими чтениями генов.
3. Разбейте свою хромосому на фрагменты по 1 млн нуклеотидов. Какова длина хромосомы в нуклеотидах? Сколько в результате получилось интервалов?
4. Объедините Ваши чтения в кластеры (используйте bed файл с выровненными чтениями из Обязательной части задания).
5. Наберите из Вашей хромосомы 1000 случайных фрагментов по 200 нуклеотидов.
6. Получите координаты 3`-области одного из покрытых Вашими чтениями генов длиной в 1000 нуклеотидов.
7. Получите координаты одного из покрытых Вашими чтениями генов, расширенные на 1000 нуклеотидов в обе стороны.
8. Получите координаты одного из покрытых Вашими чтениями генов, сдвинутые на 500 нуклеотидов ближе к началу хромосомы.
9. Получите непересекающиеся фрагменты, соответствующие области, покрытой Вашими чтениями (используйте bed файл с выровненными чтениями из Обязательной части задания).
10. Получите файл с координатами интервалов, покрытых Вашими чтениями, с информацией о покрытии в любом формате.