|
||||||
Главная | Семестры | Скрипты | Обо мне | Ссылки |
|
|
Картирование на референсный геном Для работы использовались очищеные чтения с прошлого практикума. А в качестве референсного генома - последовательность генома хлороспласта и митохондрии резуховидки. Для начала нужно индексировать геномы, для этого нужна следующая команда:
Далее было запущено собственно картирование:
Пакет программ samtools работает с полученными выравниваниями. Во-первых, файл был переведен в формат .bam (опция -b - формат выходного файла, опция -S - формат исходного файла, опция -h - включение заголовка), потом полученный файл был отсортирован и проиндексирован. Результат последней команды - статистика о работе программ.
На геном хлоропласта длиной 154478 нуклеотидов было положено 670678 ридов, а на геном митохондрии (длиной 366924) - 72610. Не смотря на то, что геном митохондрии больше, на нее картировалось меньше чтений, разумным объяснением может быть то, что риды получены из зеленых частей растений. Для получения дополнительной статистики по покрытию каждого нуклеотида использовалась следующая команда:
Результат - файл с набором чисел (количества положенных ридов) для каждого нуклеотида обеих органелл. С помощью Excel я посчитала среднее значение этого показателя. Для хлороспласта эта величина составила 121 чтение на нуклеотид, а для митохондрии - 19. |
|||||||||||||||||||||||
© Pogorelskaya Sasha | Last modification date: 19.02.15 |