Учебная страничка Васюткиной Ольги | ||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||
Однонуклеотидные полиморфизмы, индели и сборкаПоиск однонуклеотидных полиморфизмов и инделейЕсть референсный геном и риды, откартированные на него (прошлая работа). Задача - сравнить их между собой и найти различия: однонуклеотидные полиморфизмы (SNP) и индели. Чтобы сравнить риды с референсным геномом, используем подпрограмму samtools mpileup.
Опции: -g, -u для файла в формате bcf в несжатом виде, -f для входного файла референсного генома в формате fasta. Чтобы получить список SNP и инделей, используем bcftools. |
||||||||||||||||||||||||||||||||||
Сборка хлоропласта и митохондрииПакет Velvet осуществляет сборку генома из ридов на основе графа де Брёйна.
Соберем геном хлоропласта и митохондрии на основе картированных ридов.
N50 - это характеристика сборки генома.
Показывает длину контига, при которой 50% гипотетической длины последовательности покрываются контигами длины, равной N50. В папке velveth_dir25 есть файл stats.txt с необходимой информацией о контигах. С помощью Excel найдем 10 наибольших значений длин контигов. Сами контиги находятся в файле contigs.fa. 10 самых длинных я выделила в файл longest.fasta. Теперь нужно сделать локальный бласт контигов по файлу organellas.fasta, в котором находится референсный геном хлоропласта и митохондрии. Данные о 10 контигах и их расположении в референсном геноме приведены в таблице 1. |
||||||||||||||||||||||||||||||||||
Таблица 1. 10 самых длинных контигов, найденных Velvet
|
© Olga Vasyutkina, 2013-2014
Дата последнего изменения: 23.12.2014
Задавайте вопросы по электронной почте