Практикум №7

Задание 1. Выбор сборки генома.

Я выбрала растение Impátiens glandulífera (недотрога железистая). С этим растением я познакомилась, когда проходила практику на биостанции в Звенигороде.

Impátiens glandulífera - однолетнее растение. Недотрога происходит из Западных Гималаев, где растет вдоль берегов рек, в пойменных лесах, на высотах 1600-4300 метров над уровнем моря. Изначально растение было завезено в другие области в качестве декоративного, однако сейчас оно считается сорным.

Хромосом у Impátiens glandulífera 2n=18. Интересно, что методом создания интродукционной популяции выявлено, что у недотроги выработалась генетически закреплённая географическая изменчивость некоторых биологических признаков: с севера на юг достоверно возрастают высота и число метамеров главного побега, увеличиваются продолжительность периода роста растений и биомасса надземной части.

photo

Рис.1. Impátiens glandulífera

Мой поисповой запрос был просто: "Impatiens glamdulifera", было найдено 2 сбоки генома, но только одна из них удовлетворяет требованием практикума.

Уровень сборки выбранного генома - Chromosome. Это последовательность одной или нескольких хромосом. Они могут быть полностью секвенированные без пробелов или могут модержать каркасы и континги с пробелами.

Выбранный геном является референсным . Референсный геном - это отобранный вручную высококачественный геном, который определили в качестве стандарта и с которым сравниваются другие данные.

Задание 2. Создание таблицы с характеристикой генома.

Идентификатор GenBank GCA_907164915.1
Идентификатор RefSeq GCF_907164915.1
Общий размер генома 653.9 Mb
Scaffold N50 61.9 Mb
Scaffold L50 4
Contig N50 1.9 Mb
Contig L50 92

Таблица 1. Характеристика выбранной сборки

N50 - длина контингов (или скаффолдов), для которой справедливо, что половина всех нуклеотидов сборки может уместиться в сумме контингов (или скаффолдов) такой же или большей.

L5O - самое маленькое число контнгов (или скаффолдов), в которых умещается половина всех нуклеотидов сборки.

Задание 3. Скачивание нужных файлов.

Я скачала с NCBI информацию о геномной сборке, а именно:

  • Последовательность генома в формате FASTA.
  • Последовательность белков в формате FASTA.
  • Последовательность генома с аннотацией (GBFF).