Для выполнения этого практикума я решила изучить качество сборки генома зебровой амадины (Taeniopygia guttata),
так как, во-первых, мне нравятся птички, во-вторых, эта амадина является популярным модельным организмом.
Из 7 сборок я выбрала одну лучшую
bTaeGut1_v1.p
(не новейшая и не самая длинная сборка, но с наибольшим покрытием и с определенным количеством участков, кодирующих белки)
и по ней составила следующую таблицу.
Вы можете посмотреть
последовательность
одного из контигов в RefSeq.
В этом задании у меня были ограничения на поиск вирусов: семейство
Siphoviridae и длина генома
70000-80000.
Поиск производился по Nucleotide на сайте NCBI через Advanced search (текст запроса:
"((Siphoviridae) AND 70000:80000[Sequence Length]) AND complete").
В итоге, согласно разделу Source databases, нашлось 250 последовательностей из GenBank и 84 из RefSeq. Я выбрала геном Mycobacteriophage Wildcat и по нему составила
таблицу 2. Вы можете посмотреть
файл, с участками генома, предположительно кодирующими белки (CDS) (файл был получен
через Send to: -> coding sequences -> format: FASTA Nucleotide).
Описание я искала на сайте INSDC. Была составлена таблица 3 с семью ключами, описанием и примерами к ним.