Упр1.1 Характеристика качества сборки генома Акрогрегаринового карлика

Немного о:

Acrobeloides nanus- червяк округлой формы. Про него мало что есть в интернете, видимо его жизнь никого не интересует((.

Название вида Acrobeloides nanus (Акрогрегариновый карлик)
число сборок генома; 1
Сборка ID:GCA_900406225.1
total length 248,054,631
Number of scaffolds 30,759
Number of contigs 33,203
Contig N50 16,472
Contig L50 4,346
число аннотированных белков; -

Ссылка на публикацию с описанием проекта.

Ссылка на последовательность одного из контигов.(FASTA)

Упр1.2 Характеристика качества сборки генома Тигрохвостового морского конька.

Немного о:

Hippocampus comes (лат.) — вид лучепёрых рыб семейства игловых (Syngnathidae). Относится к уязвимым видам.

Голова расположена под прямым углом к телу. Рыло рыбы удлиненное, рот трубчатый, что позволяет всасывать пищу. Питается планктоном, кораллами, маленькими креветками и мелкими рыбами. Длина рыла 2,2 длины головы. Тело морского конька покрыто костными пластинками. Плавают вертикально. Размер этого вида составляет примерно 15 см в длину, самцы значительно крупнее самок. Максимальный размер составляет 18,7 см.

Наиболее распространённые цвета — чередование жёлтого и чёрного. Хвост полосатый — от брюха до кончика. Особенностью морского конька является то, что он не имеет постоянного цвета. Данный вид может менять свою окраску в зависимости от окружающей среды, рациона питания, а также в минуты опасности. Продолжительность жизни в дикой природе от 1 до 5 лет, в неволе живут до 1,5 лет

Название вида Hippocampus comes (Тигрохвостовый морской конек)
число сборок генома; 1
Сборка GCA_001891065.1 (latest) (Primary assembly)
total length 493,759,415
Number of contigs 60,478
Number of scaffolds 37,376
Contig N50 39,546
Contig L50 3,292
число аннотированных белков; 41965

Ссылка на публикацию с описанием проекта.

Ссылка на последовательность одного из контигов.(FASTA)

Упр2. Описание семи ключей, используемых в таблицах особенностей.

1. Зрелая(?) рибсомальная РНК. РНК-компонента рибонуклеопротеина (рибосомы), который собирает аминокислоты в белки. пример:

     rRNA            72..1010
                     /product="s-rRNA"
                     /note="12S ribosomal RNA"
Из: Hippocampus comes mitochondrion, complete genome. (NCBI Reference Sequence: NC_020336.1)

2.Помеченный сайт последовательности: короткая, единичная ДНК последовательность которая характеризуется определенной "разметкой" и может быть обнаружена с помощью ПЦР. Участок генома может быть отображен с помощью определения порядка STSs. STS координаты включают праймеры в primer_bind ключе или праймерах. пример:5

     STS             3208..3401
                     /standard_name="RH136367"
                     /db_xref="UniSTS:210357"
из: Felis catus mitochondrion, complete genome.(NCBI Reference Sequence:NC_001700.1)

3.Биологически интригующий участок который не может быть описан с помощью других ключей (либо новье, либо встречается слишком редко) пример:

     misc_feature    join(16315..17009,1..865)
                     /note="control region; CR"
из: Felis catus mitochondrion, complete genome. (NCBI Reference Sequence:NC_001700.1)

4.rep_origin Начало репликации (старт-сайт для дубликации нуклеиновой кислоты для производства двух идентичных копий) Направления репликации могут быть различными: и вправо, и влево, и в обоих направлениях. пример:

     rep_origin      5163..5194
                     /note="for L-strand"
из: Ovis aries mitochondrion, complete genome. (NCBI Reference Sequence:NC_001941.1)

5. Транскрибируемый участок ДНК, но впоследствии удаляющийся сплайсингом. пример:

     intron          join(3154..3476,15129..15223)
                     /gene="ND5"
                     /note="group I intron"
из: Acropora digitifera mitochondrion, complete genome.(NCBI Reference Sequence:NC_022830.1)

6. Участок генома включающий в себя повторяющиеся единицы. пример:

     repeat_region   7102..7113
                     /locus_tag="Bodo_v3:repeat:20721623-20721635"
 
из: Bodo saltans genome assembly BSAL, scaffold BS_scaffold1008, whole genome shotgun sequence. (CYKH01000010)

7. Участок представляющий биологический иинтерес как теломера (который экспериментально охарактеризован). Фича telomere описывает интервал ДНК который соответствует специфической структуре на конце линейной эукариотической хромосомы. Таккая структура предназначена для сохранения целостности и постоянства конца хромосомы. Этот участок ункален по сравнению с остальной хромосомой и символизирует физический конец хромосомы. пример:

     telomere        complement(1..552)
                     /note="Chromosome I left end terminal telomere repeat.
                     Composed of an estimated 20 copies of a 24 base repeat
                     unit, and occasionally sequence variants of this repeat."
                     /rpt_type=direct
                     /rpt_type=tandem
                     /rpt_type=terminal
                     /rpt_unit_range=62..85
                     /rpt_unit_seq="ggtgtggtgtatgggtctctcagc"
из: Eremothecium gossypii ATCC 10895 chromosome I, complete sequence.(NCBI Reference Sequence:NC_005782.2)

Упр3.

Название проекта: Vertebrate Genomes Project Цель: Создать почти безошибочные сборки геномов всех 66 000 позвоночных животных. Эти геномы будут использоваться для решения фундаментальных вопросов в биологии и заболеваниях, для идентификации вымирающих видов на основе генетики и для сохранения генетической информации жизни. Год начала: International Vertebrate Genomes Project выпустил первые 15 высококачественных генома 13 сентября 2018 г.

Ссылка на страницу проекта

Организация: the Sanger Institute (Великобритания) led by Richard Durbin; the Max Planck Institute of Molecular Cell Biology and Genetics (MPI-CBG)(Германия), led by Gene Myers. the G10K consortium Планируемые число геномов: 66 000 Год завершения: 1 этап: 2021 сколько геномов секвенировано на 2017 год: Проект стартовал недавно.

последняя публикация по проекту (ссылка на PubMed).

Название проекта: 5,000 Insect Genome Project (i5k) Launched Цель: «Улучшить нашу жизнь», с помощью лучшего понимания биологии насекомых и увеличения контроля над членистоногими, которые угрожают нашему здоровью, продовольствию и экономической безопасности. Год начала: June 15, 2011 Год окончания: ~2016

Ссылка на страницу проекта

Организация: Entomological Society of America Страна: USA Планируемые число геномов: 5000 Сколько геномов секвенировано на 2017 год: 5000 (Проект должен был завершиться).

Последняя публикация по проекту (ссылка на PubMed).

Упр4. Таблица митохондриальных геномов Tunicata

Где искали: ENA; Текст запроса: 'tax_tree(7712) AND mol_type="genomic DNA" AND topology="CIRCULAR" AND organelle="mitochondrion"' Находки в Release 42, в Update 0; выбранный организм: название: Styela plicata AC выбранной записи банка: AM292601

Ссылка на таблицу

На случай если гугл таблицы тупят:

короткое название гена полное название координаты ориентация в геноме; идентификатор в БД белков (UniProtKB/TrEMBL:)
cox2 cytochrome c oxidase subunit II 1..681 прямая D0Z5P2
nad1 NADH dehydrogenase subunit 1 818..1729 прямая D0Z5P3
nad4L NADH dehydrogenase subunit 4L 1742..1984 прямая D0Z5P4
cytb cytochrome b 2053..3156 прямая D0Z5P5
cox1 cytochrome c oxidase subunit I 3528..5077 прямая D0Z5P6
nad6 NADH dehydrogenase subunit 6 5078..5527 прямая D0Z5P7
nad2 NADH dehydrogenase subunit 2 5602..6588 прямая D0Z5P8
nad5 NADH dehydrogenase subunit 5 6662..8392 прямая D0Z5P9
nad3 NADH dehydrogenase subunit 3 8450..8830 прямая D0Z5Q0
cox3 cytochrome c oxidase subunit III 9105..9887 прямая D0Z5Q1
atp6 ATPase subunit 6 10357..10983 прямая D0Z5Q2
atp8 ATPase subunit 8 10990..11088 прямая D0Z5Q3
nad4 NADH dehydrogenase subunit 4 11162..12493 прямая D0Z5Q4

Учебная почта


© Бердникович Екатерина, 2017