1. Сборка генома эукариотического организма

Pan troglodytes (chimpanzee), Обыкновенный шимпанзе

Обыкновенный шимпанзе или просто шимпанзе - это вид больших обезьян, обитающих в лесах и саваннах тропической Африки. Относится к роду Pan, ближайший живой родственник людей.

Alain Houle (Harvard University),BMC Ecology image competition 2014 doi:10.1186/s12898-014-0024-6. Лицензия: CC BY 4.0

Число сборок генома:

6 сборок генома

Лучшей я выбрала сборку 2004 года, сборка хромосомная, cds 80 811. есть еще хромосомная сборка 2003 года, в ней белок кодирующий записей меньше.

Assembly name Clint_PTRv2
RefSeq assembly accession GCF_002880755.1 (latest)
Assembly level Chromosome
Total sequence length 3,050,398,082
Number of scaffolds 4,432
Number of contigs 5,061
Scaffold N50 53,103,722
Scaffold L50 19
Contig N50 12,268,567
Contig L50 67

Один из контигов

2. Последовательности CDS одного из прокариотических вирусов

Escherichia phage N4

Запрос: (( Podoviridae[Organism]) AND 70000:80000[Sequence Length]) AND complete genome)

Количество находок: 254. Ссылка.

EF056009
Латинское название Escherichia phage N4
TaxID 2886925
Тип генома DNA, ds, linear
Лабораторный хозяин Escherichia coli K-12, другие хозяины не указаны

участки генома, предположительно кодирующие белки (CDS).

3.Функциональный ключ

V_region

Показывает вариабельную область легкой и тяжелой цепей иммуноглобулина и альфа, бета и гама цепей Т-клеточного рецептора.Состоит из of V_segments, D_segments, N_regions и J_segments.

AC: EU599354

    V_region        1..295
                     /note="IGLV2-14*01; VL2 family"
    J_segment       293..331
                     /note="IGLJ3*01"
    C_region        332..648
                     /note="IGLC2*01"  

V_segment

Показывает вариабельный участок легкой и тяжелой цепей иммуноглобулина и альфа, бета и гама цепей Т-клеточного рецептора. Рядом указы координаты для части вариабельной области (V_region) и для последних нескольких аминокислот лидерного пептида

АС: NW_025340593

 
 V_segment       complement(join(<44..354,454..499))
                     /gene="LOC123253912"
                     /standard_name="immunoglobulin heavy variable 3-23-like" 

sig_peptide

Кодирующая последовательность для N-концевого домена секретируемого белка.

AC: OU230587

  sig_peptide     2016..2108
                     /note="MPN142 (OPT)" 

transit_peptide

Определение последовательности, кодирующей транзитный пептид. Он отвечает за транспорт белка, кодируемого ядерным геном, к определенной органелле.

AC: AJ272112

 transit_peptide <1..161
                     /gene="eno29" 

telomere

Область, обозначенная как теломера и была экспериментально охарактеризована.

AC: HG994155

 telomere 914147..917654
          /note="Homologous to S288c telomeres"