Нуклеотидные банки данных


Задание 1. Сборка генома эукариотического организма

Волнистый попугай (Melopsittacus undulatus) — вид птиц из семейства Psittaculidae, единственный представитель своего рода. На мой взгляд, это самые популярные домашние питомцы среди птиц. Волнистые попугайчики имеют небольшой размер тела и яркую окраску самых разных цветов. Это достаточно шумный питомец, но к их пению быстро привыкаешь, потом даже начинаешь радоваться и слушать, что же он там чирикает (исключая песни, которые начинаются в 5 утра). Волнистые попугаи довольно хорошо запоминают слова и повторяют их, из них можно сделать хороших собеседников (однако мне всегда было лень учить их говорить). Также волнистые попугаи довольно социальные животные, которые быстро привыкают к людям.


Моя прелесть

В нуклеотидных базах данных есть 4 сборки генома. Самая "лучшая" из них была выбрана и проанализирована.


Assembly name bMelUnd1.mat.Z
RefSeq GCF_012275295.1
Assembly level Chromosome
Длина последовательности 1 171 617 451
Число скэффолдов 864
N50 скэффолдов 104 092 594
L50 скэффолдов 5
Число контигов 1 148
N50 контигов 16 636 420
L50 контигов 19
PubMed Не найдено
Ссылка на контиг AGAI01000050.1(Из сборки GCA_000238935.1)

Задание 2. Последовательность CDS прокариотического вируса

Для выполнения задания был проведен следующий поиск в NCBI: ((Microviridae[Organism]) AND 6000:7000[Sequence Length]) AND complete genome. В GenBank найден 391 результат, в RefSeq 16 результатов.

Был выбран геном Enterobacteria phage alpha3, его анализ приведен ниже:


AC NC_001330
Название, TaxID Bacteriophage alpha-3, txID 10849
Тип генома Кольцевая ssDNA
Хозяин вируса Энтеробактерия
Файл с участками генома, кодирующими белки (CDS) Файл

Участок генома, кодирующий белки был получен следующим образом: Send to: => Coding sequences => FASTA Nucleotide => Create file. Файл сохранился в формате .txt, поэтому формат был вручную изменен на .fasta.


Задание 3. Ключи таблицы локальных особенностей


D_segment

Сегмент разнообразия тяжелой цепи иммуноглобулина и бета цепь Т-клеточного рецептора

D_segment       <1..17
                     /gene="IGH"
                     /note="DFL16.2"

AC: FM162497


STS

ДНК маркирующий сайт, уникальная короткая последовательность ДНК, расположенная в определённом месте генома

 STS           1120..1292
               /gene="CHTOP"
               /gene_synonym="C10orf77; C1orf77; FL-SRAG; FOP; pp7704;
               SRAG; SRAG-3; SRAG-5"
               /standard_name="SHGC-2950"
               /db_xref="UniSTS:92087"

AC: NM_001317077


sig_peptide

Последовательность, кодирующая: сигнальный пептид/ N-концевой домен секретируемого белка/ домен, вовлечённый в присоединении синтезирующегося полипетида к мембранной лидерной последовательности

sig_peptide    complement(6699..6776)
               /gene="fkpA"
               /locus_tag="ESCO44733_00008"
               /product="putative signal peptide"
               /inference="ab initio prediction:SignalP:4.1"
               /note="predicted cleavage at residue 26"

AC: CABHOE010000001


rep_origin

Ориджин репликации (точка начала репликации нуклеиновой кислоты)

rep_origin           complement(5296..5330)
                     /note="OriL; origin of L-strand replication"

AC: MK258084.1


telomere

Обозначение участка теломер

telomere             942396..948010
                     /note="TEL16R; Telomeric region on the right arm of
                     Chromosome XVI; annotated components include an X element
                     core sequence and a short Y' element; TEL16R does have
                     telomeric repeats (TEL16R-TR), but they are missing from
                     the genome annotation due to difficulties encountered
                     during sequencing and/or assembly"
                     /db_xref="SGD:S000029002"

AC: NC_001148.4