Задание 1. Сборка генома эукариотического организма
Волнистый попугай (Melopsittacus undulatus) — вид птиц из семейства Psittaculidae, единственный представитель своего рода. На мой взгляд, это самые популярные домашние питомцы среди птиц. Волнистые попугайчики имеют небольшой размер тела и яркую окраску самых разных цветов. Это достаточно шумный питомец, но к их пению быстро привыкаешь, потом даже начинаешь радоваться и слушать, что же он там чирикает (исключая песни, которые начинаются в 5 утра). Волнистые попугаи довольно хорошо запоминают слова и повторяют их, из них можно сделать хороших собеседников (однако мне всегда было лень учить их говорить). Также волнистые попугаи довольно социальные животные, которые быстро привыкают к людям.
В нуклеотидных базах данных есть 4 сборки генома. Самая "лучшая" из них была выбрана и проанализирована.
Assembly name bMelUnd1.mat.Z RefSeq GCF_012275295.1 Assembly level Chromosome Длина последовательности 1 171 617 451 Число скэффолдов 864 N50 скэффолдов 104 092 594 L50 скэффолдов 5 Число контигов 1 148 N50 контигов 16 636 420 L50 контигов 19 PubMed Не найдено Ссылка на контиг AGAI01000050.1(Из сборки GCA_000238935.1) Задание 2. Последовательность CDS прокариотического вируса
Для выполнения задания был проведен следующий поиск в NCBI: ((Microviridae[Organism]) AND 6000:7000[Sequence Length]) AND complete genome. В GenBank найден 391 результат, в RefSeq 16 результатов.
Был выбран геном Enterobacteria phage alpha3, его анализ приведен ниже:
AC NC_001330 Название, TaxID Bacteriophage alpha-3, txID 10849 Тип генома Кольцевая ssDNA Хозяин вируса Энтеробактерия Файл с участками генома, кодирующими белки (CDS) Файл Участок генома, кодирующий белки был получен следующим образом: Send to: => Coding sequences => FASTA Nucleotide => Create file. Файл сохранился в формате .txt, поэтому формат был вручную изменен на .fasta.
Задание 3. Ключи таблицы локальных особенностей
D_segment
Сегмент разнообразия тяжелой цепи иммуноглобулина и бета цепь Т-клеточного рецептора
D_segment <1..17 /gene="IGH" /note="DFL16.2"AC: FM162497
STS
ДНК маркирующий сайт, уникальная короткая последовательность ДНК, расположенная в определённом месте генома
STS 1120..1292 /gene="CHTOP" /gene_synonym="C10orf77; C1orf77; FL-SRAG; FOP; pp7704; SRAG; SRAG-3; SRAG-5" /standard_name="SHGC-2950" /db_xref="UniSTS:92087"AC: NM_001317077
sig_peptide
Последовательность, кодирующая: сигнальный пептид/ N-концевой домен секретируемого белка/ домен, вовлечённый в присоединении синтезирующегося полипетида к мембранной лидерной последовательности
sig_peptide complement(6699..6776) /gene="fkpA" /locus_tag="ESCO44733_00008" /product="putative signal peptide" /inference="ab initio prediction:SignalP:4.1" /note="predicted cleavage at residue 26"AC: CABHOE010000001
rep_origin
Ориджин репликации (точка начала репликации нуклеиновой кислоты)
rep_origin complement(5296..5330) /note="OriL; origin of L-strand replication"AC: MK258084.1
telomere
Обозначение участка теломер
telomere 942396..948010 /note="TEL16R; Telomeric region on the right arm of Chromosome XVI; annotated components include an X element core sequence and a short Y' element; TEL16R does have telomeric repeats (TEL16R-TR), but they are missing from the genome annotation due to difficulties encountered during sequencing and/or assembly" /db_xref="SGD:S000029002"AC: NC_001148.4