"Каждый стрелок знает, что такое гордость — эта незримая кость, не дающая шее согнуться."

Стивен Кинг, Стрелок

Добро пожаловать!

Характеристика сборки генома Arabidopsis thaliana

Название вида: Arabidopsis thaliana (Резушка Таля)

Сайт ФББ

Картинка взята с этого сайтика.

Небольшое цветковое растение из семейства крестоцветных, которое на данный момент времени распространилось по всему земному шару, кроме Антарктиды. Типичный эфемероид, жизненный цикл данного растения проходит всего в течение 6 недель. Самоопыляющееся растение высотой 20-25 сантиметров.

Благодаря небольшим размерам, короткому жизненному циклу и маленькому геному данный вид является классическим модельным объектом. В мире имеется большое количество мутантов арабидопсиса, которые используются для различных исследований. Растение активно используется для изучения ABC-модели развития цветка у покрытосеменных. Гены этих классов кодируют определенные факторы транскрипции, которые вызывают специализацию тканей растения в чашелистики и лепестки (гены класса А), лепестки и тычинки (гены класса B), тычинки и плодолистики (гены класса С).

Число сборок генома: 91

Assembly name: Arabidopsis_thaliana_Kyo

AC(GenBank): GCA_902460305.1

Assembly level: Chromosome

Общая длина: 122,202,079

Число контигов/скэффорлдов: 230/184

N50 для контигов/скэффолдов: 9,129,088/24,260,780

L50 для контигов/скэффолдов: 6/3

Число аннотированных белков: -

Ссылка на публикацию с описанием проекта: ссылочка

Скачать последовательность одного из контигов в формате fasta: последовательность

Дата публикации сборки: 28/08/2019

CDS из вирусов

Текст запроса в NCBI: Lipothrixviridae[Organism] AND ("30000"[SLEN] : "40000"[SLEN]) .

Число находок в GenBank — 9, в RefSeq — 4.

В дальшейшем для работы использовался геном Sulfolobus filamentous virus 1 isolate S48.

AC нуклеотидной записи: MH447526

Латинское название и TaxID вида: Sulfolobus filamentous virus 1, Taxonomy ID: 2304198

Тип генома: DNA, linear, ds

Хозяин вируса: Thermophilic archaea from kingdom Creanarchaeota

Ссылка на файл с CDS-частью генома: файлик

Файл скачался с NCBI по GenBank ID.

Ключи в таблице локальных особенностей

repeat_region Участок генома, содержащий короткие повторяющиеся последовательности.
 repeat_region   5566..5601
                              /note="REP1a"
                              /rpt_type=other 
mobile_element Часть генома, содержащая мобильные элементы.
   mobile_element  15387..16731
                               /mobile_element_type="insertion sequence:IS186A"
	
ncRNA Не кодирующая белок РНК.
 ncRNA  16952..17006
                     /ncRNA_class="other"
                     /gene="sokC"
                     /locus_tag="b4413"
                     /gene_synonym="ECK0019"
                     /gene_synonym="sof"
                     /product="antisense RNA blocking mokC and hokC
                     translation"
                     /db_xref="ASAP:ABE-0047238"
                     /db_xref="ECOCYC:G0-9581"
                     /db_xref="EcoGene:EG31128"
	
rRNA Гены рибосомальных РНК.
 rRNA   223771..225312
                     /gene="rrsH"
                     /locus_tag="b0201"
                     /gene_synonym="ECK0201"
                     /product="16S ribosomal RNA"
                     /db_xref="ASAP:ABE-0000677"
                     /db_xref="ECOCYC:EG30090"
                     /db_xref="EcoGene:EG30090"
	
tRNA Гены транспортной РНК.
   tRNA            225381..225457
                    	        /gene="ileV"
                                /locus_tag="b0202"
                                /gene_synonym="ECK0202"
                                /product="tRNA-Ile"
                                /note="tRNA-Ile(GAU)"
                                /db_xref="ASAP:ABE-0000679"
                                /db_xref="ECOCYC:EG30045"
                                /db_xref="EcoGene:EG30045"

	
misc_feature Участок генома, роль которого не определена.
   misc_feature    257829..257899
                               /gene="crl"
                               /locus_tag="b0240"
                               /gene_synonym="ECK0241"
                               /note="gene fragment 1 of crl"
                               /pseudo
                               /db_xref="ECOCYC:G0-16684"
	
misc_RNA Транскрипт или РНК-продукт, который не может быть определен в какие-либо иные классы из-за неизвестной функции.
 misc_RNA        20611..20823
                              /gene="tboS"
                              /locus_tag="BSU_misc_RNA_1"
                              /product="T-box riboswitch specific of serine tRNA ligase"
                              /experiment="publication(s) with functional evidences,
                              PMID:1317842,9098041,12165569,12547201"
                              /note="Evidence 1a: Function from experimental evidences
                              in the studied strain; PubMedId: 1317842, 9098041,
                              12165569, 12547201; Product type n: RNA"
                              /function="16.3: Control"