О себе | I семестр | II семестр | Сайт ФББ



Банки нуклеотидных последовательностей

1. Качество сборки генома эукариотического организма



Был выбран организм Callithrix jacchus - обыкновенная игрунка.
Обитает в северо-восточных и центральных лесах Бразилии, средняя длина - 20 см, а средний вес - 250 г.

На данный момент существуют 4 сборки генома.
Описание для сборки GCA_000004665.1:
Общая длина 2,914,958,544
Число скаффолдов 8,534
Число контигов 202,483
Contig N50 29,273
Contig L50 26,764
Аннотированных белков 0

Ссылка не публикацию с описанием проекта
Ссылка на последовательность одного из скаффолдов в RefSeq (последовательностей контигов нет)

2. Описние семи ключей, используемых в таблицах особенностей INSDC

Future key Definition Examples
C_region константная область лёгкой и тяжёлой цепей иммуноглобулина и альфа, бета, гамма цепей Т-клеточного рецептора; включает в себя один экзон или более в зависимости от конкретной цепи Tachysurus fulvidraco isolate Tf-2017 unplaced genomic scaffold, ASM372403v1 Contig440_pilon, whole genome shotgun sequence
     C_region        join(41679..41685,42318..42631)
                     /gene="LOC113633994"
                     /standard_name="immunoglobulin lambda constant 6-like"
                     /note="Derived by automated computational analysis using
                     gene prediction method: Gnomon. Supporting evidence
                     includes similarity to: 14 Proteins"
                     /db_xref="GeneID:113633994"
centromere область биологического интереса, распознаваемая как центромера, подтверждённая экспериментально Saccharum hybrid cultivar clone 7.12 centromere sequence
     centromere      <1..>305
gene область биологического интереса, идентифицированная как ген, для которой определено название Klebsiella pneumoniae strain BJCFK909 plasmid p4s2, complete sequence
     gene            join(5272..5596,1..26)
                     /locus_tag="EH202_RS30235"
                     /old_locus_tag="EH202_30235"
misc_recomb сайты любых событий обобщённых, сайт-специфичных или репликативных рекомбинаций, где наблюдается разрыв или восстановление дуплекса ДНК, который не может быть описан другими ключами или спецификаторами рекомбинаций Nicotiana tabacum transgenic clone GmLN ribulose-1,5-bisphosphate carboxylase/oxygenase large subunit and aminoglycoside resistance protein genes, complete cds; plastid
     misc_recomb     2688..2721
                     /note="LoxP sequence"      
mobile_element область генома, в которой содержатся подвижные элементы region of genome containing mobile elements Salmonella enterica subsp. enterica serovar Typhi strain 311189_217186 plasmid pHCM1, complete sequence
     mobile_element  complement(107632..129810)
                     /mobile_element_type="retrotransposon:tn21"      
modified_base отмеченный этим ключом нуклеотид - модифицированный, и тип модификации должен быть отмечен спецификатором /mod_base Erysimum latent virus, complete genome
     modified_base   1
                     /note="putative part of a cap structure that probably
                     occurs in all tymoviruses"
                     /mod_base=m7g      
polyA_site сайт на транкрипте РНК, к которому будут добавлены остатки аденина на этапе пост-транскрипцианной полиадениляции Homo sapiens Rh blood group CcEe antigens (RHCE), transcript variant 1, mRNA
     polyA_site      1546
                     /gene="RHCE"
                     /gene_synonym="CD240CE; RH; RH30A; Rh4; RHC; RHCe(152N);
                     RHE; RhIVb(J); RHIXB; RHNA; RHPI; RhVI; RhVIII"      

3. Описание одного из массовых геномных проектов

100K Food Pathogen Project

Проект проводится управлением по санитарному надзору за качеством пищевых продуктов и медикаментов США (Food and Drug Administration, FDA) при поддержке Калифорнийского университета в Дейвисе (U.C. Davis). Еще одна ссылка.
Проект был открыт в 2013 г., последняя публикация по проекту была опубликована в сентябре 2018 г. (ссылка на PubMed)
На данный момент отсеквенировано более 35 тыс. геномов из 100 тыс. запланированных.
The 100K Pathogen Genome Sequencing Project направлен на получение и анализ генетической информации, что важно для сельского хозяйства, здоровья людей и окружающей среды всего мира.

4. Таблица митохондриальных генов одного из организмов таксона Teleostei (Костистые рыбы)

Текст запроса:

tax_tree(32443) AND mol_type="genomic DNA" AND topology="CIRCULAR" AND organelle="mitochondrion"
Количество результатов: Update - 223
Release - 4,430
Выбранный организм - Sardinella fijiensis, MH011393.
Сардинеллы — род морских лучепёрых рыб семейства сельдевых.
Таблица с митохондриальными генами Sardinella fijiensis






© Антоненкова Юлия, 2017