Банки нуклеотидных последовательностей

Задание 1. Качество сборки генома эукариотического организма

Название: Обыкновенная лиса (Vulpes vulpes)
Число сборок генома: 1 
Основная информация по сборке VulVul2.2:

Общая длина (последовательность)		2,421,568,072
Число контигов сборки				183,898
N50 и L50					55,450 и 12,033 соответствено
Число аннотированных белков			37915
Публикация с описанием проекта			 PRJNA378561 
Последовательность контига NBDQ01000002.1	 ссылка 

Задание 2. Описание семи ключей, используемых в таблицах особенностей

Название Описание Пример
repeat_region область генома, содержащая повторяющиеся участки /allele="text" /citation=[number] /db_xref=":" /experiment="[CATEGORY:]text" /function="text" /gene="text" /gene_synonym="text" /inference="[CATEGORY:]TYPE[ (same species)][:EVIDENCE_BASIS]" /locus_tag="text" (single token) /map="text" /note="text" /old_locus_tag="text" (single token) /rpt_family="text" /rpt_type= /rpt_unit_range= /rpt_unit_seq="text" /satellite="[:][ ]" /standard_name="text" Ссылка на страницу с записью repeat_region 38208..39077 /inference="COORDINATES: alignment:crt:1.2" /inference="COORDINATES: alignment:pilercr:v1.02" /rpt_family="CRISPR" /rpt_type=direct /rpt_unit_range=38210..38237 /rpt_unit_seq="gttcactgccgtataggcagctaagaaa"
rRNA Зрелая рибосомальная РНК /allele="text" /citation=[number] /db_xref=":" /experiment="[CATEGORY:]text" /function="text" /gene="text" /gene_synonym="text" /inference="[CATEGORY:]TYPE[ (same species)][:EVIDENCE_BASIS]" /locus_tag="text" (single token) /map="text" /note="text" /old_locus_tag="text" (single token) /operon="text" /product="text" /pseudo /pseudogene="TYPE" /standard_name="text" Ссылка на страницу с записью rRNA <1..>2343 /locus_tag="DQH20_RS26435" /product="23S ribosomal RNA"
CDS Кодирующая последовательность; последовательность нуклеотидов, которой соответствует последовательность аминокислот в белке ; содержит информацию о продукте гена, функции; названии, координатах гена и др. /allele="text" /artificial_location="[artificial_location_value]" /citation=[number] /codon_start=<1 or 2 or 3> /db_xref=":" /EC_number="text" /exception="[exception_value]" /experiment="[CATEGORY:]text" /function="text" /gene="text" /gene_synonym="text" /inference="[CATEGORY:]TYPE[ (same species)][:EVIDENCE_BASIS]" /locus_tag="text" (single token) /map="text" /note="text" /number=unquoted text (single token) /old_locus_tag="text" (single token) /operon="text" /product="text" /protein_id="" /pseudo /pseudogene="TYPE" /ribosomal_slippage /standard_name="text" /translation="text" /transl_except=(pos:,aa:) /transl_table = /trans_splicing Ссылка на страницу с записью CDS complement(<1..493) /locus_tag="DQH20_RS30475" /inference="COORDINATES: similar to AA sequence:RefSeq:NP_253960.1" /note="Derived by automated computational analysis using gene prediction method: Protein Homology." /codon_start=1 /transl_table=11 /product="hypothetical protein" /protein_id="WP_074246002.1" /translation="MALLGITLLAGAAFVGGYLYRRGLDRRRYRFIQQFRLPPRVAQA VRERYPQLSEEQVQRVLGGLREYLLLCRAAGKRMVAMPSQVVDVAWHELILHTRLYQH VCRKGLGRFLHHTPAQAMRSPRQAQEGIQRAWKLACRREGIDPLNPTRLPLLFALDTE LAIA"
exon область генома, кодирующая часть сплайсированной мРНК, рРНК и тРНК; может содержать 5'UTR, все CDSs и 3 ' UTR; /allele="text" /citation=[number] /db_xref=":" /EC_number="text" /experiment="[CATEGORY:]text" /function="text" /gene="text" /gene_synonym="text" /inference="[CATEGORY:]TYPE[ (same species)][:EVIDENCE_BASIS]" /locus_tag="text" (single token) /map="text" /note="text" /number=unquoted text (single token) /old_locus_tag="text" (single token) /product="text" /pseudo /pseudogene="TYPE" /standard_name="text" /trans_splicing Ссылка на страницу с записью exon 1..1732 /gene="LOC100304347" /gene_synonym="GRMZM2G035664" /inference="alignment:Splign:2.1.0" /pseudo
gene область биологического молекулы, идентифицированная как ген и для которого было назначено имя /allele="text" /citation=[number] /db_xref=":" /experiment="[CATEGORY:]text" /function="text" /gene="text" /gene_synonym="text" /inference="[CATEGORY:]TYPE[ (same species)][:EVIDENCE_BASIS]" /locus_tag="text" (single token) /map="text" /note="text" /old_locus_tag="text" (single token) /operon="text" /product="text" /pseudo /pseudogene="TYPE" /phenotype="text" /standard_name="text" /trans_splicing Ссылка на страницу с записью gene 2824..3750 /locus_tag="YCL074W" /note="Pseudogene: encodes fragment of Ty Pol protein" /pseudo
mat_peptide зрелая кодирующая белок или пептид последовательность, не включающая стоп-кодон, в отличие от СDS /allele="text" /citation=[number] /db_xref=":" /EC_number="text" /experiment="[CATEGORY:]text" /function="text" /gene="text" /gene_synonym="text" /inference="[CATEGORY:]TYPE[ (same species)][:EVIDENCE_BASIS]" /locus_tag="text" (single token) /map="text" /note="text" /old_locus_tag="text" (single token) /product="text" /pseudo /pseudogene="TYPE" /standard_name="text" Ссылка на страницу с записью mat_peptide join(1598..1694,2244..2386)
misc_feature область биологического молекулы, которая не может быть описана любым другим ключом характеристики; Новая или редкая характеристика /allele="text" /citation=[number] /db_xref=":" /experiment="[CATEGORY:]text" /function="text" /gene="text" /gene_synonym="text" /inference="[CATEGORY:]TYPE[ (same species)][:EVIDENCE_BASIS]" /locus_tag="text" (single token) /map="text" /note="text" /number=unquoted text (single token) /old_locus_tag="text" (single token) /phenotype="text" /product="text" /pseudo /pseudogene="TYPE" /standard_name="text" Ссылка на страницу с записью misc_feature 795..852 /note="23S ribosomal RNA rRNA prediction is too short"

Задание 3. Геномный проект "1000 геномов грибов" или 1KFG

К настоящему моменту нам известно около 1.5 миллиона различных грибов. Они представляют огромную часть Дерева Жизни и оказывают громадное влияние на биосферу и деятельность человека.

Грибы - это и редуценты органики, и патогены, среди них также много симбионтов различных растений. Мы должны понимать как они функционируют и как они взаимодействуют в естественных и искуственных условиях, если хотим использовать представителей царства грибов.

Цель проекта - за 5 лет секвенировать геномы 1000 грибов с разных ветвей эволюционого дерева этого царства.

Международная исследовательская группа работает над этим проектом в сотрудничестве с Объединенным институтом генома министерства энергетики США.

Работа началась в 2012 году, к настоящему моменту отсеквенировано и опубликовано более, чем 1000 геномов грибов, и исследователи занялись анализом полученных данных
для извлечения дополнительной информации о грибах.
 Ссылка на страницу с записьюCсылка на одну из последних публикаций в 2017 году
 Cсылка на сайт проекта

Задание 4. Таблица митохондриальных генов

Текст запроса: tax_tree(6040) AND mol_type="genomic DNA" AND topology="CIRCULAR" AND organelle="mitochondrion"
Был произведен поиск по ENA на сайте EBI, 
в результате чего было получено 0 находки в Update и 65 находки в Release  
В качестве представителя таксона был выбран организм Amphimedon compressa (Sequence: EU237474.1)

Таблицу митохондриальных генов морского конька вы можете загрузить, кликнув по  ссылка
На рисунке ниже представлено расположение соответствующих кодирующих участков в геноме; в рассматриваемой записи было представлено 14 белковых продуктов