Банки нуклеотидных последовательностей

1. Охарактеризуйте качество сборки генома эукариотического организма

Taxonomy ID: 345164
Scientific name: Falco cherrug (Gray, JE, 1834)
homotypic synonym: Saker falcon
Inherited blast name: birds
Rank: species
Балобан - вид хищных птиц семейства соколиных. Редкий гнездящийся, кочующий, в некоторые годы частично оседлый вид.
число сборок генома 1 (GCA_000337975.1)
общая длина сборки: 1,174,811,7157
число контигов сборки: 75,898
число скэффолдов сборки: 5,863
Scaffold N50: 4,154,532
Scaffold L50: 84
Contig N50: 31,327
Contig L50: 10,949
число аннотированных белков: 22,273
ссылку на последовательность контига KB397228.1 в RefSeq
Полезные ссылки: assembly bioproject genome taxonomy

2. Опишите семь Ключей (Feature Keys) таблиц особенностей (FT или Feature table)

информация была найдена по ссылке
примеры взяты из data-файла пятого задания или с сайта по ссылке на предыдущей строке + поисковик google
Feature Key Описание Пример
assembly_gap Границы разрыва между участками генома или транскриптома assembly_gap 1989..2140
/estimated_length=152
/gap_type="within scaffold"
/linkage_evidence="paired-ends"
CDS Кодирующая последовательность белка, те ей соответсвует последовательность аминокислот в белке CDS 1..1575
/codon_start=1
/transl_table=5
/gene="COX1"
/product="cytochrome c oxidase subunit I"
/protein_id="APU89575.1"
/translation="MNIYKKYQGGLSVWLESSNHKDIGTLYFLFGLWSGMIGTSLSLII RLELAKPGILLGNGQLYNTIITAHAILMIFFMVMPSMIGGFGNWMLPLMLGAPDMSFPR LNNLSFWLLPTAMFLILDSCFVDMGCGTSWTVYPPLSTLGHPGSSVDLAIFSLHCAGLS SILGGINFMCTTKNLRSSSISLEHMSLFVWTVFVTVFLLVLSLPVLAGAITMLLTDRNL NTSFFDPSTGGNPLIYQHLFWFFGHPEVYILILPAFGIISQSTLYLTGKKEVFGSLGMV YAILSIGLIGCVVWAHHMYTVGMDLDSRAYFTAATMVIAVPTGVKVFSWLATLFGMKMK FQPLLLWVLGFIFLFTIGGLTGVVLSNSSLDIILHDTYYVVSHFHYVLSLGAVFGIFTG VSLWWSFMTGFVYDKLMMSAVFFLMFVGVNLTFFPLHFAGLHGFPRKYMDYPDVYSVWN VMSSYGSMISVFAMFLFMYVLIESFFSYRLVLVDNFTNSSPEYSYSSYVFGHSYQSDIY FSSTVMK"
source Идентифицирует "источник последовательности", ее указанного диапазона source 1..13355
/organism="Nippostrongylus brasiliensis"
/organelle="mitochondrion"
/host="Rattus norvegicus"
/mol_type="genomic DNA"
/country="New Zealand"
/db_xref="taxon:27835"
centromere Область, идентифицированная как центромера (промежуток ДНК, который соотвествует области, где хроматиды соединяются друг с другом и где формируется кинотохор centromere 114385..114394
/note="CEN3_CDEI of CEN3"
tRNA
rRNA
Область, идентифицированная как тРНК в первых 4х примерах, как рРНК в последнем примере tRNA 1589..1638
/product="tRNA-Cys"
tRNA 1649..1705
/product="tRNA-Met"
tRNA 1706..1760
/product="tRNA-Asp"
tRNA 1764..1819
/product="tRNA-Gly"
rRNA 2571..3522
/product="large subunit ribosomal RNA"
misc_feature Новая, редкая или специфичная черта последовательности misc_feature 5498..5578
/note="AT rich region"
exon
intron
operon
Область, идентифицированная как экзон, интрон или оперон соответственно exon 141797..142149
/gene="LOC100288016"
/note="Derived by automated computational analysis using
gene prediction method: Curated Genomic."
/pseudo
intron 568..788
/gene="ubc42"
/number=1
operon 160..6865
/operon="gal"

3. Опишите состояние дел в одном из массовых геномных проектов

название проекта цель год начала ссылка на страницу организация страна планируемое число геномов год завершения сколько геномов секвенировано на настоящее время последняя публикация по проекту
100 000 геномов людей выявление общих генетических черт, лежащих в основе ряда серьезных заболеваний, например некоторых форм рака или наследственных заболеваний, в том числе и редких 2012 The 100,000 Genomes Project Genomics England Великобритани 100000 геномов не завершено? 87 231 по состоянию на 1ое октября
100 000 по состоянию на 5ое декабря
публикация о достижении 100 000 геномов

4. Составьте таблицу митохондриальных генов одного из организмов таксона Basidiomycota

Поиск выполнялся по ENA (EMBL) на сайте EBI
Поиск проводился в ENA по таксону Basidiomycota и содержал следующий текст запроса:
tax_tree(1715256) AND mol_type="genomic DNA" AND topology="CIRCULAR" AND organelle="mitochondrion"
Результат был "No results found for <имя команды>"
К сожалению, каким бы образом я ни выбирала команду, ответ поисковика оставался тем же. Тогда я задала новую команду при поиске "tax_eq(1586276)", таким образом пытаясь узнать, есть ли вообще представители моего таксона в этой базе данных. И результат оказался всего 1:
KM605201Basidiomycota sp. 16F-3 18S ribosomal RNA gene, partial sequence.
В связи с тем, что на моем таксоне выполнить работу не получится, я взяла другой таксон, который уже был в таблице: Nematoda. организм, разумеется, был выбран не такой, как у других ребят.

5. Составьте таблицу митохондриальных генов одного из организмов таксона Nematoda

Поиск проводился в ENA по таксону Nematoda и содержал следующий текст запроса:
mol_type="genomic DNA" AND topology="CIRCULAR" AND organelle="mitochondrion" AND tax_tree(6231)
В результате получили 2 находки в Update и 313 - в Release
Выбранный организм - Nippostrongylus brasiliensis (AC: KY347017.1)
Nippostrongylus brasiliensis mitochondrion, complete genome
Sequence length - 13,355
Расположение белков в этом геноме
таблица генов белков, закодированных в митохондриальном геноме
короткое название гена полное название координаты в геноме ориентация в геноме идентификатор в БД белков
COX1 cytochrome c oxidase subunit I 1..1575 main chain APU89575.1
COX2 cytochrome c oxidase subunit II 1820..2515 main chain APU89577.1
ND3 NADH dehydrogenase subunit 3 3523..3858 main chain APU89576.1
ND5 NADH dehydrogenase subunit 5 3858..5439 main chain APU89585.1
ND6 NADH dehydrogenase subunit 6 5689..6123 main chain APU89582.1
ND4L NADH dehydrogenase subunit 4L 6124..6356 main chain APU89578.1
ND1 NADH dehydrogenase subunit 1 7339..8206 main chain APU89579.1
ATP6 ATP Synthase 6 8207..8806 main chain APU89586.1
ND2 NADH dehydrogenase subunit 2 9003..9842 main chain APU89583.1
CYTB cytochrome b 10076..11186 main chain APU89580.1
COX3 cytochrome c oxidase subunit III 11242..12007 main chain APU89581.1
ND4 NADH dehydrogenase subunit 4 12074..13291 main chain APU89584.1

© Grigorjeva Masha