Характеристика сборки генома Aquila chrysaetos

Для выполнения задания практикума была выбрана сборка bAquChr1.2 генома Aquila chrysaetos (Беркут).

Немного об организме. Беркут распространен преимущественно в Северном полушарии и чаще всего встречается в горах. Ведет оседлый образ жизни. Живут до 25 лет в природе. Является самым крупным представителем рода Орлы (Aquila), размах крыльев — до 240 сантиметров. Охотится на грызунов, зайцев, других птиц, на детенышей некоторых парнокопытных и даже на крупных особей, питается падалью. Охотится обычно парами, подолгу паря в небе и высматривая добычу или выжидая из засады. Беркут — моногамная птица. В кладке обычно находится два яйца, но чаще всего только один из птенцов выживает. Обладает превосходным зрением, способен разглядеть мелкую цель на расстоянии до двух километров. Внутри глаза находятся сразу две центральные ямки. Беркут издает голос редко, только при токовом полёте, при общении с птенцами и защите территории.

Golden Eagle, nestling
Рисунок 1. Птенцы в гнезде
Golden Eagle, cool head!
Рисунок 2. Голова взрослой особи. Какой взгляд!
Golden Eagle on rocks
Рисунок 3. Взрослая особь на камнях

Теперь немного о сборке генома. Для данного вида было проведено 4 сборки. Как уже было сказано выше, выбрали лучшую сборку bAquChr1.2. Некоторая информация об этой сборке приведена в таблице 1. А здесь находится запись WGS (Whole Genome Shortgun). В этой записи я нашел один контиг.

Название bAquChr1.2
AC сборки из RefSeq GCF_900496995.1
Уровень сборки Хромосомный
Общая длина последовательности 1 203 454 851 нуклеотид
Число скэффолдов 142
Число контигов 333
Скэффолд, N50 46 934 974 нуклеотида
Скэффолд, L50 9
Контиг, N50 21 924 221 нуклеотид
Контиг, N50 19
Число аннотированных белков 39 713
Страница BioProject PRJEB27699
Файл с контигом (.fasta) UFQG02000001.1
Таблица 1. Характеристика сборки генома A. chrysaetos

CDS вируса

Для начала нужно было получить список полных геномов прокариотических вирусов Sphaerolipoviridae длиной от 10 000 до 20 000 пар оснований. Для этой цели применили следующий запрос в NCBI Nucleotide:

(Sphaerolipoviridae[Organism]) AND 10000:20000[Sequence Length]

В результате получили 6 находок (3 из GenBank и 3 из RefSeq).

Для дальнейшего подробного описания был выбран геном Thermus phage P23-77. Описание этого вируса можно найти в таблице 2.

AC нуклеотидной записи NC_013197
Латинское название вида Thermus phage P23-77
Taxonomy ID вида 1714272
Тип генома Кольцевая ds-DNA
Хозяин вируса Thermus thermophilus
Таблица 2. Характеристика генома Thermus phage P23-77

Файл с CDS получил на странице нуклеотидной записи из меню
Send to: Coding Sequences FASTA (Nucleotide) Create File

7 ключей в таблице особенностей

В данном задании нужно было описать 7 любых ключей в таблице особенностей (Feature Table в GenBank).

Ключи бывают 2–ух типов: ключи особенностей и ключи квалификаторов. Данные для этого задания я взял с сайта INSDC (см. Appendix II и Appendix III).

Ключ и значение
Пример

1. regulatory (feature key) —
любой участок последовательности, который участвует в регуляции транскрипции, трансляции, репликации или структуры хроматина

regulatory      494..501
                /regulatory_class="TATA_box"
                /gene="E1A

Оригинал: AY803294

2. stem_loop (feature key) —
шпилька; сдвоенная спирализированная область, образованная парными взаимодействиями оснований между смежными комплементарными последовательностями в одинарной цепи РНК или ДНК.

stem_loop       10631..10644
                /note="short hairpin (sHP)"

Оригинал: NC_001474

3. gap_type (qualifier) —
тип гэпа (или соединяющего последовательности в записях сборки генома, или образованного из–за гетерохроматина, центромеры и так далее).

assembly_gap    1..10000
                /estimated_length=10000
                /gap_type="telomere"
assembly_gap    11042..12861
                /estimated_length=1820
                /gap_type="within scaffold"

Оригинал: DG000120

4. mobile_element_type (qualifier) —
тип и имя (или идентификатор) мобильного элемента, который описывается в feature.

mobile_element  52952..59063
                /mobile_element_type="other:RLX_A_1.2"
                /note="unclassified"
mobile_element  complement(59064..67153)
                /mobile_element_type="retrotransposon:Sabrina_2"
                /note="Gypsy; 5' fragment"

Оригинал: AB711913

5. product (qualifier) —
название продукта, связанного с feature, например, мРНК, полипептид, и так далее

mRNA            join(14311..14626,17063..17159,30888..31078,31878..32043,
                32708..33392)
                /gene="Spi1"
                /gene_synonym="Dis-1; Dis1; PU.1; Sfpi-1; Sfpi1; Spi-1;
                Tcfpu1; Tfpu.1"
                /product="spleen focus forming virus (SFFV) proviral
                integration oncogene"
                /note="Derived by automated computational analysis using
                gene prediction method: BestRefSeq."
                /transcript_id="NM_011355.2"
                /db_xref="GeneID:20375"
                /db_xref="MGI:MGI:98282"

Оригинал: NC_000068

6. transl_table (qualifier) —
определяет таблицу генетического кода (при невозможности использования универсальной таблицы генетического кода).

CDS             complement(43961..44659)
                /gene="ispD"
                /locus_tag="BN2069_410"
                /function="4-diphosphocytidyl-2-methyl-D-erithritol
                synthase"
                /note="Operon 24 Gene 3 COG1211
                4-diphosphocytidyl-2-methyl-D-erithritol synthase"
                /codon_start=1
                /transl_table>=11
                /protein_id="CRX66629.1"
                /translation="MSAAIWVVVPAAGRGARFGAPLPKQYLQAGGQILLAHTLDALLA
                HPAVAGAMVVIGQDDGDWPGWSEWAGKPVLTCIGGATRAASVLAGLQALPDSVRADEF
                VLVHDAARPNLSLADLGRLLEVGRADPVGAILAAPVRDTLKRAGDDGGIDGTEPRERL
                WRALTPQLFRRHQLSRALSDAAAAGVEVTDEAMAMERQGQRPLLVEGSEDNFKVTTPA
                DLDRFEFVLSRRAG"

Оригинал: CWHS01000001

7. protein_bind (feature key) —
определяет сайт нековалентного связывания белка с нуклеиновой кислотой.

protein_bind    111..171
                /bound_moiety="nuclear binding protein ARBP"

Оригинал: X84223

Источники