Характеристика сборки генома Aquila chrysaetos
Для выполнения задания практикума была выбрана сборка bAquChr1.2 генома Aquila chrysaetos (Беркут).
Немного об организме. Беркут распространен преимущественно в Северном полушарии и чаще всего встречается в горах. Ведет оседлый образ жизни. Живут до 25 лет в природе. Является самым крупным представителем рода Орлы (Aquila), размах крыльев — до 240 сантиметров. Охотится на грызунов, зайцев, других птиц, на детенышей некоторых парнокопытных и даже на крупных особей, питается падалью. Охотится обычно парами, подолгу паря в небе и высматривая добычу или выжидая из засады. Беркут — моногамная птица. В кладке обычно находится два яйца, но чаще всего только один из птенцов выживает. Обладает превосходным зрением, способен разглядеть мелкую цель на расстоянии до двух километров. Внутри глаза находятся сразу две центральные ямки. Беркут издает голос редко, только при токовом полёте, при общении с птенцами и защите территории.



Теперь немного о сборке генома. Для данного вида было проведено 4 сборки. Как уже было сказано выше, выбрали лучшую сборку bAquChr1.2. Некоторая информация об этой сборке приведена в таблице 1. А здесь находится запись WGS (Whole Genome Shortgun). В этой записи я нашел один контиг.
Название | bAquChr1.2 |
---|---|
AC сборки из RefSeq | GCF_900496995.1 |
Уровень сборки | Хромосомный |
Общая длина последовательности | 1 203 454 851 нуклеотид |
Число скэффолдов | 142 |
Число контигов | 333 |
Скэффолд, N50 | 46 934 974 нуклеотида |
Скэффолд, L50 | 9 |
Контиг, N50 | 21 924 221 нуклеотид |
Контиг, N50 | 19 |
Число аннотированных белков | 39 713 |
Страница BioProject | PRJEB27699 |
Файл с контигом (.fasta) | UFQG02000001.1 |
CDS вируса
Для начала нужно было получить список полных геномов прокариотических вирусов Sphaerolipoviridae длиной от 10 000 до 20 000 пар оснований. Для этой цели применили следующий запрос в NCBI Nucleotide:
(Sphaerolipoviridae[Organism]) AND 10000:20000[Sequence Length]В результате получили 6 находок (3 из GenBank и 3 из RefSeq).
Для дальнейшего подробного описания был выбран геном Thermus phage P23-77. Описание этого вируса можно найти в таблице 2.
AC нуклеотидной записи | NC_013197 |
---|---|
Латинское название вида | Thermus phage P23-77 |
Taxonomy ID вида | 1714272 |
Тип генома | Кольцевая ds-DNA |
Хозяин вируса | Thermus thermophilus |
Файл с CDS получил на странице нуклеотидной записи из меню
Send to: Coding Sequences FASTA (Nucleotide) Create File
7 ключей в таблице особенностей
В данном задании нужно было описать 7 любых ключей в таблице особенностей (Feature Table в GenBank).
Ключи бывают 2–ух типов: ключи особенностей и ключи квалификаторов. Данные для этого задания я взял с сайта INSDC (см. Appendix II и Appendix III).
Ключ и значение
Пример
1. regulatory (feature key) —
любой участок последовательности, который участвует в регуляции транскрипции, трансляции, репликации или структуры хроматина
regulatory 494..501 /regulatory_class="TATA_box" /gene="E1A Оригинал: AY803294
2. stem_loop (feature key) —
шпилька; сдвоенная спирализированная область, образованная парными взаимодействиями оснований между смежными комплементарными последовательностями в одинарной цепи РНК или ДНК.
stem_loop 10631..10644 /note="short hairpin (sHP)" Оригинал: NC_001474
3. gap_type (qualifier) —
тип гэпа (или соединяющего последовательности в записях сборки генома, или образованного из–за гетерохроматина, центромеры и так далее).
assembly_gap 1..10000 /estimated_length=10000 /gap_type="telomere" assembly_gap 11042..12861 /estimated_length=1820 /gap_type="within scaffold" Оригинал: DG000120
4. mobile_element_type (qualifier) —
тип и имя (или идентификатор) мобильного элемента, который описывается в feature.
mobile_element 52952..59063 /mobile_element_type="other:RLX_A_1.2" /note="unclassified" mobile_element complement(59064..67153) /mobile_element_type="retrotransposon:Sabrina_2" /note="Gypsy; 5' fragment" Оригинал: AB711913
5. product (qualifier) —
название продукта, связанного с feature, например, мРНК, полипептид, и так далее
mRNA join(14311..14626,17063..17159,30888..31078,31878..32043, 32708..33392) /gene="Spi1" /gene_synonym="Dis-1; Dis1; PU.1; Sfpi-1; Sfpi1; Spi-1; Tcfpu1; Tfpu.1" /product="spleen focus forming virus (SFFV) proviral integration oncogene" /note="Derived by automated computational analysis using gene prediction method: BestRefSeq." /transcript_id="NM_011355.2" /db_xref="GeneID:20375" /db_xref="MGI:MGI:98282" Оригинал: NC_000068
6. transl_table (qualifier) —
определяет таблицу генетического кода (при невозможности использования универсальной таблицы генетического кода).
CDS complement(43961..44659) /gene="ispD" /locus_tag="BN2069_410" /function="4-diphosphocytidyl-2-methyl-D-erithritol synthase" /note="Operon 24 Gene 3 COG1211 4-diphosphocytidyl-2-methyl-D-erithritol synthase" /codon_start=1 /transl_table>=11 /protein_id="CRX66629.1" /translation="MSAAIWVVVPAAGRGARFGAPLPKQYLQAGGQILLAHTLDALLA HPAVAGAMVVIGQDDGDWPGWSEWAGKPVLTCIGGATRAASVLAGLQALPDSVRADEF VLVHDAARPNLSLADLGRLLEVGRADPVGAILAAPVRDTLKRAGDDGGIDGTEPRERL WRALTPQLFRRHQLSRALSDAAAAGVEVTDEAMAMERQGQRPLLVEGSEDNFKVTTPA DLDRFEFVLSRRAG" Оригинал: CWHS01000001
7. protein_bind (feature key) —
определяет сайт нековалентного связывания белка с нуклеиновой кислотой.
protein_bind 111..171 /bound_moiety="nuclear binding protein ARBP" Оригинал: X84223