Сборка генома не млекопитающего

Elysia chlorotica
Восточная изумрудная элизия

Брюхоногий моллюск. Первое, ставшее известным челокеву, животное, которое может осуществлять фотосинтез. Своих хлоропластов, очевидно, не имеет, поэтому получает их, употрябляя в пищу водоросль Vaucheria litorea. Интересно, что геном животного содержит гены, кодирующие белки, необходимые хлоропластам для фотосинтеза.

pr7 pr7
Источник раз (явно не первоисточник)
Источник два (тоже явно не первоисточник)

Была найдена одна сборка генома. Следовательно, она и лучшая.

Assembly name ElyChl2.0
AC GCA_003991915.1
Assambly level Scaffold
Total sequence length 557,480,303
Number of contigs 41,686
Contig N50 30,474
Contig L50 4,983
Number of scaffolds 9,989
Scaffold N50 441,954
Scaffold L50 386
Число аннотированных белков 23871

Файл в формате fasta с последовательностью контига. Был найден при переходе к WGS, а затем во вкладку с контигам, где был список только из скаффолдов.

Геном прокариотического вируса

Поиск в NCBI Nucleotide по запросу "(Siphoviridae[Organism]) AND (60000:70000[sequence length]) AND (COMPLETE GENOME[All fields])" выдал 641 результат. При этом INSDC(GenBank) - 535 и RefSeq - 106.

AC NC_028831
Латинское название вида Escherichia phage slur01
Taxonomy ID вида 1720493
Тип генома DNA, linear
Хозяин вируса Escherichia coli, бактерия

Файл в формате fasta, содержащий фрагменты генома вируса, предположительно кодирующие белки. Как скачивался файл: Send to => Coding Sequences => FASTA Nucleotide => Create file.

Описание семи ключей, используемых в таблицах особенностей

Информация взята с http://www.insdc.org/documents/feature-table#3.2.4

Ключ Описание Пример
C_region Регион легких и тяжелых иммуноглобулиновых цепей; вкулючает в себя один или больше экзонов, в зависимости от конкретной цепи MK088567.1
     C_region        125..>180
                     /gene="TRB"
                     /allele="TRB-V7-6*01"
CDS Кодирующая последовательность CP007136.1
     CDS             190..255
                     /gene="thrL"
                     /locus_tag="ECRM12581_0005"
                     /note="involved in threonine biosynthesis; controls the
                     expression of the thrLABC operon; label: thrL CDS; leader;
                     Amino acid biosynthesis: Threonine"
                     /codon_start=1
                     /transl_table=11
                     /product="thr operon leader peptide"
                     /protein_id="AHY68531.1"
                     /translation="MKRISTTITTTITITTGNGAG"
D-loop Участок митохондриальной ДНК, в котором короткий участок РНК связан с одной из цепей ДНК, мешая ее связыванию с другой цепью MN073932.1
      D-loop         1..525
mat_peptide Последовательность, кодирующая белок, в отличие от CDS без стоп кодона MF346290.1
     mat_peptide     147..1070
                     /product="P1 protein"
     mat_peptide     1071..2444
                     /product="HC-Pro protein"
     mat_peptide     2445..3494
                     /product="P3 protein"
misc_binding Сайт в нуклеиновой кислоте, который подвержен ковалентному или нековалентному взаимодействию, при этом это взаимодействие не может быть описано никаким другим существующим ключом EU382794.1
     misc_binding    213..233
                     /bound_moiety="miR390"
polyA_site Часть РНК, к которой будут присоединены аденины в ходе посттранскрипционной модификации HQ328075.1
     polyA_site      2195
                     /gene="Dila-TPN"
                     /allele="Dila-TPN*0103"
primer_bind Сайт, с которым связывается праймер (нековалентно) для инициации репликации, транскрипции, обратной транскрипции и тд MK770622.1
     primer_bind     1..21