Учебный сайт Якушева Александра


Практикум 7. Банки нуклеотидных последовательностей

Сборка генома эукариотического организма

Aspergillus niger(Аспергилл черный)

Плесневый гриб из рода Аспергилл. У людей и животных может вызыать аспергиллезы. Селится на пище, а также на сырых стенах помещений. В промышленности используется для получения лимонной кислоты. Также из этих грибов получают некоторые ферменты, используемые в промышленности и биотехнологиях.

Aspergillus niger
Изображение с сайта ru.wikipedia.org
Для данного организма доступно 15 сборок.
Таблица 1. Информация о сборке
Название сборки Aspni_bvT_1
AC GCA_003344705.1
Assembly level Scaffold
Длина последовательности 35,690,699
Число контигов 416
N50 370,032
L50 30
Число скэффолдов 133
N50 705,420
L50 18
Число аннотированных белков 12194
Страница BioProject PRJNA209543
Файл с контигом (.fasta) QQZP01000001.1

CDS прокариотического вируса

Полный геном вируса семейства Podoviridae длиной 10000-20000 п.о. был найден в NCBI Nucleotide с помощью запроса '(Podoviridae[Organism]) AND (10000:20000[Sequence Length]) AND "complete genome"'.
Всего нашлось 72 в GenBank, 24 в RefSeq. Был выбран Streptococcus phage Cp-7. Информация о нем представлена в Таблице 2.

Таблица 2. Геном вируса
AC нуклеотидной записи NC_042114.1
Латинское название и TaxID Streptococcus phage Cp-7; 10748
Тип генома linear dsDNA
Хозяин вируса Streptococcus pneumoniae
Ссылка на CDS Файл. Получение: Send to -> Coding sequences -> FASTA(Nucleotide) -> Create file

Ключи таблицы особенностей

Таблица 3. Ключи таблиц особенностей
Ключ Характеристика Пример использования
regulatory Любой регион последовательности, который участвует в регуляции транскрипции, трансляции, репликации или структуры хроматина
     regulatory      complement(217823..217971)
                     /regulatory_class="riboswitch"
                     /inference="COORDINATES: nucleotide 
                     motif:Rfam:12.0:RF00050"
                     /inference="COORDINATES: profile:INFERNAL:1.1.1"
                     /note="FMN riboswitch; Derived by automated computational 
                     analysis using gene prediction method: cmsearch." 
                     /bound_moiety="flavin mononucleotide" 
                     /db_xref="RFAM:RF00050"
tRNA Зрелая транспортная РНК, малая молекула РНК (длинной 75-85 оснований), которая играет ключевую роль в трансляции
     tRNA            241918..241993 
                     /locus_tag="XB01_RS14425"
                     /old_locus_tag="XB01_14425"
                     /product="tRNA-Met"
                     /inference="COORDINATES: profile:tRNAscan-SE:1.23"
                     /anticodon=(pos:241951..241953,aa:Met,seq:cat)
ncRNA Не белок-кодирующий ген(исключая рРНК и тРНК), функциональная молекула которого представляет собой РНК транскрипт.
     ncRNA           complement(293220..293596)
                     /ncRNA_class="RNase_P_RNA"
                     /gene="rnpB"
                     /locus_tag="XB01_RS25555"
                     /product="RNase P RNA component class A"
                     /inference="COORDINATES: nucleotide
                     motif:Rfam:12.0:RF00010"
                     /inference="COORDINATES: profile:INFERNAL:1.1.1"
                     /note="Derived by automated computational analysis using
                     gene prediction method: cmsearch."
                     /db_xref="RFAM:RF00010"
mRNA Матричная РНК, включая 5-нетранслируемый участок, кодирующие последовательности и 3'-нетранслируемый участок.
     mRNA            complement(<156761..>157534)
                     /locus_tag="DI49_0143"
                     /product="hypothetical protein"
                     /transcript_id="XM_018363395.1"
                     /db_xref="GeneID:28929281"
misc_feature Участок, который представляет интерес, однако не может быть описан с помощью какого бы то ни было другого ключа
     misc_feature    1187015..1187211 
                     /note="Centromere Klla0F"
repeat_region Область генома, содержащая повторяющиеся элементы
     repeat_region   complement(2460913..2461332)
                     /note="solo LTR"
                     /rpt_type=long_terminal_repeat
mobile_element Мобильный элемент, последовательности ДНК, которые могут перемещаться внутри генома.
     mobile_element  complement(232832..234840)
                     /note="DNA transposon of KLLA part of the newly discovered
                     ROVER DNA transposon family of the Kluyveromyces:
                     degenerate copy"
                     /mobile_element_type="transposon"