Главная Семестры Обо мне

Геномы

Сборка генома серой вороны

something went wrong
Рисунок 1. Серая ворона источник

Corvus cornix - вид птиц из рода воронов. Всеядные и вездесущие (ареал - почти вся евразия), могут наносить ущерб экосистемам. Известны своей сообразительностью: могут активно использовать окружающие предметы для получения и преобразования пищи, запоминают места спрятанной добычи, различают людей по их намерениям (боятся охотников, но не обычных прохожих). Собираются в стаи, чтобы атаковать, могут нанести вред даже взрослому и запоминают врагов.

Информация о сборке генома
Количество сборок 2
Название лучшей сборки ASM202325v2
AC (GenBank) GCA_002023255.2
Уровень сборки Scaffold
Длина последовательности 1,050,110,261
Число скэффолдов 145
Scaffold N50 18,368,925
Scaffold L50 18
Число контигов 2,410
Contig N50 8,911,460
Contig L50 33
Число аннотированных белков 0 (у более ранней сборки - 29601)
Публикация с описанием проекта лежит вот здесь

Последовательно перейдя по строчкам WGS Project: и WGS, можно попасть на страницу с контигами, которые на самом деле скэффолды?.. Ну ничего не поделаешь, держите сорок второй .

Поиск вирусов

Поиск по NCBI Nucleotide был проведен с помощью запроса ((Pleolipoviridae) AND 8000:9000[Sequence Length]) AND complete. Всего нашлось восемь сборок, по четыре из GenBank и RefSeq.

Описание генома вируса
AC KF056323
Название организма Haloarcula hispanica pleomorphic virus 2
TaxID вида 1442594
Тип генома DNA circular
Хозяин вируса Архея из рода Haloarcula

С помощью действий Send to:, Coding Sequences и FASTA Nucleotide можно получить файл с участками, предположительно кодирующими белки.

Ключи из таблицы особенностей

Ключ Описание Пример использования
C_region Постоянная область легких и тяжелых цепей иммуноглобулина, а также альфа-, бета- и гамма-цепей рецептора Т-клеток
C_region        15233..15312
                /note="A+T rich region; control region"
          
misc_feature Регион, который представляет биологический интерес, но не может быть описан другими ключами (новая или редкая особенность)
misc_feature    complement(116..>204)
                /locus_tag="GDB70_RS27695"
                /inference="COORDINATES: nucleotide
                motif:Rfam:12.0:RF01497"
                /inference="COORDINATES: profile:INFERNAL:1.1.1"
                /note="AL1L pseudoknot; Derived by automated computational
                analysis using gene prediction method: cmsearch."
                /pseudo
                /db_xref="RFAM:RF01497"
          
mobile_element Регион, содержащий мобильные элементы
mobile_element  23436..25130
                /inference="COORDINATES: nucleotide
                motif:RepeatMasker:4.0.6"
                /note="ERV-9 erythroid enhancer upstream of 5'HS5"
                /rpt_family="LTR/ERV1"
                /rpt_type=long_terminal_repeat
                /mobile_element_type="retrotransposon:LTR12C"
                /db_xref="GeneID:109580095"
          
oriT Область ДНК, где инициируется перенос в процессе конъюгации или мобилизации
oriT            21090..21235
               /note="origin of transference"
          
polyA_site Сайт в транскрипте РНК, к которому добавляются остатки аденина в ходе посттранскрипционного полиаденилирования
polyA_site      825
                /gene="SELENOW"
                /gene_synonym="SelW; SEPW1"
          
regulatory Любой регион, участвующий в регуляции транскрипции, трансляции, репликации или сворачивании хроматина
regulatory      complement(978..1126)
                /regulatory_class="riboswitch"
                /inference="COORDINATES: nucleotide
                motif:Rfam:12.0:RF00050"
                /inference="COORDINATES: profile:INFERNAL:1.1.1"
                /note="FMN riboswitch; Derived by automated computational
                analysis using gene prediction method: cmsearch."
                /bound_moiety="flavin mononucleotide"
                /db_xref="RFAM:RF00050"
           
STS Короткий участок, который встречается в геноме единожды и может быть использован для ориентирования, так как распознается на ПЦР
STS             1120..1292
                /gene="CHTOP"
                /gene_synonym="C10orf77; C1orf77; FL-SRAG; FOP; pp7704;
                SRAG; SRAG-3; SRAG-5"
                /standard_name="SHGC-2950"
                /db_xref="UniSTS:92087"