Базы данных

Задание 1. Сборка генома эукариотического организма

Крыса серая (Rattus norvegicus) - симпатичное млекопитающее из отряда грызунов. Это очень умные социальные животные, живущие большими группами. В настоящее время крысы разводятся в качестве лабораторных животных и домашних любимцев (Рис. 1). Крысы легко приручаются: предположительно, одомашнивать пасюков (диких крыс), люди начали в 19 веке[1]. Люди до сих пор изучают устройство крысиного общества крысиного общества. У многих на слуху опыт, так называемый "крысиный рай": Джон Би Кэлхун с 1958 по 1962 год построил большой полигон, в котором было все, необходимое для комфортной крысиной жизни. Полигон был разделен на 4 отсека, в каждый из которых было посажено по 12 крыс. Ученые также контролировали численность крыс в отсеках. В конце концов в отсеках выстроилась строгая иерархия: лидерами крайних отсеков были сильные самцы, жившие в окружении нескольких самок, слабые самцы изгонялись в центральные отсеки. Крысы в центральных отсеках демонстрировали нестандартное поведение: у них увеличивалась агрессия, у одних пропадал интерес к спариванию, другие пытались спариваться со всеми крысами подряд, независимо от пола. Также в центральных отсеках процветал каннибализм. Чуть позже этот же опыт был проделан с мышами, но численность популяции не контролировалась учеными. В итоге был сделан вывод, что крысиное общество - иллюстрация человеческого. Крысы, как и люди, играют определенные социальные роли. Конкуренция между особями, играющими разные роли, приводит к нарушению социальных связей и распаду общества, что приводит к вымиранию популяции[2].

Так что изучение крыс важно не только для получения информации о строении и функциях организма, но и для изучения строения общества. Всего в нуклеотилдных базах данных 10 сборок генома, а сам геном состоит из 11 пар хромосом. Далее представлена краткая информация о модельном крысином геноме (табл. 1).

Rat Рис. 1. Rattus norvegicus, источник - семейные архивы
Табл. 1. Информация о сборке генома крысы серой
Assembly name (сборка) mRatBN7.2
RefSeq GCF_015227675.2
Assembly level (уровень сборки) Chromosome
Длина последовательности 2,647,915,728
Число скэффолдов 176
N50 скэффолдов 135,012,528
L50 скэффолдов 8
Число контигов 757
N50 контигов 29,198,295
L50 контигов 27
PubMed DOI: 10.12688/wellcomeopenres.16854.1
Ссылка на контиг JACYVU010000019.1

Задание 2. Последовательность CDS одного из прокариотических вирусов

Для выполнения работы был выполнен поиск в NCBI: ((Bicaudaviridae[Organism]) AND 70000:80000[Sequence Length]) AND complete genome , который выдал 6 полных геномов различных вирусов семейства Bicaudaviridae. Из этого списка был выбран один геном вируса Sulfolobus, информация о котором приведена в табл. 2.

Файл с участками генома, кодирующими блки был получен так: Send to: => Coding sequences => FASTA Nucleotide => Create file. Файл сохранился в формате .txt, поэтому формат был вручную изменен на .fasta.

Табл. 2. Информация о геноме вируса
AC JQ287645
Название, TaxID Sulfolobus virus STSV2, NCBI:txid1123964
Тип генома Линейная dsDNA (хромосома)
Хозяин вируса Археи, модельные виды Sulfolobus
Файл с участками генома, кодирующими белки (CDS) Файл

Задание 3. Ключи таблицы локальных особенностей

Feature keys или локальные особенности используются для описания биологической природы аннотированного объекта или соержат информацию об изменениях в последовательности или других ее версиях. Несколько ключей из таблицы локальных особенностей описаны в табл. 3.

Табл. 3. Feature keys
Key Описание Пример Источник (AC)
primer_bind Сайт нековалентного связывания праймера для инициации репликации, транскрипции или обратной транскрипции
FT   primer_bind     51539..51559
            FT                   /note='99-79335.rp  complement' FT
DL128564
stem_loop Шпилька - область спирали, образованная спариванием близких оснований
stem_loop       complement(1141692..1141742)
                     /note="29705 CACGCCGAGGCCCCC-GCGACGTCC 29278 - 29731
                     GGACGTCACCGGGGGCCTCGGCGTG 29755. Score 53: 23/24 (95%)
                     matches, 1 gap"
AL645882
variation Стабильная мутация гена у родственных штаммов (полиморфизмы и др.)
variation       10901
                     /note="Variation type: SNP; Variations: C/T; Frequencies:
                     74.0/26.0; Amino acid change: Arg -> Lys"
MH844529
N_region Дополнительные нуклеотиды, встроенные между перестроенными участками иммуноглобина
 N_region        13..17
                     /gene="IGH"
                     /note="P/N nucleotide"
FM162507
intron Интрон. Участок ДНК, который транскрибируется, но удаляется путем сращивания последовательностей (экзонов) по обще стороны от него. В FT сверху и снизу от интронов всегда описаны экзоны.
intron          complement(21703..21757)
                     /locus_tag="XAT740_LOCUS16309"
                     /note="ID:intron-78747;
                     source:AUGUSTUS"
CAJNOR010001035

Литература:

1. Как Сибирсикие ученые крыс приручили. Институт цитологии и генетики Сибирского отделения РАН

2. Джон Би Кэлхун. Википедия