Задание 1.

Кот домашний (лат. Felis catus) - хищное млекопитающее из семейства кошачьих (Felidae). Домашнего кота рассматривают как подвид Felis silvestris. Размеры тела (без хвоста) - 60 см в длину, довольно крупное животное; вес составляет в среднем 2,5—6,5 кг. Питается мелкими грызунами, реже - птицами. У домашнего кота всего 38 хромосом и около 20 000 генов.
Данный вид используют в качестве модельного организма в исследованиях, связанных с биомедициной, нейробиологией, эндокринологией, поведением и репродуктивной биологией. Ещё он популярен среди селекционеров: выводят очень много пород. На фотографии изображён представитель породы короткошёрстных британцев.

На странице NCBI Genome ввели поиск по этому организму (Browse by Organism). В качестве лучшей сборки была выбрана сборка на уровне хромосомы.
Последовательность одного из контигов была добыта через WGS-проект (идентификатор: JAFEKA01) на сайте NCBI Sequence Set Browser. Во вкладке Contigs был выбран контиг scaffold_29-1 (AC: JAFEKA010000039.1). Затем через страницу нуклеотидной записи был скачан fasta-файл. Информацию про геном можно найти в табл.1.

Таблица 1. Описание сборки генома Felis catus.
Число сборок 5
Assembly Name F.catus_Fca126_mat1.0
AC сборки из GenBank; GCA_018350175.1
Уровень сборки Хромосомный (Chromosome)
Общая длина последовательности 2,425 Mb (2,425,747,038)
Число контигов 110
Число контигов N50 90,731,473
Число контигов L50 10
Число скэффолдов 71
Число скэффолдов N50 148,491,486
Число скэффолдов L50 7
Ссылка на публикацию Lopez JV et al., "Complete nucleotide sequences of the domestic cat (Felis catus) mitochondrial genome and a transposed mtDNA tandem repeat (Numt) in the nuclear genome.", Genomics, 1996 Apr 15;33(2):229-46
Последовательность контига ссылка

Задание 2.

Поиск полных геномов прокариотических вирусов Siphoviridae производился по базе Nucleotide на сайте NCBI. Запрашивая длина - 80000-90000. Текст запроса: ((Siphoviridae[Organism]) AND 80000:90000[Sequence Length]) AND complete genome[Text Word].

Таблица 2. Количество находок в нуклеотидных базах.
GenBank 74
RefSeq 26
Таблица 3. Описание генома представителя Siphoviridae.
EU100883
Латинское название Thermus phage P23-45
TaxID 466051
Тип генома Linear dsDNA
Хозяин вируса Thermus thermophilus
Файл с участками генома, предположительно кодирующими белки (CDS) ссылка

Как получить fasta-файл: "send to:" - "coding sequences" - "FASTA Nucleotide".

Задание 3.

Ключи локальных особенностей:

centromere - участок ДНК, отвечающий за связывание сестринских хроматид и формирование кинетохоры.
AC: HG994155.1.

     centromere      538789..538905
                     /note="CEN16; Chromosome XVI centromere"
     centromere      538789..538798
                     /note="CEN16_CDEI of CEN16"
     centromere      538799..538880
                     /note="CEN16_CDEII of CEN16"

iDNA - вмешивающаяся ДНК - ДНК, которую элиминируют через различные варианты рекомбинации (например, при процессинге генов иммуноглобулина в соматических клетках).
AC: MH388468.1.

     iDNA            312..404
                     /note="internal eliminated sequence"
     iDNA            596..653
                     /note="internal eliminated sequence"

J_segment - сегмент, присоединяющий тяжёлые и лёгкие цепи иммуноглобулина.
AC: NG_006980.1.

     J_segment       643070..643117
                     /gene="Trbj1-1"
                     /gene_synonym="Gm16646"
                     /standard_name="TRBJ1-1"
                     /db_xref="GeneID:100125248"

mat_peptide - последовательность, кодирующая зрелый или изменённый после пост-трансляционной модификации белок; стоп-кодон сюда не входит.
AC: BS001191.1.

     mat_peptide     16211..18013
                     /gene="ORF1ab"
                     /product="helicase"
     mat_peptide     18014..19594
                     /gene="ORF1ab"
                     /product="3'-to-5' exonuclease"
     mat_peptide     19595..20632
                     /gene="ORF1ab"
                     /product="endoRNAse"
     mat_peptide     20633..21526
                     /gene="ORF1ab"
                     /product="2'-O-ribose methyltransferase"

rep_origin - ориджин репликации - сайт, с которого идёт инициация репликации ДНК.
AC: LC652750.1.

     rep_origin      40..659
                     /note="pBR322 replication origin"
     rep_origin      1245..5434
                     /note="Ri plasmid replication origin"