Задание 1
Организм: Felis catus
Число сборок: 2
Число проектов по секвенированию(BioProject): 3
Число образцов: 2
Рис. 1 Абиссинская кошка.
Я выбрал сборку GCA_000181335.3.
Ccылка на страницу сборки
Biosample ID выбранной сборки: SAMN02953640
Описание образца:
Пол: женский
Имя: Cinnamon
Порода: Абиссинская
Bioproject IDs выбранной сборки: PRJNA16726
Описание проекта:
В сентябре 2011, The Genome Institute at Washington University School of Medicine, в сотрудничестве с Agencourt Bioscience Corporation и Broad Institute, отправили обновлённую сборку генома Felis catus. Источником ДНК для этой сборки, Felis catus-6.2, послужила абиссинская кошка Cinnamon. Эта сборка была получена комбинацией WGS секвенирования и 454 секвенирования, с общим 14-кратным покрытием генома. Детали процесса сборки описаны на странице WGS-проекта, которую можно найти по идентификатору AANG00000000.
Число контигов: 367,672
Число скэффолдов: 267,928
N50 для скэффолдов: 18,072,971
L50 для скэффолдов: 45
N50 для контигов: 45,189
L50 для контигов: 16,252
Самый длинный контиг: Contig2.2121
Длина самого длинного контига: 491,421
Ccылка на таблицу контигов
Ccылки на таблицу скэффолдов нет, потому что таблицы нет на сайте.
Задание 2
Рис. 1 Мох Codriophorus aciculare.
Запрос в NCBI Nucleotide: KP453983.1
Ccылка на таблицу митохондриальных генов
Число генов РНК: 28
Число генов белков: 38
Задание 3
Таблица 1. Описание некоторых ключей формата GenBank.
Ключ
|
Описание
|
Пример
|
regulatory
|
Любой участкой ДНК, который принимает участие в регуляции транскрипции или трансляции.
|
regulatory 56..235
/regulatory_class="enhancer"
/gene="prolactin"
|
CDS
|
Кодирующая последовательность. Последовательность нуклеотидов, соответствующая последовательности аминокислот белка. Ключ включает последовательность белка, транслированного с последовательности нуклеотидов.
|
CDS 109..717
/gene="sod"
/EC_number="1.15.1.1"
/codon_start=1
/transl_table=11
/product="superoxide dismutase"
/db_xref="GOA:P28763"
/db_xref="HSSP:P00448"
/db_xref="InterPro:IPR001189"
/db_xref="UniProtKB/Swiss-Prot:P28763"
/protein_id="CAA45406.1"
/translation="MTYELPKLPYTYDALEPNFDKETMEIHYTKHHNIYVTKLNEAVS
GHAELASKPGEELVANLDSVPEEIRGAVRNHGGGHANHTLFWSSLSPNGGGAPTGNLK
AAIESEFGTFDEFKEKFNAAAAARFGSGWAWLVVNNGKLEIVSTANQDSPLSEGKTPV
LGLDVWEHAYYLKFQNRRPEYIDTFWNVINWDERNKRFDAAK"
|
D-loop
|
Петля сдвига. Короткая цепочка ДНК, спаренная с другой цепочкой, которая замещает оригинального партнёра. Также употребляется для описания реакции замещения одной цепочки ДНК в двухцепочечной молекуле на другю цепочку, катализируемой белком RecA.
|
D-loop 15654..16529
/note="control region"
|
repeat_region
|
Участок генома, состоящий из повторов.
|
repeat_region 112..138
/rpt_type=tandem
/rpt_unit_seq="ctt"
/satellite="microsatellite:Gacu13"
|
S_region
|
Участок переключения тяжёлых цепей имммуноглобулина. Вовлечён в перестройку тяжёлых цепей иммуноглобулина, чтобы тот же самый B-лимфоцит производил другой класс иммуноглобулинов.
|
S_region 1..63
|
stem_loop
|
Двуцепочечный регион сформированный спаренными комплементарными цепочками ДНК и РНК .
|
stem_loop 15606..16092
/inference="ab initio prediction:secondary structure"
|
source
|
Указывает на биологический источник участка генетического материала определённой протяжённости. Этот ключ является обязательным; допускается более чем одна инстанция этого ключа на одну последовательность.
|
source 1..8102
/organism="Babesia bovis"
/mol_type="genomic DNA"
/db_xref="taxon:5865"
/clone="Segment601"
/transgenic
|
STS
|
Тэгированный сайт последовательности; единственная копия короткой последовательности ДНК, которая характеризует landmark разметки генома и может быть обнаружена с помощью ПЦР. Участок генома может быть размечен с помощью определения порядка STS.
|
STS 679..1734
/gene="Itih4"
/gene_synonym="ITI-HC4; Itih-4; PK-120"
/standard_name="Itih4"
/db_xref="UniSTS:265229"
|
tmRNA
|
Транспортно-матричная РНК; тмРНК работает сначала как тРНК, а потом как мРНК, которая кодирует пептидный тэг; рибосома транслирует этот участок мРНК и прикрепляет пептидный тэг к C-концу незаконченного белка; этот присоединённый тэг делает белок целью разрушения или протеолиза.
|
tmRNA complement(730702..731042)
/locus_tag="Asbog_00659"
/product="tmRNA"
/inference="COORDINATES: profile:ARAGORN:1.2.28"
|
3'UTR
|
1)Участок ДНК на 3'-конце зрелого транскрипта после стоп-кодона, который не транслируется в белок.
2)Участок на 3'-конце генома РНК-вируса после последнего стоп-кодона, который не транслируется в белок
|
3'UTR 15631..15717
|
Задание 4
Выполнили поиск BLAST: Saved strategy
Таблица 2. Описание выданных BLASTN последовательностей, гомологичных этой
Название находки
|
Систематика организма
|
Авторы статей о гене
|
Ссылка на файл GenBank
|
Ссылка на выравнивание с нашей последовательностью в формате fasta
|
E-value находки
|
Scoloplos acutissimus voucher W.44175.001 18S ribosomal RNA gene, partial sequence
|
Scoloplos acutissimus
Eukaryota; Metazoa; Lophotrochozoa; Annelida; Polychaeta;
Scolecida; Orbiniidae; Scoloplos
|
Zhadan,A., Stupnikova,A. and Neretina,T.
|
Ссылка на GenBank
|
Ссылка
|
0.0
|
Phylo michaelseni 18S ribosomal RNA gene, partial sequence
|
Phylo michaelseni
Eukaryota; Metazoa; Lophotrochozoa; Annelida; Polychaeta;
Scolecida; Orbiniidae; Phylo.
|
Bleidorn,C.
|
Ссылка на GenBank
|
Ссылка
|
0.0
|
Orbinia cf. swani 18S ribosomal RNA gene, partial sequence
|
Orbinia cf. swani
Eukaryota; Metazoa; Lophotrochozoa; Annelida; Polychaeta;
Scolecida; Orbiniidae; Orbinia.
|
Bleidorn,C.
|
Ссылка на GenBank
|
Ссылка
|
0.0
|
Leodamas tribulosus voucher Ltr_001 18S ribosomal RNA gene, partial sequence
|
Leodamas tribulosus
Eukaryota; Metazoa; Lophotrochozoa; Annelida; Polychaeta;
Scolecida; Orbiniidae; Leodamas
|
Bleidorn,C., Hill,N., Erseus,C. and Tiedemann,R.
|
Ссылка на GenBank
|
Ссылка
|
0.0
|
Leodamas rubra voucher Leru_001 18S ribosomal RNA gene, partial sequence
|
Leodamas rubra
Eukaryota; Metazoa; Lophotrochozoa; Annelida; Polychaeta;
Scolecida; Orbiniidae; Leodamas.
|
Bleidorn,C., Hill,N., Erseus,C. and Tiedemann,R.
|
Ссылка на GenBank
|
Ссылка
|
0.0
|
Protoariciella uncinata 18S ribosomal RNA gene, partial sequence
|
Protoariciella uncinata
Eukaryota; Metazoa; Lophotrochozoa; Annelida; Polychaeta;
Scolecida; Orbiniidae; Protoariciella.
|
Bleidorn,C., Vogt,L. and Bartolomaeus,T.
|
Ссылка на GenBank
|
Ссылка
|
0.0
|
Leodamas dubia voucher W.45479.001 18S ribosomal RNA gene, partial sequence
|
Leodamas dubia
Eukaryota; Metazoa; Lophotrochozoa; Annelida; Polychaeta;
Scolecida; Orbiniidae; Leodamas.
|
Zhadan,A., Stupnikova,A. and Neretina,T.
|
Ссылка на GenBank
|
Ссылка
|
0.0
|
Leitoscoloplos bifurcatus voucher W.44938.001 18S ribosomal RNA gene, partial sequence
|
Leitoscoloplos bifurcatus
Eukaryota; Metazoa; Lophotrochozoa; Annelida; Polychaeta;
Scolecida; Orbiniidae; Leitoscoloplos.
|
Zhadan,A., Stupnikova,A. and Neretina,T.
|
Ссылка на GenBank
|
Ссылка
|
0.0
|
Выводы
1) Очевидно, ген очень консервативен в семействе Orbiniidae.
2) Очень вероятно, наша последовательность - кусок гена 18S рибосомальной РНК организма Scoloplos acutissimus. Название гена подтверждает 1 вывод.
3) Сходство с геном Scoloplos acutissimus составляет 98%
4) Сходство с геном Phylo michaelseni составляет 97%
Рис.2 Скриншот выдачи BLAST, подтверждающий 3-е и 4-е утверждения
|