Практикум 7

Задание 1

Организм: Lasius niger
Количество сборок: 1
Количество проектов по секвенированию(BioProject): 1
Количество образцов: 1

Рис. 1 Чёрный садовый муравей.

Ccылка на страницу сборки
Biosample ID выбранной сборки: SAMN03253098

Описание образца:

Источник: три колонии из Москвы (55.71 N, 37.52 E) и 3 из сельской местности Московской области (55.31 N, 36.69 E)
Дата сбора: 2011-09
Географическое местоположение: Россия, Московская область
Ткань: все ткани
Собран: Путятиной Татьяной
Пол: женский

Bioproject ID сборки: PRJNA269328

Описание проекта:

Lasius niger обитает в различных средах и выдерживает сильное антропогенное воздействие. Цель исследования состояла в поиске геномных черт, связанных с этой толерантностью. Образцы выделены из трёх колоний в Москве (55.71 N, 37.52 E) и из трёх колоний из сельской местности Московской области (55.31 N, 36.69 E).
Число контигов: 36,827
Число скэффолдов: 36,804
N50 для скэффолдов: не указано на сайте.
L50 для скэффолдов: не указано на сайте.
N50 для контигов: 17,048
L50 для контигов: 3,622
Самый длинный контиг: Lnig_2.1_1
Длина самого длинного контига: 167,361
Ccылка на таблицу контигов в формате csv.
Таблицы скэффолдов не было на сайте

Задание 2


Рис. 1 Мох Anomodon attenuatus.
Запрос в NCBI Nucleotide: (genome[Text Word]) AND Anomodon attenuatus[Organism]
Ccылка на таблицу митохондриальных генов
Число генов РНК: 27
Число генов белков: 40

Задание 3

Таблица 1. Описание некоторых ключей формата GenBank.
Ключ Описание Пример
CDS Кодирующая последовательность. Последовательность нуклеотидов, соответствующая последовательности аминокислот белка. Ключ включает последовательность белка, транслированного с последовательности нуклеотидов.
CDS             109..717
                /gene="sod"
                /EC_number="1.15.1.1"
                /codon_start=1
                /transl_table=11
                /product="superoxide dismutase"
                /db_xref="GOA:P28763"
                /db_xref="HSSP:P00448"
                /db_xref="InterPro:IPR001189"
                /db_xref="UniProtKB/Swiss-Prot:P28763"
                /protein_id="CAA45406.1"
                /translation="MTYELPKLPYTYDALEPNFDKETMEIHYTKHHNIYVTKLNEAVS
                GHAELASKPGEELVANLDSVPEEIRGAVRNHGGGHANHTLFWSSLSPNGGGAPTGNLK
                AAIESEFGTFDEFKEKFNAAAAARFGSGWAWLVVNNGKLEIVSTANQDSPLSEGKTPV
                LGLDVWEHAYYLKFQNRRPEYIDTFWNVINWDERNKRFDAAK"
D-loop Петля сдвига. Короткая цепочка ДНК, спаренная с другой цепочкой, которая замещает оригинального партнёра. Также употребляется для описания реакции замещения одной цепочки ДНК в двухцепочечной молекуле на другю цепочку, катализируемой белком RecA.
D-loop          15654..16529
                /note="control region"
repeat_region Участок генома, состоящий из повторов.
repeat_region   112..138
                /rpt_type=tandem
                /rpt_unit_seq="ctt"
                /satellite="microsatellite:Gacu13"
3'UTR 1)Участок ДНК на 3'-конце зрелого транскрипта после стоп-кодона, который не транслируется в белок.
2)Участок на 3'-конце генома РНК-вируса после последнего стоп-кодона, который не транслируется в белок
3'UTR           15631..15717
regulatory Любой участкой ДНК, который принимает участие в регуляции транскрипции или трансляции.
regulatory      56..235
                /regulatory_class="enhancer"
                /gene="prolactin"
stem_loop Двуцепочечный регион сформированный спаренными комплементарными цепочками ДНК и РНК .
stem_loop       15606..16092
                /inference="ab initio prediction:secondary structure"
source Указывает на биологический источник участка генетического материала определённой протяжённости. Этот ключ является обязательным; допускается более чем одна инстанция этого ключа на одну последовательность.
source          1..8102
                /organism="Babesia bovis"
                /mol_type="genomic DNA"
                /db_xref="taxon:5865"
                /clone="Segment601"
                /transgenic
STS Тэгированный сайт последовательности; единственная копия короткой последовательности ДНК, которая характеризует landmark разметки генома и может быть обнаружена с помощью ПЦР. Участок генома может быть размечен с помощью определения порядка STS.
STS             679..1734
                /gene="Itih4"
                /gene_synonym="ITI-HC4; Itih-4; PK-120"
                /standard_name="Itih4"
                /db_xref="UniSTS:265229"
S_region Участок переключения тяжёлых цепей имммуноглобулина. Вовлечён в перестройку тяжёлых цепей иммуноглобулина, чтобы тот же самый B-лимфоцит производил другой класс иммуноглобулинов.
S_region        1..63
tmRNA Транспортно-матричная РНК; тмРНК работает сначала как тРНК, а потом как мРНК, которая кодирует пептидный тэг; рибосома транслирует этот участок мРНК и прикрепляет пептидный тэг к C-концу незаконченного белка; этот присоединённый тэг делает белок целью разрушения или протеолиза.
tmRNA           complement(730702..731042)
                /locus_tag="Asbog_00659"
                /product="tmRNA"
                /inference="COORDINATES: profile:ARAGORN:1.2.28"

Задание 4

Был проведён поиск по BLAST: Saved strategy
Таблица 2. Описания находок BLAST для нашей последовательности
Название находки Покрытие Идентичность Систематика организма Ссылка на файл GenBank Ссылка на выравнивание с нашей последовательностью в формате fasta E-value находки
Halechiniscus remanei 18S ribosomal RNA gene, partial sequence 87% 86% Halechiniscus remanei
Eukaryota; Metazoa; Ecdysozoa; Tardigrada; Heterotardigrada; Arthrotardigrada; Halechiniscidae; Halechiniscus.
Ссылка на GenBank Ссылка 9e-127
Halechiniscus perfectus 18S ribosomal RNA gene, partial sequence 86% 86% Halechiniscus perfectus
Eukaryota; Metazoa; Ecdysozoa; Tardigrada; Heterotardigrada; Arthrotardigrada; Halechiniscidae; Halechiniscus.
Ссылка на GenBank Ссылка 3e-126
Ramazzottius oberhaeuseri isolate Tar400 18S ribosomal RNA gene, partial sequence 86% 83% Ramazzottius oberhaeuseri
Eukaryota; Metazoa; Ecdysozoa; Tardigrada; Eutardigrada; Parachela; Hypsibiidae; Ramazzottius.
Ссылка на GenBank Ссылка 8e-115
Astatumen trinacriae isolate Tar715 18S ribosomal RNA gene, partial sequence 86% 84% Astatumen trinacriae
Eukaryota; Metazoa; Ecdysozoa; Tardigrada; Eutardigrada; Parachela; Hypsibiidae; Astatumen.
Ссылка на GenBank Ссылка 3e-114
Acutuncus antarcticus gene for 18S ribosomal RNA, partial sequence 86% 83% Acutuncus antarcticus
Eukaryota; Metazoa; Ecdysozoa; Tardigrada; Eutardigrada; Parachela; Hypsibiidae; Acutuncus.
Ссылка на GenBank Ссылка 3e-113

Вывод:

1) Наша последовательность из гена 18S рибосомной РНК, скорее всего, из организма, принадлежащего таксону Tardigrada.
2) Уровень сходства с лучшей находкой таксона Tardigrada - 86%
3) Из других таксонов находок не обнаружено