Нуклеотидные банки данных.

Задание 1

Махаон(лат. Papilio machaon)
Махаон назван шведским натуралистом Карлом Линнеем в честь персонажа греческой мифологии врача Махаона, который являлся сыном Асклепия и Эпионы и принимал участие в походе греков на Трою во время Троянской войны (1194—1184 до н. э.). Бабочки первого поколения и особи, обитающие в северной части ареала, обладают бледной окраской, бабочки летнего поколения заметно крупнее и имеют более яркую окраску. Махаон образует до 37 подвидов. Имеет широкий ареал обитария. Встречается повсеместно в Европе от морей Северного Ледовитого океана до побережья Чёрного моря и Кавказа. Встречается в Азии (включая тропики), Северной Африке и Северной Америке. В горах Европы поднимается до высоты 2000 м над уровнем моря. Обитает в хорошо прогреваемых биотопах, обычно имеющих сырые участки, где произрастают кормовые зонтичные растения. Вид занесён в Красные книги разных старн.

Oops

Информация была взята с сайта:
Таблица 1. Характеристика сборки.
assembly name Pap_ma_1.0
AC GCA_001298355.1
assembly level Scaffold
об. длина последовательности 278,436,446
число контигов 68,691
число скэффолдов 63,187
N50 для контингов 92,238
L50 для контингов 669
N50 для скэффолдов 1,174,287
L50 для скэффолдов 56
число аннотированных белков 15497
На странице NCBI Genome я нашла строчку WGS Project: LADJ01. Перешла по ссылке. Далее в поле WGS я вновь перешла по ссылке и выбрала континг 4. Далее-send to, и скачала файл в формате fasta.

Задание 2

Для того, чтобы получить список полных геномов прокариотических вирусов, удовлетворяющих персональным условиям из таблицы,я, с помощью Advanced, ввела запрос "Siphoviridae"[Organism] AND ("50000"[SLEN] : "60000"[SLEN]) AND (complete[All Fields] AND gene[All Fields]) Всего было найдено 1514 геномов вирусов.Из них Я выбрала геном Klebsiella phage phiKO2:
Таблица 2. Анализ генома.
AC NC_005857
латинское название Klebsiella phage phiKO2
TaxID 255431
тип генома кольцевая ds-DNA
хозяина вируса бактерия Klebsiella oxytoca

Задание 3

Описание семи ключей используемых в таблицах особенностей. Все данные получены с помощью INSDC.
Таблица 3. Ключи.
J_segment 328..393
/gene="TCR1A"
Соединение сегментов легких и тяжелых цепей иммуноглобулина и Т-клеточных рецепторов альфа, бета и гамма цепей.
sig_peptide 1..54
/gene="TCR1A"
Сигнальная пептидная кодирующая последовательность; кодирующая последовательность для N-концевого домена секретируемого белка; этот домен участвует в присоединении зарождающегося полипептида к мембранной лидерной последовательности.
mat_peptide 55..399
/gene="TCR1A"
/product="T-cell receptor alpha chain"
Кодирующая последовательность зрелого пептида или белка; кодирующая последовательность для зрелого или конечного пептида или белкового продукта после посттрансляционной модификации; расположение не включает стоп-кодон (в отличие от соответствующих CDS).
repeat_region 80..401
/rpt_type=DISPERSED
/rpt_family="Alu-J"
Область генома, содержащая повторяющиеся единицы.
rep_origin 6
/direction=LEFT
/note="ori"
Origin репликации; начальный сайт для дупликации нуклеиновой кислоты с получением двух идентичных копий.
operon 160..6865
/operon="gal"
Область, содержащая полицистонный транскрипт, включающий кластер генов, которые находятся под контролем одних и тех же регуляторных последовательностей/промоторов и в одном и том же биологическом пути.
regulatory 95..100
/gene="sod"
/regulatory_class="ribosome_binding_site"
Любая область последовательности, которая функционирует в регуляции транскрипции, трансляции, репликации или структуры хроматина.