1. Описание сборки генома многоклеточного эукарирта
Nemopilema nomurai
Выбранный мной многоклеточный эукариот - медуза Немопилема номура - относится к классу Сцифоидные, отряду Корнероты.
Одной из её особенностей, как можно заметить по рисунку №2, является размер её тела: вес достигает 200 кг, а диаметр 2 м. Обитают преимущественно в Жёлтом и Восточно-Китайском морях. Их хищниками являются меч-рыба, тунец, луна-рыба, кожистые черепахи и люди.
Немопилема приносит вред человеку на нескольких фронтах. Во-первых, были случаи, что по их вине тонули целые судна, например в 2009 году 10-тонный рыболовецкий траулер перевернулся, когда его экипаж попытался вытащить сеть, содержащую десятки медуз Номуры. В связи с этим, во-вторых, они наносят серьезный ущерб японскому рыболовству, особенно за последние 20 лет, когда их численность увеличилась. И в-третьих, они являются ядовитыми, всё больше людей, подвергнутых интоксикации, жалуются на такие симптомы, как зуд, отёк, острая боль, воспаление. Их яд состоит из сложных смесей белков и пептидов. В настоящее время проводятся исследования для определения ключевых взаимодействий в этих белково-пептидных смесях, которые могли бы предсказать конкретные симптомы от яда и помочь в лечении.
Рис 1. Nemopilema nomurai (источник)
Рис.2 Nemopilema nomurai в сравнении с человеком (источник)
NCBI Genome предоставляет только одну сборку генома не только для данного вида, но и для рода Nemopilema. Её описание представлено в Таблице1.
Название (assembly name) | NemNom1.0 |
AC из GenBank | GCA_003864495.1 |
"Уровень" сборки (assembly level) | Scaffold |
Общая длина последовательности | 213,621,014 |
Число контигов | 1,463 |
Число скэффолдов | 251 |
N50 для контигов | 849,297 |
L50 для контигов | 65 |
N50 для скэффолдов | 2,711,397 |
L50 для скэффолдов | 28 |
Число аннотированных белков | не указано |
Чтобы получить последовательность контига необходимо перейти по ссылке напротив "WGS Project" на странице сборки генома. Далее по ссылке напротив "WGS". После этого появляется страница со списком из 50 контигов. Я выбрала последовательность под названием "scaffold37_contig2". Потом, перейдя по ссылке "FASTA" выбранного контига, его потребовалось скачать - "send to file".
2. Скачивание последовательности CDS Siphoviridae
Поиск полных геномов Siphoviridae в 80000-90000 пар оснований проводился на сайте NCBI по базе Nucleotide. Для введения запроса пригодилось поле "Advanced search".
Текст запроса: ((Siphoviridae[Organism]) AND 80000:90000[Sequence Length]) AND "Complete Genome"
Количество выданных находок составило 61, из котроых 49 из GenBank и 12 из RefSeq. Для дальнейшей характеристики мною был выбран геном вируса Staphylococcus phage PMBT8. Его характеристика представлена в Таблице 2.
GenBank AC | MK893987.1 |
Латинское название вида | Staphylococcus phage PMBT8 |
Taxonomy ID | 2590894 |
Тип генома | Линейная ds-DNA |
Хозяин вируса | Staphylococcus hyicus 07/02 4A |
Чтобы получить fasta-файл с участками генома, предположительно кодирующими белки (CDS), я выполнила следующие действия:
со страницы записи генома "send to file" → Coding Sequences → FASTA nucleotide → create file
Данный файл доступен по ссылке.
3. Ключи, используемые в таблицах особенностей
- isolation_source
- cell_type
- chromosome
- country
- dev_stage
- host
- lat_lon
Определение описывает физическое, экологическое, географическое местоположение биологического образца, из которого была получена последовательность.
/isolation_source="piglet"
Определение типа клетки, из которой была получена последовательность
/cell_type="leukocyte"
Определение хромосомы (номер), из которой была получена последовательность
/chromosome="1"
Определение местоположения выделения секвенированного организма представленно названием страны, океана или моря.
/country="Atlantic Ocean:Charlie Gibbs Fracture Zone"
Если последовательность была получена из организма в специфической стадия развития, то это определяется данным ключом.
/dev_stage="fourth instar larva"
Определение естественного хозяина организма, чья последовательность была получена секвенированием.
/host="Staphylococcus hyicus 07/02 4A"
Определение географических координат территории, где образц был собран.
/lat_lon= " 47.94 N 28.12 W"