Банки нуклеотидных последовательностей

1. Описание сборки генома многоклеточного эукарирта

Nemopilema nomurai

Выбранный мной многоклеточный эукариот - медуза Немопилема номура - относится к классу Сцифоидные, отряду Корнероты.

Одной из её особенностей, как можно заметить по рисунку №2, является размер её тела: вес достигает 200 кг, а диаметр 2 м. Обитают преимущественно в Жёлтом и Восточно-Китайском морях. Их хищниками являются меч-рыба, тунец, луна-рыба, кожистые черепахи и люди.

Немопилема приносит вред человеку на нескольких фронтах. Во-первых, были случаи, что по их вине тонули целые судна, например в 2009 году 10-тонный рыболовецкий траулер перевернулся, когда его экипаж попытался вытащить сеть, содержащую десятки медуз Номуры. В связи с этим, во-вторых, они наносят серьезный ущерб японскому рыболовству, особенно за последние 20 лет, когда их численность увеличилась. И в-третьих, они являются ядовитыми, всё больше людей, подвергнутых интоксикации, жалуются на такие симптомы, как зуд, отёк, острая боль, воспаление. Их яд состоит из сложных смесей белков и пептидов. В настоящее время проводятся исследования для определения ключевых взаимодействий в этих белково-пептидных смесях, которые могли бы предсказать конкретные симптомы от яда и помочь в лечении.

nemopilema nomura

Рис 1. Nemopilema nomurai (источник)

nemopilema nomura

Рис.2 Nemopilema nomurai в сравнении с человеком (источник)

NCBI Genome предоставляет только одну сборку генома не только для данного вида, но и для рода Nemopilema. Её описание представлено в Таблице1.

Таблица 1. Информация о сборке генома Nemopilema nomurai
Название (assembly name) NemNom1.0
AC из GenBank GCA_003864495.1
"Уровень" сборки (assembly level) Scaffold
Общая длина последовательности 213,621,014
Число контигов 1,463
Число скэффолдов 251
N50 для контигов 849,297
L50 для контигов 65
N50 для скэффолдов 2,711,397
L50 для скэффолдов 28
Число аннотированных белков не указано

Чтобы получить последовательность контига необходимо перейти по ссылке напротив "WGS Project" на странице сборки генома. Далее по ссылке напротив "WGS". После этого появляется страница со списком из 50 контигов. Я выбрала последовательность под названием "scaffold37_contig2". Потом, перейдя по ссылке "FASTA" выбранного контига, его потребовалось скачать - "send to file".


2. Скачивание последовательности CDS Siphoviridae

Поиск полных геномов Siphoviridae в 80000-90000 пар оснований проводился на сайте NCBI по базе Nucleotide. Для введения запроса пригодилось поле "Advanced search".

Текст запроса: ((Siphoviridae[Organism]) AND 80000:90000[Sequence Length]) AND "Complete Genome"

Количество выданных находок составило 61, из котроых 49 из GenBank и 12 из RefSeq. Для дальнейшей характеристики мною был выбран геном вируса Staphylococcus phage PMBT8. Его характеристика представлена в Таблице 2.

Таблица 2. Характеристка генома вируса Staphylococcus phage PMBT8
GenBank AC MK893987.1
Латинское название вида Staphylococcus phage PMBT8
Taxonomy ID 2590894
Тип генома Линейная ds-DNA
Хозяин вируса Staphylococcus hyicus 07/02 4A

Чтобы получить fasta-файл с участками генома, предположительно кодирующими белки (CDS), я выполнила следующие действия:

со страницы записи генома "send to file" → Coding Sequences → FASTA nucleotide → create file

Данный файл доступен по ссылке.

3. Ключи, используемые в таблицах особенностей

  1. isolation_source
  2. Определение описывает физическое, экологическое, географическое местоположение биологического образца, из которого была получена последовательность.

     
                         /isolation_source="piglet"
    
  3. cell_type
  4. Определение типа клетки, из которой была получена последовательность

                         /cell_type="leukocyte" 
    
  5. chromosome
  6. Определение хромосомы (номер), из которой была получена последовательность

                         /chromosome="1" 
    
  7. country
  8. Определение местоположения выделения секвенированного организма представленно названием страны, океана или моря.

                         /country="Atlantic Ocean:Charlie Gibbs Fracture Zone" 
    
  9. dev_stage
  10. Если последовательность была получена из организма в специфической стадия развития, то это определяется данным ключом.

                         /dev_stage="fourth instar larva" 
    
  11. host
  12. Определение естественного хозяина организма, чья последовательность была получена секвенированием.

                         /host="Staphylococcus hyicus 07/02 4A" 
    
  13. lat_lon
  14. Определение географических координат территории, где образц был собран.

                         /lat_lon= " 47.94 N 28.12 W" 
    
Назад

Главная страница