Банки нуклеотидных последовательностей

Задание 1


Для выполнения данного задания был выбран организм Plasmodium falciparum (malaria parasite P. falciparum). Являясь возбудителем малярии, он обладает сложным циклом развития, включающим смену позвоночного и беспозвоночного хозяина.
В кровь человека спорозоиты попадают посредством укуса переносчика заболевания, комара Anopheles. Более половины населения планеты живет в зоне распространения болезни, атакующей ежегодно 300 миллионов человек.
Как паразит сумел приспособиться к различным формам борьбы, так и комар выработал устойчивость к разного рода инсектицидам. Ввиду вышеуказанного малярия на сегодняшний день представляет собой одну из глобальных проблем, стоящих пеерд человечеством.


Рисунок 1 Plasmodium falciparum

  • Число сборок генома - 23
  • Число проектов по секвенированию организма -23
  • Число образцов -22


    Рисунок 2 Отчет о сборке генома Plasmodium falciparum

    Assembly ID - GCA_000149665.2
    BioSample ID - SAMN02953642
    BioProject ID - PRJNA16340

    Описание образца (BIOSAMPLE ID - SAMN02953642):
    Ссылка на страницу BioSample


    Рисунок 3 Описание BIOSAMPLE SAMN02953642

    Описание проекта (BIOPROJECT ID - PRJNA16340):
    Ссылка на страницу BioProject

    Аннотация: Данная последовательность была секвенирована для сравнительных исследований геномов. Проект, иллюстрирующий использование "метода дробовика", может быть найден в GenBank по ссылке AANS00000000
    Записи митохондрий и апикопласт соответственно также представлены в WGS проекте AANS00000000

    Project Data Type:Genome sequencing
    Attributes:Scope: Monoisolate; Material: Genome; Capture: Whole; Method type: Sequencing

    Параметры сборки генома


    Рисунок 4Параметры сборки генома малярийного плазмодия

    Исходя из рисунка 4 видим, что
    N50 = 20638
    L50 = 342
    таблица контигов в формате Tab Separated Values
    таблица контигов
    последовательность случайно выбранного контига

    Самый длинный контиг Acсession name: AANS01002971, Contig name:cont1.315, Length:111944
    Самый короткий контиг Acсession name:AANS01000315, Contig name:cont1.2971, Length:201

    Задание2



    Рисунок 5Racomitrium emersum

    Для поиска митохондриального генома был введен следующий запрос ((Racomitrium emersum[Organism]) AND mitochondrion) AND complete genome

    <
    Рисунок 6Результаты

    Далее нужно было получить список всех генов и информацию об их количестве. Для этого я перешла по ссылкам Genome и Gene в разделе Related information.


    Рисунок 7Результаты

    Итак, в геноме Racomitrium emersum присутствуют 66 генов, из которых 39 кодируют белки, 3-рРнк, 24 - тРНК

    Чтобы получить таблицу генов, я скачала искомый файл на странице Gene, предварительно отсортировав (Sort by Chromosome).
    таблица

    Задание 3


  • Ключ 1misc_binding

  • Описание: Показывает, может ли нуклеотид или последовательность образовать связь с чем-либо

    Пример:

  • Ключ 2 misc_difference

  • Описание: Показывает способы изменения последовательности
    Пример:

  • Ключ 3 repeat_region

  • Описание: Область генома, содержащая повторяющиеся участки
    Пример:

  • Ключ 4 СDS

  • Описание: Кодирующая последовательность
    Пример:

  • Ключ 5 exon

  • Описание: Участок гена, несущий генетическую информацию, кодирующую синтез продукта гена

    Пример:

  • Ключ 6 operon

  • Описание:функциональная единица генома у прокариот, в состав которой входят цистроны (гены, единицы транскрипции), кодирующие совместно или последовательно работающие белки и объединенные под одним (или несколькими) промоторами.

    Пример:

  • Ключ 7 promoter

  • Описание:Участок ДНК, связывающийся с РНКполимеразой для запуска транскрипции
    Пример:

  • Ключ 8 -10_signal

  • Описание:Консервативная последовательность в 10 п.н вверх до старт-кодона, которая может быть вовлечена во связывание РНК-полимеразы для инициирования транскрипции у бактерий. Консенсус TTGACa или TGTTGACA
    Пример:

  • Ключ 9 -35_signal

  • Описание: Консервативная последовательность в 35 п.н вверх до старт-кодона, которая может быть вовлечена во связывание РНК-полимеразы для инициирования транскрипции у бактерий. Консенсус TTGACa или TGTTGACA
    Пример:

  • Ключ 10 terminator

  • Описание: последовательность нуклеотидов ДНК, узнаваемая РНК-полимеразой как сигнал к прекращению синтеза молекулы РНК и диссоциации транскрипционного комплекса.
    Пример:


    Задание 4


    Необходимо установить, какому гену принадлежит последовательность, полученная в практикуме 6, и таксономию организма.
    Для выполнения этой задачи использовался BLASTN.
    На вход была дана нуклеотидная последовательность, полученная в практикуме 6.
    Скачать данную последовательность в формате fasta
    Первые несколько результатов из выдачи BLASTN:



    Рисунок 8Результаты

    Из результатов поиска можно определить, что последовательность является частью гена рибосомальной РНК


    Из рисунка 9 видно, что первые 6 находок идентичны заданной на 93% и более. Последующие находки идентичны не более, чем на 91%, потому в число лучших не включены. Далее приведена таблица с характеристиками нескольких лучших находок:

    Рисунок 9характеристики нескольких лучших находок

    Рассмотрим 6 лучших находок. Все они имеют очень низкое значение E-value (0.0), то есть ни одна из них не случайна. Каждая из них сходна с нашей последовательностью на 93% и более, причем лучшая - на 98%, значит, можно утверждать, что наша последовательность принадлежит организму какого-либо из найденных видов.
    5 из 6 находок принадлежат организмам с таксономией Eukaryota; Metazoa; Lophotrochozoa; Entoprocta; Loxosomatidae;Loxosomella
    Оставшаяся - организму с таксономией Eukaryota; Metazoa; Lophotrochozoa; Entoprocta; Loxosomatidae; Loxomitra
    Я думаю, можно утверждать, что наша последовательность также принадлежит организму с таксономией Eukaryota; Metazoa; Lophotrochozoa; Entoprocta; Loxosomatidae;Loxosomella

    Также было построено выравнивание нашей последовательности с 6-ю, у которых самые высокие значения идентичности


    Рисунок 10Loxosomella Mortensen

    Данные организмы - беспозвоночные животные, принадлежащие к типу Внутрипорошициевые. Мелкие (от 1 мм до 0,5 см) животные, ведущие прикреплённый образ жизни.
    Тело состоит из чашечки, заключающей в себе все органы животного, и гибкого стебелька, прикрепляющегося к субстрату.
    У колониальных форм он крепится к стелющемуся стволу колонии — столону. Чашечка окружена по краю венчиком щупалец.
    На углублённой между основанием щупалец площадке открываются рот и порошица.
    Характерная особенность камптозоев состоит в том, что их ротовое и анальное отверстия окружены общим кольцом из 6—36 щупалец на округлом выросте, называемом лофофором.
    Щупальца покрыты слизистыми ресничками и загоняют в рот воду с пищевыми частицами.
    Полость тела отсутствует; псевдоцель заполнен студенистой массой клеток. Тело не сегментировано; кровеносной и дыхательной систем нет, газообмен происходит через поверхность тела.
    Пищеварительный тракт в форме подковы; органами выделения служат протонефридии; нервная система состоит из ганглия, расположенного у перегиба кишечника, и отходящих от него нервов Ссылки
  • The National Center for Biotechnology Information
  • © Козлова Анастасия, 2015