Банки нуклеотидных последовательностей

Задание 1. Характеристика качества сборки генома эукариотического организма


Corvus cornix cornix (hooded crow) - серая ворона, вид птиц из рода воронов.
Всего проектов по секвенированию - 2. Сборок - 2.
Выбранная сборка: GCA_000738735.2.
Размер: 1042.28 Мб.
BioSample: SAMN02143031.
BioProject: PRJNA192205.
Технология секвенирования: BioNano Genomics; Illumina
Покрытие: 150.0x
Число контигов: 27369
Контиг N50: 97330
Контиг L50: 2832
Адрес таблицы с контигами: ссылка
Число скэффолдов: 113
Адрес последовательности одного контига: ссылка

Corvus cornix


Задание 2. Описание семи ключей, используемых в таблицах особенностей (Feature Key или Feature table)


Ключ Описание
C_region Неизменный участок иммуноглобулиновых легких и тяжелых цепей и альфа-, бета-, гамма-цепей рецепторов Т-клеток. Включают в себя один или более экзонов (зависит от цепи).
CDS Кодирующая последовательность; последовательность нуклеотидов, соответствующая последовательности аминокислот в белке (включая стоп-кодон).
repeat_region Участок генома, содержащий повторы.
mobile_element Определенный участок генома, содержащий мобильные элементы.
regulatory Любой участок последовательности, который играет роль в регуляции транскрипции, трансляции, репликации или укладке хроматина.
STS Помеченный сайт последовательности; короткая однокопийная последовательность ДНК, характеризующая определенное место, метку в геноме и которая может быть обнаружена ПЦР анализом.
misc_feature Участок, представляющий биологический интерес, который не может быть описан как никакой другой ключ; новая или редкая особенность.

Задание 3. Описание состояния дел в одном из массовых геномных проектов


Проект и его цель:
GPS: Global Pneumococcal Sequencing Project; Основной целью проекта GPS является изучение влияния введенной вакцины на пневмококковые штаммы путем секвенирования и сравнения целых геномных последовательностей до и после вакцинации.
Что секвенируют: геномы.
Организаторы, год начала, план, предполагаемый год окончания: Проект организован совместными усилиями: Emory University’s Hubert Department of Global Health, Pathogen Genomics Group at the Wellcome Trust Sanger Institute, the National Institute for Communicable Diseases (NICD) within the South African National Health Laboratory Service, the MRC Research Unit in the Gambia, the University of Liverpool/Malawi-Liverpool-Wellcome Trust Clinical Research Programme (MLW) in Malawi, the CDC’s Respiratory Diseases Branch within the National Center for Immunization and Respiratory Diseases (NCIRD), которые представляют собой многопрофильную группу ученых и исследователей.
Год начала - 2013.
Планируемое число единиц - геномы 20,000 штаммов пневмококков.
Планируемый год окончания - 2018.
Число секвенированных единиц на 2017 год: 18,470
Ссылка на источник: http://www.pneumogen.net/gps/index.html
Ссылка на последнюю статью: https://www.ncbi.nlm.nih.gov/pubmed/28818574

Задание 4. Составление таблицы митохондриальных генов одного из организмов указаного таксона.

Drosophila melanogaster


Организм: Drosophila melanogaster
Запрос к RefSeq:"Drosophila melanogaster"[Organism] AND complete [Title] AND mitochondrion[Title] AND RefSeq[KYWRD]
Число находок: 1
АС выбранной записи: NC_024511
Размер митохондриального генома: 19524
Число генов белков: 13
Число генов РНК: 24

Таблица с митохондриальными генами


© Cherkashina Anastasia 2017