Банки нуклеотидных последовательностей

Задание 1. Охарактеризуйте качество сборки генома эукариотического организма

Мой выбор пал на домашнюю кошку.
Название организма на латыни: Felis catus (domestic cat).
Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi;
Mammalia; Eutheria; Laurasiatheria; Carnivora; Feliformia; Felidae;
Felinae; Felis.

Число сборок: 1
Число проектов по секвенированию(BioProject): 2
Число образцов: 1

Abyssinian cat
Так как в моем распоряжении имеется всего одна сборка, то она и будет являться моим выбором.
Выбранная сборка: GCA_000181335.3 [ccылка]
BioSample: SAMN02953640
Описание образца:
BioProject: PRJNA175699 [ccылка]
° Пол: женский;
° Имя: Cinnamon;
° Порода: Abyssinian;
Описание проекта:
В сентябре 2011, The Genome Institute at Washington University School of Medicine, совместно с Agencourt Bioscience Corporation и Broad Institute, предоставили обновлённую сборку генома Felis catus. Источником ДНК для этой сборки, Felis catus-6.2, послужила абиссинская кошка по имени Cinnamon. Эта сборка была получена комбинацией WGS секвенирования и 454 секвенирования, с общим 14-кратным покрытием генома. Детальный процесс сборки описан на странице WGS-проекта, которую можно найти по идентификатору AANG00000000.
° Число контигов: 367,672
° Число скэффолдов: 267,928
° N50 для скэффолдов: 18,072,971
° L50 для скэффолдов: 45
° N50 для контигов: 45,189
° L50 для контигов: 16,252
° Самый длинный контиг: Contig2.2121
° Длина самого длинного контига: 491,421
[ссылка на WGS Project]
[ссылка на список контигов]

Задание 2.Ключи в таблицах особенностей

Ключи были взяты с данных сайтов - [ссылка 1], [ссылка 2].
° CDS
Кодирующая последовательность. Ключ включает последовательность белка, транслированного с последовательности нуклеотидов.

° regulatory
Любой участкой ДНК,принимающий участие в регуляции транскрипции или трансляции.

° exon

° intron
Указывает на сегмент ДНК, который удаляется из первичного транскрипта и отсутсвует в зрелой РНК.

° 3'UTR
1)Участок ДНК на 3'-конце зрелого транскрипта после стоп-кодона, который не транслируется в белок.
2)Участок на 3'-конце генома РНК-вируса после последнего стоп-кодона, который не транслируется в белок

° STS
Указывает на STS (sequence tagged site) - короткие участки с известной нуклеотидной последовательностью, которые встречаются в ДНК только один раз и могут быть обнаружены при помощи ПЦР со специфическими праймерами.

° source
Указывает биологический источник для обозначенного участка последовательности. Является обязательным. Возможно существование нескольких таких ключей для одной и той же последовательности.
° v_region
Вариабельные участки легких и тяжелых цепей иммуноглобулинов, ?-, ?- и ?-цепей Т-клеточных рецепторов. Кодирует вариабельные N-концы. Может состоять из V_segments, D_segments, N_regions и J_segments.

° rep_origin
Ориджин репликации; стартовый сайт дупликации нуклеиновой кислоты.

° repeat_region
Участок генома, состоящий из повторов.

Задание 3

В этом задании необходимо описать состояние дел в одном из массовых геномных проектов.
Я выбрала The 100K genomes project.
Проект был запущен премьер-министром Великобритании в конце 2012 года.
Genomics England - это компания, которая полностью принадлежит и финансируется Министерством здравоохранения. Она был создана, чтобы поставить этот флагманский проект(100K genomes), который будет секвинировать целых геномов 100000 от пациентов NHS к 2017.
Его четыре главные цели проекта:
° создать этическую и прозрачную программу, основанную на согласии;
° принести пользу пациентам и создать геномную службу медицине для NHS;
° привнести новые научные открытия и медицинские идеи;
° начать развитие геномики промышленности Великобритании.
Проект будет направлен на пациентов с редким заболеванием и их семей, и больных раком.
Первые образцы для секвенирования принимаются у пациентов, проживающих в Англии.
Проводятся переговоры с Шотландией, Уэльсом и Северной Ирландией о возможном участии в будущем.



Задание 4. Таблица митохондриальных генов одного из организмов указаного таксона 

Мне достался таксон Cryptophyta.
Чтобы Чтобы найти все полные митохондриальные геномы, в базе данных Nucleotide (NCBI) был выполнен следующий поисковой запрос: (((Cryptophyta[Organism]) AND complete[Title]) AND mitochondrion[Title]) AND genome[All Fields].
Всего было получено 3 результата:
° GenBank: 1;
° RefSeq: 2.
Организм для использования в этом задании - Rhodomonas salina.


[таблица. файл excel] [ссылка на источник таблицы]