Задание 1. Охарактеризуйте качество сборки генома эукариотического организма
Мой выбор пал на домашнюю кошку.
Название организма на латыни: Felis catus (domestic cat).
Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi;
Mammalia; Eutheria; Laurasiatheria; Carnivora; Feliformia; Felidae;
Felinae; Felis.
Число сборок: 1
Число проектов по секвенированию(BioProject): 2
Число образцов: 1
Abyssinian cat
Так как в моем распоряжении имеется всего одна сборка, то она и будет являться моим выбором.
Выбранная сборка: GCA_000181335.3
[ccылка]
BioSample: SAMN02953640
Описание образца:
BioProject: PRJNA175699
[ccылка]
° Пол: женский;
° Имя: Cinnamon;
° Порода: Abyssinian;
Описание проекта:
В сентябре 2011, The Genome Institute at Washington University School of Medicine, совместно с Agencourt Bioscience Corporation и Broad Institute,
предоставили обновлённую сборку генома Felis catus. Источником ДНК для этой сборки, Felis catus-6.2, послужила абиссинская кошка по имени Cinnamon.
Эта сборка была получена комбинацией WGS секвенирования и 454 секвенирования, с общим 14-кратным покрытием генома.
Детальный процесс сборки описан на странице WGS-проекта, которую можно найти по идентификатору
AANG00000000.
° Число контигов: 367,672
° Число скэффолдов: 267,928
° N50 для скэффолдов: 18,072,971
° L50 для скэффолдов: 45
° N50 для контигов: 45,189
° L50 для контигов: 16,252
° Самый длинный контиг: Contig2.2121
° Длина самого длинного контига: 491,421
[ссылка на WGS Project]
[ссылка на список контигов]
Задание 2.Ключи в таблицах особенностей
Ключи были взяты с данных сайтов -
[ссылка 1],
[ссылка 2].
° CDS
Кодирующая последовательность. Ключ включает последовательность белка, транслированного с последовательности нуклеотидов.
° regulatory
Любой участкой ДНК,принимающий участие в регуляции транскрипции или трансляции.
° exon
° intron
Указывает на сегмент ДНК, который удаляется из первичного транскрипта и отсутсвует в зрелой РНК.
° 3'UTR
1)Участок ДНК на 3'-конце зрелого транскрипта после стоп-кодона, который не транслируется в белок.
2)Участок на 3'-конце генома РНК-вируса после последнего стоп-кодона, который не транслируется в белок
° STS
Указывает на STS (sequence tagged site) - короткие участки с известной нуклеотидной последовательностью,
которые встречаются в ДНК только один раз и могут быть обнаружены при помощи ПЦР со специфическими праймерами.
° source
Указывает биологический источник для обозначенного участка последовательности.
Является обязательным. Возможно существование нескольких таких ключей для одной и той же последовательности.
° v_region
Вариабельные участки легких и тяжелых цепей иммуноглобулинов, ?-, ?- и ?-цепей Т-клеточных рецепторов.
Кодирует вариабельные N-концы. Может состоять из V_segments, D_segments, N_regions и J_segments.
° rep_origin
Ориджин репликации; стартовый сайт дупликации нуклеиновой кислоты.
° repeat_region
Участок генома, состоящий из повторов.
Задание 3
В этом задании необходимо описать состояние дел в одном из массовых геномных проектов.
Я выбрала
The 100K genomes project.
Проект был запущен премьер-министром Великобритании в конце 2012 года.
Genomics England - это компания, которая полностью принадлежит и финансируется Министерством здравоохранения. Она был создана,
чтобы поставить этот флагманский проект(100K genomes), который будет секвинировать целых геномов 100000 от пациентов NHS к 2017.
Его четыре главные цели проекта:
° создать этическую и прозрачную программу, основанную на согласии;
° принести пользу пациентам и создать геномную службу медицине для NHS;
° привнести новые научные открытия и медицинские идеи;
° начать развитие геномики промышленности Великобритании.
Проект будет направлен на пациентов с редким заболеванием и их семей, и больных раком.
Первые образцы для секвенирования принимаются у пациентов, проживающих в Англии.
Проводятся переговоры с Шотландией, Уэльсом и Северной Ирландией о возможном участии в будущем.
Задание 4. Таблица митохондриальных генов одного из организмов указаного таксона
Мне достался таксон Cryptophyta.
Чтобы Чтобы найти все полные митохондриальные геномы, в базе данных Nucleotide (NCBI) был выполнен следующий поисковой запрос:
(((Cryptophyta[Organism]) AND complete[Title]) AND mitochondrion[Title]) AND genome[All Fields].
Всего было получено 3 результата:
° GenBank: 1;
° RefSeq: 2.
Организм для использования в этом задании -
Rhodomonas salina.
[таблица. файл excel]
[ссылка на источник таблицы]