Задание 1. Охарактеризуйте качество сборки генома эукариотического организма
Мой выбор пал на домашнюю кошку. Название организма на латыни: Felis catus (domestic cat). Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Laurasiatheria; Carnivora; Feliformia; Felidae; Felinae; Felis. Число сборок: 1 Число проектов по секвенированию(BioProject): 2 Число образцов: 1
Так как в моем распоряжении имеется всего одна сборка, то она и будет являться моим выбором. Выбранная сборка: GCA_000181335.3 [ccылка] BioSample: SAMN02953640 Описание образца: BioProject: PRJNA175699 [ccылка] ° Пол: женский; ° Имя: Cinnamon; ° Порода: Abyssinian; Описание проекта: В сентябре 2011, The Genome Institute at Washington University School of Medicine, совместно с Agencourt Bioscience Corporation и Broad Institute, предоставили обновлённую сборку генома Felis catus. Источником ДНК для этой сборки, Felis catus-6.2, послужила абиссинская кошка по имени Cinnamon. Эта сборка была получена комбинацией WGS секвенирования и 454 секвенирования, с общим 14-кратным покрытием генома. Детальный процесс сборки описан на странице WGS-проекта, которую можно найти по идентификатору AANG00000000. ° Число контигов: 367,672 ° Число скэффолдов: 267,928 ° N50 для скэффолдов: 18,072,971 ° L50 для скэффолдов: 45 ° N50 для контигов: 45,189 ° L50 для контигов: 16,252 ° Самый длинный контиг: Contig2.2121 ° Длина самого длинного контига: 491,421 [ссылка на WGS Project] [ссылка на список контигов]Задание 2.Ключи в таблицах особенностей
° regulatory
Любой участкой ДНК,принимающий участие в регуляции транскрипции или трансляции.
° exon
° intron
Указывает на сегмент ДНК, который удаляется из первичного транскрипта и отсутсвует в зрелой РНК.
° 3'UTR
1)Участок ДНК на 3'-конце зрелого транскрипта после стоп-кодона, который не транслируется в белок.
2)Участок на 3'-конце генома РНК-вируса после последнего стоп-кодона, который не транслируется в белок
° STS
Указывает на STS (sequence tagged site) - короткие участки с известной нуклеотидной последовательностью,
которые встречаются в ДНК только один раз и могут быть обнаружены при помощи ПЦР со специфическими праймерами.
° source
Указывает биологический источник для обозначенного участка последовательности.
Является обязательным. Возможно существование нескольких таких ключей для одной и той же последовательности.
° v_region
Вариабельные участки легких и тяжелых цепей иммуноглобулинов, ?-, ?- и ?-цепей Т-клеточных рецепторов.
Кодирует вариабельные N-концы. Может состоять из V_segments, D_segments, N_regions и J_segments.
° rep_origin
Ориджин репликации; стартовый сайт дупликации нуклеиновой кислоты.
° repeat_region
Участок генома, состоящий из повторов.





