|
|
Задание 1. Качество сбрки генома эукариотического организма Для выполнения задания я выбрала организм, особенности которого исследую в своей курсовой работе - Ogataea parapolymorpha или Hansenula polymorpha DL-1( таксономическое положение , статья в википедии , страница в б.д. Genome ). Клетки этих замечательных дрожжей представлены на изображении ниже. В базе данных Genome представлена всего одна сборка генома H.polymorpha, поэтому у меня не возникло трудностей с выбором ( Страница сборки ). В поле Assembly level для этой сборки стоит значение Chromosome, значит, последовательности составляющие хромосомы для этого организма известны. Указано два проекта по секвенированию генома, PRJNA264114 и PRJNA60503 . Для обоих проектов дана ссылка на один и тот же образец. Привожу данные по сборке: Образец - SAMN02981294 ( ссылка ), принадлежащий организму Ogataea parapolymorpha DL-1. Образец бы получен и использовался в Москве, штамм организма DL-1. В ген-банке этот организм можно найти по названию Hansenula polymorpha DL-1 (а также по ключу gb|AEOI00000000.2), старое название организма Ogataea angusta DL-1. Образец был представлен в центре "Биоинженерия" РАН, в лаборатории молекулярного клонирования 2014-08-11. Один из проектов - PRJNA264114. В этом проекте аннотированная последовательность сборки генома получена из представленной сборки в базе GenBank (см сопряженный проект PRJNA60503 ). Аннотация, которой снабжена геномная запись RefSeq, основана на аннотации NCBI. Тип данных проекта: аннотированный геном. В атрибутах указан материал(геном), его покрытие(полный), тип метода(определение последовательности). Представлены данные по проекту и один связанный проект. Зарегистрирован проект 31 января 2011 года. Таблица контигов N50 - 1,273,462, L50 - 4, самый короткий контиг - AEOI02000002(7,737), самый длинный - AEOI02000010(1,515,570). Cсылка на последовательность самого длинного контига. Задание 2. Таблица митохондриальных генов мха Мой мох Orthotrichum rogeri, относится к бриевым мхам, семейству Ортотриховые. С помощью запроса Orthotrichum rogeri[Organism] AND Mitochondrion[Filter] я попала на страницу с записью генома. Чтобы перейти к списку всех генов, нужно было перейти по ссылке Genome из раздела Related information. Однако для этой записи такой ссылки не оказалось: Я пробовала искать в базе Gene по запросу Orthotrichum rogeri[Organism] AND MT[Chromosome]. Ничего не было найдено. Поэтому привожу таблицу просто всех белков данного мха (таблица) и таблицу митохондриальных белков Orthotrichum speciosum (страница с записью генома, таблица). Видно, что в таблице митохондриальных белков Orthotrichum speciosum в поле chromosome стоит MT, а в таблице всех белков Orthotrichum rogeri это поле пусто. Эти виды принадлежат одному и тому же роду, полагаю, что митохондриальные белки у них будут похожи. Среди всех белков Orthotrichum rogeri(125) 46 кодируют РНК, 79 белки. Среди митохондриальных белков Orthotrichum speciosum(67) 28 кодируют РНК, 39 белки. Задание 3. Десять ключей, используемых в таблице особенностей Таблицу ключей я нашла на странице сайта INSDC. Примеры кликабельны. 1. enhancer - усилитель. Это последовательность, которая увеличивает используемость некоторых эукариотических промоторов, может функционировать в любой ориентации в любом расположении(выше или ниже по цепочке) относительно промотора. Пример из мышиного гена TRP1: 2. misc_feature - неопознанная особенность. Участок, интересный с биологической точки зрения, который невозможно описать каким-либо другим ключом. Это новая или редкая особенность. Пример из мРНК Papilio machaon: 3. oriT - ориджин переноса(transfer). Участок молекулы ДНК, где перенос инициируется в процессе конъюгации или мобилизации. Пример из гена phoN сальмонеллы: 4. TATA_signal - TATA-бокс или бокс Голдберга-Хогнесса. Это консервативный AT-богатый гептамер, который находится приблизительно за 25 нуклеотидов до точки инициации транскрипции любой эукариотической РНК-полимеразы II, который может включен в процесс позиционирования белка для правильной инициации. Пример из вируса желтой карликовости гороха: 5. -10_signal - бокс Прибнова. Консервативный участок приблизительно на 10 нукеотидов выше начальной точки транскрипции у бактерий, может быть необходим для прикрепления РНК-полимеразы(аналог эукариотического ТАТА-бокса). Пример из гена isiA Анабены: 6. stem_loop - шпилька. Двухцепочечный участок, сформированный комплементарными участками одной и той же цепи ДНК или РНК. Пример из того же гена Анабены: 7. mRNA - мРНК. Включает в себя 5' нетранслируемый участок, кодирующую последовательность(CDS, exon) и 3' нетранслируемый участок. Пример из Cocal virus Indiana 2: 8. centromere - центромера. Участок, интересный с биологической точки зрения, экспериментально определенный как центромера. Пример из 21 хромосомы человека: 9. attenuator - аттенюатор. 1)участок ДНК, который регулирует терминацию транскрипции 2) участок последовательности между промотором и первым структурным геном, который частично терминирует транскрипцию. Пример из гена hgl2 золотистого стафилококка: 10. GC_signal - GC бокс. Консервативный участок, расположенный выше точки начала транскрипции у эукариот, который может появляться во множестве копий по любой ориентации. Пример из хемокина дикого быка(bos taurus): Задание 4. Blastn Задание 4 см на страничке 8 практикума |