Отчет по EMBL
Задание 2.1. Сравнение разных записей в EMBL
ID записи EMBL Тип молекулы Класс данных Раздел EMBLДата создания
документа Описание Длина последова-
тельностиAP009048 genomic DNA STD PRO 22-Jan-2006 E. coli W3110 DNA, complete genome 4646332 J03762 genomic DNA STD PRO 16-Jul-1988 E. coli thioredoxin reductase gene, complete cds 1202 L21749 genomic DNA STD PRO 23-Jul-1993 E. coli cydD gene, complete cds; thioredoxin reductase gene and cydC gene, partial cds 3486 M95935 genomic DNA STD PRO 17-Nov-1992 Escherichia coli htrD gene, complete cds. 1288 U00096 genomic DNA STD PRO 23-Feb-2006 E. coli K12 MG1655, complete genome 4639675 Две записи содержат полный геном кишечной палочки различных штаммов, две записи содержат ген тиоредоксин редуктазы, причем одна запись – полную версию, а другая – только часть (плюс еще один частичный и один полный гены) – 24% общей длины.
Задание 2.2. Сравнение описаний гена E. coli в двух разных записях EMBL
I II ID записи J03762 U00096 Начало гена в записи 86 930308 Конец гена в записи 1051 931273 Направление гена прямое обратное Примечания В записи один полный ген тиоредоксин редуктазы Полный геном E.coli K12 Т.к. запись, не содержащая полный геном, но в состав которой входит нужный ген целиком, была только одна, я вырезала нужный ген из записи U00096 (полный геном) и выровняла с помощью программы needle, и идентичность составляет 99,9%, что говорит о том, что запись содержит нужный ген тиоредоксин редуктазы. Есть одна замена: 487-го нт - 1-й позиции кодонов CTG и TTG, причем эта замена оказалась синонимичной: оба кодона кодируют аминокислоту лейцин.
Задание 3
Мой ген – GDI в записи L44140.
1. Ген на прямой цепи:
--[107607..107728]--...—[112949..113280]-->
2. Общее число экзонов в гене – 11. (посчитано с помощью grep "exon" gdi.entret -wc)
3. Длина самого длинного и самого короткого интронов – 1222 и 90 нт.
4. Длина самого длинного и самого короткого экзонов – 331 и 54 нт.
См. книгу.
Главная страница > Третий семестр > Отчет по EMBL
© Александра Далина |