Главная | Проекты | Семестры |
- Использование системы SRS.
- Дата последнего проиндексированного в системе релиза EMBL 07-Sep-2009, количество записей в нём - 108577013.
- Список классов ("Data Class") банка EMBL и число записей каждого класса, проиндексированных SRS для последнего релиза EMBL:
- ANN: Constructed sequence with annotation - не проиндексирован
- CON: Constructed sequence - не проиндексирован
- EST: Expressed Sequence Tag - 62846990
- GRV: Genome Reviews - не проиндексирован
- GSS: Genome Survey Sequence - 25905073
- HTC: High Throughput cDNA sequencing - 549753
- HTG: High Throughput Genome sequencing - 142473
- MGA: Mass Genome Annotation - не проиндексирован
- PAT: Patent - 10439165
- SET: Project set (EMBL WGS Masters only) - не проиндексирован
- STD: Standard - 7253026
- STS: Sequence Tagged Site - 1310171
- TPA: Third Party Annotation - 6520
- TSA: Transcriptome Shotgun Assembly - 123842
- WGS: Whole Genome Shotgun - не проиндексирован
- Список и описание разделов ("Divisions") банка EMBL и число записей в последнем релизе.
- ENV: Образцы из окружающей среды - 4145029
- FUN: Грибы - 3942084
- HUM: Человек - 12841544
- INV: Беспозвоночные - 15518735
- MAM: Другие млекопитающие - 9429823
- MUS: Мышь (Mus musculus) - 7424621
- PHG: Бактериофаги - 5865
- PLN: Растения - 33806044
- PRO: Прокариоты - 909986
- ROD: Грызуны - 2261678
- SYN: Синтетические - 2671622
- TGN: Трансгенные - 265465
- UNC: Неклассифицированные - 3945859
- VRL: Вирусы - 827405
- VRT: Другие позвоночные - 10581253
- Количество стандартных (класса STD) записей, появвшееся в каждом из выбранных разделов за апрель 2009 года и за тот же месяц 2008 года.
Во всех разделах, кроме HUM (человек), количество поступлений увеличилось по сравнению с предыдущим годом. Видимо, появилось больше возможностей работать с другими организмами, в то время как для работы с человеческими последовательностями большинство данных уже имеется.
- Информация о гене ZNF173 из файла BA000025.embl.
направление гена относительно направления, выбранного для записи прямое число кодирующих участков 7 длина первого кодирующего участка 438 длина последнего кодирующего участка 683 длина первого интрона 1682 длина последнего интрона 2612
- Самым длинным оказался 7-ой кодирующий участок(1755600..1756282, 683 bp). С помощью команды seqret была получена последовательность этого экзона (файл cds.fasta). С помощью blastx был проведен поиск соответствующего белка по Swiss-Prot (по организму Homo sapiens, e-value 0.001). c ID TRI26_HUMAN, точнее участок 3-173 CDS соответствует 314-370 АК белка, 369-548 - 436-539 АК (оба участка бедка по БД не имеют специфических функций). Странно, что ни один белок не соответствует центральной части данного кодирующего участка - видимо, ошибка в координатах cds.
- Ссылки на банк EMBL в записи Swiss-Prot, описывающей белок GLUQ_ECOLI: U00096; AP009048; X64595; M34945. Сравните характеристики разных записей в кратком резюме.
В документе SwissProt лежат ссылки на файлы с последовательностями гена самого белка и всего генома бактерии. Обоих типов файлов - по 2, старые (за 1992 г.) и относительно новые (за 2006 г.)
Идентификатор записи EMBL Тип молекулы Класс данных Раздел EMBL Дата создания
документаДлина последо-
вательности ОписаниеAP009048 genomic DNA STD PRO 22-JAN-2006 4646332 Escherichia coli str. K12 substr. W3110 DNA, complete genome. M34945 genomic DNA STD PRO 10-JUL-1990 1273 E.coli dnaK suppressor (dksA) gene, complete cds. U00096 genomic DNA STD PRO 23-FEB-2006 4639675 Escherichia coli str. K-12 substr. MG1655, complete genome. X64595 genomic DNA STD PRO 01-APR-1992 946 E.coli DNA sequence DKSA-PCNB