на главную
назад

Банк EMBL

Сравнение разных записей в EMBL

Идентификатор записи EMBL Тип молекулы
Класс данных
Раздел EMBL
Дата создания
документа
Описание
Длина последовательности
J01673 genomic DNA STD PRO 13-JUN-1985 E.coli rho gene coding for transcription termination factor. 1880
M87049 genomic DNA STD PRO 31-AUG-1992 E. coli genomic sequence of the region from 84.5 to 86.5 minutes. 91414
U00096 genomic DNA STD PRO 23-FEB-2006 Escherichia coli K12 MG1655, complete genome. 4639675
AP009048 genomic DNA STD PRO 22-JAN-2006 Escherichia coli W3110 DNA, complete genome. 4646332
M12779 genomic DNA STD PRO 19-SEP-1987 E.coli (clone pRH4) trxA gene encoding thioredoxin, complete cds and rho gene, encoding rho protein, 5' end. 1493
S75640 genomic DNA STD PRO 16-FEB-1993 rfe-rff gene cluster: rho=Rho, rfe=involved in ECA and O-antigen biosynthesis [Escherichia coli, Genomic, 1939 nt]. 1939
L34404 genomic DNA STD PRO 07-AUG-1994 Escherichia coli transcription termination factor (rho) gene, 3' end. 108
Записи:

  • Самые длинные последовательности, имеющие идентификаторы U00096 и AP009048, представляют
    собой полные геномы Escherichia coli. Они немного отличаются друг от друга, так как относятся к разным штаммам.

  • Последовательности J01673, M87049, M12779, S75640 содержат в себе запись гена Rho_ecoli.
    А запись L34404 длиной всего 108 нуклеотидов не может содержать весь ген, а содержит только 3' конец.

  • Тип всех молекул - геномная ДНК.

  • Последовательности взяты из прокариотной ДНК (раздел EMBL-PRO).

  • Неудивительный факт - время создания документов говорит о том, что полный геном
    E.coli был секвенирован гораздо позже, чем отдельная последовательность.

  • Сравнение разных записей в EMBL

      I II
    ID записи J01673 M87049
    Начало гена в записи 468 19545
    Конец гена в записи 1727 20804
    Направление гена Прямое Прямое
    Примечания* В записи содержится ген белка Rho_ecoli (фактор терминации транскрипции) Часть генома E.coli с 84.5 до 86.5 минут.

    Сравнивая последовательности: с 468 по 1727 нуклеотида записи J01673 и с 19545 по 20804 записи M87049
    с помощью команды needle получили 100%-ое сходство (файл выравнивания).

    Конечно, можно было ожидать иного результата, так как вследствие вырожденности генетического кода,
    нуклеотидные последовательности, кодирующие один и тот же белок могут отличаться. Но 100%-ное сходство
    получилось, скорее всего, потому что обе последовательности были взяты из генома одного штамма Escherichia coli K12.

    Запись гена эукариотического генома Homo sapiens.

    В записи EMBL AF053356 генома человека был найден /product="leucin rich neuronal protein".
    В записи гена 21 экзон.
    Схематичная структура транслируемых участков гена выглядит так:
    Ген на прямой цепи:

    --[189531..189750]--…--[202875..202878]-->

    • Самый длинный экзон - 353 нуклеотида, а самый короткий - 4
    • Самый длинный интрон - 3422 нуклеотида, самый маленький - 81
    ©Ивин Юрий