Сравнение разных записей в EMBL
Идентификатор записи EMBL | Тип молекулы |
Класс данных
|
Раздел EMBL
|
Дата создания документа |
Описание
|
Длина последовательности
|
J01673 | genomic DNA | STD | PRO | 13-JUN-1985 | E.coli rho gene coding for transcription termination factor. | 1880 |
M87049 | genomic DNA | STD | PRO | 31-AUG-1992 | E. coli genomic sequence of the region from 84.5 to 86.5 minutes. | 91414 |
U00096 | genomic DNA | STD | PRO | 23-FEB-2006 | Escherichia coli K12 MG1655, complete genome. | 4639675 |
AP009048 | genomic DNA | STD | PRO | 22-JAN-2006 | Escherichia coli W3110 DNA, complete genome. | 4646332 |
M12779 | genomic DNA | STD | PRO | 19-SEP-1987 | E.coli (clone pRH4) trxA gene encoding thioredoxin, complete cds and rho gene, encoding rho protein, 5' end. | 1493 |
S75640 | genomic DNA | STD | PRO | 16-FEB-1993 | rfe-rff gene cluster: rho=Rho, rfe=involved in ECA and O-antigen biosynthesis [Escherichia coli, Genomic, 1939 nt]. | 1939 |
L34404 | genomic DNA | STD | PRO | 07-AUG-1994 | Escherichia coli transcription termination factor (rho) gene, 3' end. | 108 |
собой полные геномы Escherichia coli. Они немного отличаются друг от друга, так как относятся к разным штаммам.
А запись L34404 длиной всего 108 нуклеотидов не может содержать весь ген, а содержит только 3' конец.
E.coli был секвенирован гораздо позже, чем отдельная последовательность. |
Сравнение разных записей в EMBL
I | II | |
ID записи | J01673 | M87049 |
Начало гена в записи | 468 | 19545 |
Конец гена в записи | 1727 | 20804 |
Направление гена | Прямое | Прямое |
Примечания* | В записи содержится ген белка Rho_ecoli (фактор терминации транскрипции) | Часть генома E.coli с 84.5 до 86.5 минут. |
Сравнивая последовательности: с 468 по
1727 нуклеотида записи J01673 и с 19545 по 20804 записи M87049
с помощью команды needle
получили 100%-ое сходство (файл выравнивания).
Конечно, можно было ожидать иного результата, так как вследствие вырожденности генетического кода,
нуклеотидные последовательности, кодирующие один и тот же белок могут отличаться. Но 100%-ное сходство
получилось, скорее всего, потому что обе последовательности были взяты из генома одного штамма Escherichia coli K12.
Запись гена эукариотического генома Homo sapiens.
В записи EMBL AF053356 генома человека был найден /product="leucin rich neuronal protein". --[189531..189750]--…--[202875..202878]-->
В записи гена 21 экзон.
Схематичная структура транслируемых участков гена выглядит так:
Ген на прямой цепи:
©Ивин Юрий