Terms
|
Other results
|
Home page
|
|
|
- Сравнение разных записей в EMBL
Идентификатор записи EMBL |
Тип молекулы |
Класс данных |
Раздел EMBL |
Дата создания документа |
Описание |
Длина последовательности |
AP009048 |
genomic DNA |
STD(Standard) |
PRO(Prokaryotes) |
22-JAN-2006 |
Escherichia coli W3110 DNA, complete genome. |
4646332 |
J01619 |
genomic DNA |
STD(Standard) |
PRO(Prokaryotes) |
25-FEB-1991 |
Eschericia coli gltA gene, sdhCDAB operon and sucABCD operons, complete sequence. |
13063 |
U00096 |
genomic DNA |
STD(Standard) |
PRO(Prokaryotes) |
23-FEB-2006 |
Escherichia coli K12 MG1655, complete genome. |
4639675 |
X15790 |
genomic DNA |
STD(Standard) |
PRO(Prokaryotes) |
17-NOV-1989 |
E.coli g30 gene and sucD gene (partial), encoding a possible transcriptional regulator (P30) and succinyl-CoA synthetase alpha subunit. |
1285 |
Две записи соответсвуют полным геномам разных штамов бактерий(U00096,AP009048).J01619-запись соответсвует полной последовательности оперона(это видно из описания) и последний уже являеться последовательностью "ответсвенной за синтез" регулятора (P30) и белковой субъеденицы(SUCD_ECOLI).Так же аналогичное заключение можно сделать и исходя из размеров последовательности. Два из них безусловно относятся к полным геномам. Один скорее всего к оперону или аналогичной структуре и последний - маленький несет в себе информацию либо о единственном белке, либо о группе белков участвующих в одном процессе(В моем случае - регулятор).
- Сравнение описаний гена Escherichia coli в двух разных
записях EMBL
Последовательности, кодирующие белок SUCD_ECOLI в двух записях
банка EMBL
|
I |
II |
ID записи |
J01619 |
X15790 |
Начало гена в записи |
12082 |
931; |
Конец гена в записи |
12951 |
>1285 |
Направление гена |
Прямое(не та цепь с которой синтезируеться РНК) |
Обратное |
Примечания* |
Полная последовательность белка |
Небольшой кусок где-то с середины до конца | Полное совпадение последовательности. За исключением того, что одна из них - полная последовательность кодирующая белок, а вторая являеться лишь частью первой. В оригинале короткая последовательность была дана в комплементарном виде и с помощью небольшой програмы(сама программа и исходники лежат в папке Practice2) она была переведена в нужную цепь и после этого строилось выравнивание в needle. Все промежуточные файлы находяться в папке Practice2.
1 atgtccattttaatcgataaaaacaccaaggttatctgccagggctttac 50
0 -------------------------------------------------- 0
51 cggtagccaggggactttccactcagaacaggccattgcatacggcacta 100
0 -------------------------------------------------- 0
101 aaatggttggcggcgtaaccccaggtaaaggcggcaccacccacctcggc 150
0 -------------------------------------------------- 0
151 ctgccggtgttcaacaccgtgcgtgaagccgttgctgccactggcgctac 200
0 -------------------------------------------------- 0
201 cgcttctgttatctacgtaccagcaccgttctgcaaagactccattctgg 250
0 -------------------------------------------------- 0
251 aagccatcgacgcaggcatcaaactgattatcaccatcactgaaggcatc 300
0 -------------------------------------------------- 0
301 ccgacgctggatatgctgaccgtgaaagtgaagctggatgaagcaggcgt 350
0 -------------------------------------------------- 0
351 tcgtatgatcggcccgaactgcccaggcgttatcactccgggtgaatgca 400
0 -------------------------------------------------- 0
401 aaatcggtatccagcctggtcacattcacaaaccgggtaaagtgggtatc 450
0 -------------------------------------------------- 0
451 gtttcccgttccggtacactgacctatgaagcggttaaacagaccacgga 500
0 -------------------------------------------------- 0
501 ttacggtttcggtcagtcgacctgtgtcggtatcggcggtgacccgatcc 550
|||||||||||||||||||||||||||||||||||
1 ---------------gtcgacctgtgtcggtatcggcggtgacccgatcc 35
551 cgggctctaactttatcgacattctcgaaatgttcgaaaaagatccgcag 600
||||||||||||||||||||||||||||||||||||||||||||||||||
36 cgggctctaactttatcgacattctcgaaatgttcgaaaaagatccgcag 85
601 accgaagcgatcgtgatgatcggtgagatcggcggtagcgctgaagaaga 650
||||||||||||||||||||||||||||||||||||||||||||||||||
86 accgaagcgatcgtgatgatcggtgagatcggcggtagcgctgaagaaga 135
651 agcagctgcgtacatcaaagagcacgttaccaagccagttgtgggttaca 700
||||||||||||||||||||||||||||||||||||||||||||||||||
136 agcagctgcgtacatcaaagagcacgttaccaagccagttgtgggttaca 185
701 tcgctggtgtgactgcgccgaaaggcaaacgtatgggccacgcgggtgcc 750
||||||||||||||||||||||||||||||||||||||||||||||||||
186 tcgctggtgtgactgcgccgaaaggcaaacgtatgggccacgcgggtgcc 235
751 atcattgccggtgggaaagggactgcggatgagaaattcgctgctctgga 800
||||||||||||||||||||||||||||||||||||||||||||||||||
236 atcattgccggtgggaaagggactgcggatgagaaattcgctgctctgga 285
801 agccgcaggcgtgaaaaccgttcgcagcctggcggatatcggtgaagcac 850
||||||||||||||||||||||||||||||||||||||||||||||||||
286 agccgcaggcgtgaaaaccgttcgcagcctggcggatatcggtgaagcac 335
851 tgaaaactgttctgaaataaatatctgtaataagaaatagccctcgccgc 900
||||||||||||||||||||
336 tgaaaactgttctgaaataa------------------------------ 355
901 ttccctctacaggaatggcgaagggctgtcggtttcgacatggttggcca 950
355 -------------------------------------------------- 355
951 tcgtatgatggccttttttgtgcttatcgcga 982
355 -------------------------------- 355
- Знакомство с записью гена из эукариотического генома
- --[271945..272104]-- ... --[300134..300280]-->
- Всего 6 экзонов в гене.
- *Самый длинный интрон - 17842, самый короткий - 1477.
- *Самый длинный экзон - 222, самый короткий - 116.
Промежуточный Excel файл лежит в папке Practice2.
|
|