|
Занятие 2. Банк EMBL
-
Сравнение разных записей в EMBL
C помощью SRS я получила информацию, необходимую
для заполнения следующей таблицы.
|
|
С увеличением даты создания повышается и длина последовательности, причем разница между 85 и 86 годами- в 5 раз, а между 86 и 94- в 500 раз.2 из 5 последовательностей- полные геномы.
Сравнение описаний гена Escherichia coli в двух разных записях EMBL
На основании результатов упр.1 я выбрала 2 записи для дальнейшего изучения
(специально не брала полные геномы).
Получила эти записи EMBL и убедилась, что в этих документах действительно
содержатся описания последовательности, кодирующей мой белок.
Изучила документы и заполнила таблицу:
Последовательности, кодирующие белок 2tpt
в двух записях банка EMBL
|
I |
II |
ID записи |
x00742 |
x03224 |
Начало гена в записи |
1 |
1665 |
Конец гена в записи |
195 |
1718 |
Направление гена |
прямое |
прямое |
Примечания* |
|
|
Эти записи 1985 и 1986 годов, процент идентичности оказался 14.9%,поэтому я решила взять "более" новые данные.
|
I |
II |
ID записи |
AP009048 |
U00096 |
Начало гена в записи |
4622909 |
4616252 |
Конец гена в записи |
4624231 |
4617574 |
Направление гена |
прямое |
прямое |
Примечания* |
|
|
В этом случае последовательности, кодирующие мой белок в разных записях идентичны на 100%.
Выравнивание:
AP009048 1 ttgtttctcgcacaagaaattattcgtaaaaaacgtgatggtcatgcgct 50
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 1 ttgtttctcgcacaagaaattattcgtaaaaaacgtgatggtcatgcgct 50
AP009048 51 gagcgatgaagaaattcgtttctttatcaacggtattcgcgacaacacta 100
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 51 gagcgatgaagaaattcgtttctttatcaacggtattcgcgacaacacta 100
AP009048 101 tctccgaagggcagattgccgccctcgcgatgaccattttcttccacgat 150
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 101 tctccgaagggcagattgccgccctcgcgatgaccattttcttccacgat 150
AP009048 151 atgacaatgcctgagcgtgtctcgctgaccatggcgatgcgagattcagg 200
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 151 atgacaatgcctgagcgtgtctcgctgaccatggcgatgcgagattcagg 200
AP009048 201 aaccgttctcgactggaaaagcctgcatctgaatggcccgattgttgata 250
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 201 aaccgttctcgactggaaaagcctgcatctgaatggcccgattgttgata 250
AP009048 251 aacactccaccggtggcgtcggcgatgtgacttcgctgatgttggggccg 300
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 251 aacactccaccggtggcgtcggcgatgtgacttcgctgatgttggggccg 300
AP009048 301 atggtcgcagcctgcggcggctatattccgatgatctctggtcgcggcct 350
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 301 atggtcgcagcctgcggcggctatattccgatgatctctggtcgcggcct 350
AP009048 351 cggtcatactggcggtacgctcgacaaactggaatccatccctggcttcg 400
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 351 cggtcatactggcggtacgctcgacaaactggaatccatccctggcttcg 400
AP009048 401 acattttcccggatgacaaccgtttccgcgaaattattaaagacgtcggc 450
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 401 acattttcccggatgacaaccgtttccgcgaaattattaaagacgtcggc 450
AP009048 451 gtggcgattatcggtcagaccagttcactggctccggctgataaacgttt 500
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 451 gtggcgattatcggtcagaccagttcactggctccggctgataaacgttt 500
AP009048 501 ctacgcgacccgtgatattaccgcaaccgtggactccatcccgctgatca 550
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 501 ctacgcgacccgtgatattaccgcaaccgtggactccatcccgctgatca 550
AP009048 551 ccgcctctattctggcgaagaaacttgcggaaggtctggacgcgctggtg 600
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 551 ccgcctctattctggcgaagaaacttgcggaaggtctggacgcgctggtg 600
AP009048 601 atggacgtgaaagtgggtagcggcgcgtttatgccgacctacgaactctc 650
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 601 atggacgtgaaagtgggtagcggcgcgtttatgccgacctacgaactctc 650
AP009048 651 tgaagcccttgccgaagcgattgttggcgtggctaacggcgctggcgtgc 700
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 651 tgaagcccttgccgaagcgattgttggcgtggctaacggcgctggcgtgc 700
AP009048 701 gcaccaccgcgctgctcaccgacatgaatcaggtactggcctccagtgca 750
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 701 gcaccaccgcgctgctcaccgacatgaatcaggtactggcctccagtgca 750
AP009048 751 ggtaacgcggttgaagttcgtgaagcggtgcagttcctgacgggtgaata 800
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 751 ggtaacgcggttgaagttcgtgaagcggtgcagttcctgacgggtgaata 800
AP009048 801 tcgtaacccgcgtctgtttgatgtcacgatggcgctgtgcgtggagatgc 850
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 801 tcgtaacccgcgtctgtttgatgtcacgatggcgctgtgcgtggagatgc 850
AP009048 851 tgatctccggcaaactggcgaaagatgacgccgaagcgcgcgcgaaattg 900
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 851 tgatctccggcaaactggcgaaagatgacgccgaagcgcgcgcgaaattg 900
AP009048 901 caggcggtgctggacaacggtaaagcggcagaagtctttggtcgtatggt 950
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 901 caggcggtgctggacaacggtaaagcggcagaagtctttggtcgtatggt 950
AP009048 951 agcggcacaaaaaggcccgaccgacttcgttgagaactacgcgaagtatc 1000
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 951 agcggcacaaaaaggcccgaccgacttcgttgagaactacgcgaagtatc 1000
AP009048 1001 tgccgacagcgatgctgacgaaagcagtctatgctgataccgaaggtttt 1050
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 1001 tgccgacagcgatgctgacgaaagcagtctatgctgataccgaaggtttt 1050
AP009048 1051 gtcagtgaaatggatacccgcgcgctggggatggcagtggttgcaatggg 1100
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 1051 gtcagtgaaatggatacccgcgcgctggggatggcagtggttgcaatggg 1100
AP009048 1101 cggcggacgccgtcaggcatctgacaccatcgattacagcgtcggcttta 1150
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 1101 cggcggacgccgtcaggcatctgacaccatcgattacagcgtcggcttta 1150
AP009048 1151 ctgatatggcgcgtctgggcgaccaggtagacggtcagcgtccgctggcg 1200
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 1151 ctgatatggcgcgtctgggcgaccaggtagacggtcagcgtccgctggcg 1200
AP009048 1201 gttatccacgcgaaagacgaaaacaactggcaggaagcggcgaaagcggt 1250
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 1201 gttatccacgcgaaagacgaaaacaactggcaggaagcggcgaaagcggt 1250
AP009048 1251 gaaagcggcaattaaacttgccgataaagcaccggaaagcacaccaactg 1300
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 1251 gaaagcggcaattaaacttgccgataaagcaccggaaagcacaccaactg 1300
AP009048 1301 tctatcgccgtatcagcgaataa 1323
|||||||||||||||||||||||
U00096 1301 tctatcgccgtatcagcgaataa 1323
3.Знакомство с записью гена из эукариотического генома
На предыдущую.