|
Занятие 2. Банк EMBL
-
Сравнение разных записей в EMBL
Были получены данные о четырех записях в банке EMBL, коды доступа указаны в записи SwissProt белка KPYK1_ECOLI. Данные о записях приведены в таблице.
2 из найденных записей содержат полный геном и созданы значительно позже (2006 год), чем другие 2 (1990 и 1996 года), которые содержат либо ген (М24636), либо последовательность небольшого
региона (U68703).
Таблица результатов поиска SRS
Идентификатор записи EMBL
|
Тип молекулы
|
Класс данных
|
Раздел EMBL
|
Дата создания
документа |
Описание
|
Длина последовательности
|
AP009048 |
геномная ДНК |
стандартная запись |
последовательности прокариот |
22 января 2006 |
полный геном Escherichia coli W3110 DNA |
4646332 |
М24636 |
геномная ДНК |
стандартная запись |
последовательности прокариот |
20 апреля 1990 |
полная последовательность гена белка E.coli pyruvate kinase I (PK-1) |
1830 |
U00096 |
геномная ДНК |
стандартная запись |
последовательности прокариот |
23 февраля 2006 |
полный геном Escherichia coli K12 MG1655 |
4639675 |
U68703 |
геномная ДНК |
стандартная запись |
последовательности прокариот |
20 сентября 1996 |
геном Escherichia coli K-12 MG1655, регион ribC-pykF |
14601 |
-
Сравнение описаний гена Escherichia coli в двух разных записях EMBL
Для сравнения были выбраны записи участка ribC-pykF c ID U68703 и полной последовательности белка PK-1 E.coli c ID M24636.
Последовательности, кодирующие белок Pyruvate kinase I
в двух записях банка EMBL
|
II |
I |
ID записи |
M24636 |
U68703 |
Начало гена в записи |
356 |
13102 |
Конец гена в записи |
1744 |
14514 |
Направление гена |
прямое |
прямое |
C помощью программы needle было выяснено, что последовательности гена KPYK1_ECOLI
совпадают на 98.2%, а различия двух нуклеотидных последовательностей составляют 1.8% (только гэпы). Замен нуклеотидов в выравнивании
не наблюдалось.Но в полученной последовательности U68703, если посмотреть на выравнивание, есть гэп длиной в 1 нуклеотид после 14439, что означает сдвиг рамки считывания, а, следовательно, продукт экспрессии последовательности после гэпа не будет совпадать с таковым в последовательности М24636.
C помощью программы BLAST был проведен поиск гомологов по полной последовательности М24636
и U68703. Было выяснено, что участок, транслируемый после 1703 позиции (она соответствует гэпу в последовательности U68703)
в последовательности М24636, является уникальным и не встречается больше ни в каких белках. Тогда как участок, транслируемый с позиции после гэпа записи U68703
не является уникальным и встречается еще в нескольких белках (также сходных по функции, т.е. pyruvate kinase). Результаты BLAST:
поиск по U68703
-
Знакомство с записью гена из эукариотического генома
Было проведено исследование записи гена EMBL AF053356, продуктом которого является erythropoietin. Ген находится на комплементарной цепи, состоит из 6 экзонов и 5 интронов. Длина
самого короткого экзона - 13, самого длинного - 240. Самый короткий интрон - 489, самый длинный - 876. Средняя длина экзона - 133, интрона - 527, т.е. длина экзона примерно в 4 раза короче интрона в данном гене.
Рассчеты проводились с помощью Excel.
Схема транслируемого участка:
<-[54220..54375]--...--[56356..56368]----
|