Главная страница > Третий семестр > Банк EMBL  

Банк EMBL


Сравнение разных записей в EMBL

С помощью SRS были получены данные о четырех записях в банке EMBL, коды доступа указаны в записи SwissProt белка Pyrg E.coli. Информация о этих записях представлена в Таблице 1.

Три из полученных записей содержат полные последовательности или участки последовательностей ДНК различных штаммов E.coli. А четвертая запись содержит последовательность матричной РНК, кодирующую ЦТФ-синтетазу и енолазу(запись создана в 1987 году). Записи AP009048 и U00096 содержат полные последовательности ДНК различных штаммов E.coli(записи созданы в 2006 году). А запись U29580 содержит участок последовательности ДНК E.coli K-12(запись создана в 1995 году). Следует отметить, что по понятным причинам записи полных геномов появились гораздо позже, чем записи о отдельных секвенированных участках.

Таблица 1.

Идентификатор записи EMBL
Тип молекулы
Класс данных
Раздел EMBL
Дата создания документа
Длина последовательности
Описание
AP009048
Геномная ДНК
Стандартная запись
Последовательности прокариот
22-JAN-2006
4646332
Полная геномная ДНК E.coli W3110
M12843
Матричная РНК
Стандартная запись
Последовательности прокариот
09-MAR-1987
2442
матричная РНК E.coli, содержащая последовательности pyrG и eno, кодирующие ЦТФ-синтетазу и енолазу, соответственно
U00096
Геномная ДНК
Стандартная запись
Последовательности прокариот
23-FEB-2006
4639675
Полный геном E.coli K-12 MG1655
U29580
Геномная ДНК
Стандартная запись
Последовательности прокариот
02-JUL-1995
13234
Участок генома E.coli K-12, 62 мин.





Сравнение описаний гена Escherichia coli в двух разных записях EMBL

Для сравнения мной были выбраны две записи: M12843(матричная РНК E.coli, содержащая последовательности pyrG и eno, кодирующие ЦТФ-синтетазу и енолазу, соответственно) и u29580(участок генома E.coli K-12, 62 мин.). Данные полученные из этих двух записей приведены в Таблице 2.


Таблица 2.

 
I
II
ID записи
M12843
U29580
Начало гена в записи
351
5894
Конец гена в записи
1988
7531
Направление гена
прямое
обратное
Примечания
  • В записи вслед за полной последовательностью гена ЦТФ-синтетазы идет кусок последовательности гена енолазы
 
 




Сравненительный анализ выравнивания двух последовательностей гена pyrG(записи M12843 и U29580, соответственно), выполненного программой needle.

С помощью программы needle( выравнивание ) было выяснено, что две последовательности гена pyrG совпадают на 99.8%. Данный результат обусловлен 4 заменами, информация о которых находится в Таблице 3.

Таблица 3.

M12843
U29580
Позиция в выравнивании
Позиция в кодоне
Синонимична ли замена?
g
c
1011
3
Да. В обоих случаях будет синтезироваться глицин
с
g
1012
1
Нет. В случае кодона CТT будет синтезироваться лейцин, а в случае кодона GTT - валин.
g
t
1427
2
Нет.В случае кодона AGT будет синтезироваться серин, а в случае кодона АТТ - изолейцин.
t
g
1428
3
Нет.В случае кодона AGT будет синтезироваться серин, а в случае кодона AGG - аргинин.





Знакомство с записью гена из эукариотического генома

Для занкомства с записью гена из эукариотического генома был рассмотрен фрагмент записи EMBL AF053356, продуктом которого является transferrin-receptor2. Как известно, в отличие от прокариотических, эукариотические гены состоят из интронов(некодирующих участков) и экзонов(кодирующих участков). Ген находится на прямой цепи, поэтому его схематическая запись будет выглядеть следующим образом:

--[134150..134182]--...--[154503..154790]--->


Ген содержит 18 экзонов и 17 интронов. Самый длинный экзон состоит из 287 нуклеотидов, а самый длинный интрон - из 7127 нуклеотидов. Следует отметить, что средняя длина экзона в исследуемом гене составляет примерно 129 нуклеотидов, а средняя длина интрона - 1077(т.е. примерно в 10 раз длиннее). Более того, процентное содержание экзонов в гене составляет 11,26%, что говорит о том, что большую часть гена составляют некодирующие области. Рассчеты выполнялись с помощью Excel, и результаты рассчетов можно посмотреть здесь .



© Алипер Александр Миронович