Главная страница > Третий семестр > Банк EMBL
С помощью SRS были получены данные о четырех записях в банке EMBL, коды доступа указаны в записи SwissProt белка Pyrg E.coli. Информация о этих записях представлена в Таблице 1.
Три из полученных записей содержат полные последовательности или участки последовательностей ДНК различных штаммов E.coli. А четвертая запись содержит последовательность матричной РНК, кодирующую ЦТФ-синтетазу и енолазу(запись создана в 1987 году). Записи AP009048 и U00096 содержат полные последовательности ДНК различных штаммов E.coli(записи созданы в 2006 году). А запись U29580 содержит участок последовательности ДНК E.coli K-12(запись создана в 1995 году). Следует отметить, что по понятным причинам записи полных геномов появились гораздо позже, чем записи о отдельных секвенированных участках.
Таблица 1.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Для сравнения мной были выбраны две записи: M12843(матричная РНК E.coli, содержащая последовательности pyrG и eno, кодирующие ЦТФ-синтетазу и енолазу, соответственно) и u29580(участок генома E.coli K-12, 62 мин.). Данные полученные из этих двух записей приведены в Таблице 2.
Таблица 2.
  |
|
|
ID записи |
|
|
Начало гена в записи |
|
|
Конец гена в записи |
|
|
Направление гена |
|
|
Примечания |
|
  |
С помощью программы needle( выравнивание ) было выяснено, что две последовательности гена pyrG совпадают на 99.8%. Данный результат обусловлен 4 заменами, информация о которых находится в Таблице 3.
Таблица 3.
Для занкомства с записью гена из эукариотического генома был рассмотрен фрагмент записи
EMBL AF053356, продуктом которого является transferrin-receptor2. Как известно, в отличие от прокариотических, эукариотические гены состоят из интронов(некодирующих участков) и экзонов(кодирующих участков). Ген находится на прямой цепи, поэтому его
схематическая запись будет выглядеть следующим образом:
--[134150..134182]--...--[154503..154790]--->
Ген содержит 18 экзонов и 17 интронов. Самый длинный экзон состоит из 287 нуклеотидов, а самый длинный интрон - из 7127 нуклеотидов. Следует отметить, что средняя длина экзона в исследуемом гене составляет примерно 129 нуклеотидов, а средняя длина интрона - 1077(т.е. примерно в 10 раз длиннее). Более того, процентное содержание экзонов в гене составляет 11,26%, что говорит о том, что большую часть гена составляют некодирующие области. Рассчеты выполнялись с помощью Excel, и результаты рассчетов можно посмотреть здесь .
© Алипер Александр Миронович