Последовательности нуклеиновых кислоn Банк EMBL |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Последовательности, кодирующие белок HEMN_ECOLI в двух записях банка EMBL
Нуклеотидные последовательности моего белка были извлечены из обеих записей и сравнены командой needle. Результат лежит здесь. В соответсвии с ним, процент идентичноси последовательностей составляет 99.4%. Таблица различий:
Так же у последовательностей различаются 5'-концы:
Это различие обусловлено тем, что предсказать начало гена тут можно двояко: В записи D16509 начало АК последовательности белка выглядит следующим образом: MSVQQIDWDLALIQ В записи L19201 начало АК последовательности белка выглядит следующим образом: MSMSVQQIDWDLALIQ В стандартном генетическом коде, метионин кодируется только одним кодоном AUG, в то время как кодон GUG кодирует Валин. Однако в качестве стартового кодона в соответствии с 11-ой трансляционной таблицей (таблица, использующаяся для бактерий и пластид растений) могут выступать, видимо (в зависимости от организма? NTR в соответствующей мРНК? Ещё каких-то причин?), целых 7 кодонов, в том числе валиновый кодон GUG. И авторами первой записи ORF была выделена от обычного ATG до "стопа" этой рамки, а во второй записи авторы почему-то предпочли выделить эту ORF от кодона GUG - которой по многим таблицам генетического кода так же может выступать как стартовый. Различные таблицы генетических кодов (см. раздел 7.5.5) Ген RAB25: прямая цепь--[155081..155123]--...--[163840..163967]---> с общим количеством экзонов равным 5. Самый длинный экзон: [159591..159786] - 196нт Самый короткий экзон: [155081..155123] - 43нт Самый длинный интром: ..155123]--[159591.. - 4037нт Самый короткий интрон: ..163431]--[163840.. - 410нт |