Задание 1:
Старт-кодоны и частота их использования:
Последовательность 1:ATG 3883 ATT 4 CTG 2 GTG 334 TTC 1 TTG 78
Для данной последовательности характерно проявление альтернативных старт-кодонов (GTG, TTG и "слабые": ATT, CTG), появившихся из-за частичной комплементарности и кодона TTC, который, как я предполагаю, является мутацией кодона TTG.
Последовательность 2: ATG 1129 GTG 41 TCA 1 TCT 1 TTG 23 ACA 1
Данная последовательность также имеет альтернативные старт-кодоны (GTG,TTG), однако также имеет нехарактерные стартовые кодоны, это можно объяснить тем, что они находятся в начале последовательности псевдогена, для которых часто бывает характерна неправильная структура.
Последовательность 3: ATG 634 GTG 62 TTG 40 ACC 2 ATA 2 ATC 3 ATT 4 CTG 4 GTT 1 TTA 2
Для данной последовательности характерны оба признака: присутствие альтернативных кодонов (GTG,TTG,ACC(возможно мутация слабого кодона ACG),ATA,ATC(возможно мутация основного кодона ATG), ATT, CTG) , а также нехарактерных в началах последовательностей псевдогенов (GTT, TTA).
Задание 2:
lcl|U00096.3_cds_249 [gene=insN] [locus_tag=b4587]...[pseudo=true]...
(Псевдоген , также при помощи интернета получил информацию о том , что данный псевдоген является частью большей кодирующей цепочки, которая была оборвана внедрением стоп-кодона) информация о белке
lcl|U00096.3_cds_AAD13438.1_1457 ...[transl_except=(pos:586..588,aa:Sec)]
lcl|U00096.3_cds_AAD13456.1_3815 ...[transl_except=(pos:586..588,aa:Sec)]
lcl|U00096.3_cds_AAD13462.1_3987 ...[transl_except=(pos:418..420,aa:Sec)]
(для каждой из данных последовательностей указано , что процесс трансляции проходит на цепочке за исключением стоп кодона )
Задание 3:
Стоп-кодоны и их использование(нехарактерные стоп-кодоны псевдогенов не учитываются):
Последовательность 1:TAA 2755 TAG 303 TGA 1241
Последовательность 2:TAA 998 TAG 188
Последовательность 3:TAA 514 TAG 206
Для 2 и 3 последовательности стоп-кодон TGA не является стоп кодоном, и кодирует аминокислоты. подтверждение - "Inprokaryotes, Mycoplasma, and Spiroplasma have recoded the TGA stop codon totryptophan (W)... "
Задание 4:
последовательность 1:TTA 18484 TTG 18283 CTT 14719 CTC 14926 CTG 71198 CTA 5201
последовательность 2:TTA 14767 TTG 3237 CTT 9333 CTC 3968 CTG 1714 CTA 3357
последовательность 3:TTA 10302 TTG 5601 CTT 2798 CTC 3161 CTG 2473 CTA 2848
Конкретных предположений не имею , однако, исходя из данных, предположу, что для организма могут быть характерные кодоны кодирования аминокислоты , обычные и редко встречаемые ( в каждой последовательности мы можем встретить кодон, встречаемость которого резко выше чем у остальных , и кодон, встречаемость которого ниже. Так кодон CTG очень характерен для первой последовательности , TTA, TTG,CTT,CTC - средней встречаемости , а CTA - явно редко встречаемый)
Задание 5:
cumulative GC-skew = -9.241
Минимум соответствует началу репликации , максимум-концу.
По информации из формата genbank минимум cumulative GC-skew(3870000) не соответствует oriC(3925744..3925975), однако находится достаточно близко и скорее всего обнаруживается при использовании окна другого масштаба. Подтверждается прошлое утверждение строчкой "rep_origin". график