Kodomo

Пользователь

Страница Иголкина Ивана

Образование:

2012-2016 - школа №1317

2016-2023 - школа №1543

2023- - ФББ МГУ

Работы по ЭТ:

КЛАССНАЯ РАБОТА ПР7: https://docs.google.com/spreadsheets/d/1KlAsZirpwLLtcwkXeArkq0b6IWNa_-ybp3NLvvAbV8E/

ДОМАШНЯЯ РАБОТА ПР7: https://docs.google.com/spreadsheets/d/1uDpO-QnIriE2_P5t2YlUpGr_4tZWKXz8eLAPeM7Kf-0/

КЛАССНАЯ РАБОТА ПР8: https://docs.google.com/spreadsheets/d/1uDpO-QnIriE2_P5t2YlUpGr_4tZWKXz8eLAPeM7Kf-0/

генов - 4989

кодирующих последовательностей - 4817

тРНК - 131

рРНК - 37

Некаодирующей РНК -3

транспортно-матричной РНК - 1

МИНИ-ОБЗОР: https://drive.google.com/file/d/13faNh6PPNogtl6jWRuiMH0wKc5WWufvl/view?usp=sharing

Моя почта: <48igolkinia AT SPAMFREE mail DOT ru>

Отчет по практикуму №12\13\14

Код, использованный для решения задач прикреплен в виде ссылки в конце каждой задачи.

Задание 1

Escherichia coli

ATG 3890

ATT 4

CTG 2

GTG 338

TTC 1

TTG 80

Candidatus Gracilibacteria bacterium

ACA 1

ATG 1129

GTG 41

TCA 1

TCT 1

TTG 23

Mycoplasma pneumoniae

AAA 1

ACT 1

ATA 4

ATC 1

ATG 629

ATT 8

CAA 2

CTC 2

CTG 1

GAA 1

GGA 1

GTG 60

GTT 1

TCT 1

TTA 3

TTG 53

Выводы

ATG преобладает преобладает у всех трех организмов, как и должно быть в норме. "Неправильные" старт кодоны поделим на 2 группы по их количеству: те, кто встречается 5 и меньше раз в одном организме, и те, кто встретился больше 5 раз.

У всех организмов кодоны 2й группы совпадают - GTG и TTG. Можно заметить, что они были получены единичной точечной мутацией первого кодона. Данные кодоны кодируют аминокислоты Валин и Лейцин. Обе эти аминокислоты имеют углеводородный радикал, когда радикал метионина содержит серу. Видимо, из всех единичных точечных мутаций замена на аминокислоты с углеводородными радикалами меньше всего влияет на функциональность белка, поэтому не искореняются естественным отбором. По такой логике кодоны, кодирующие аланин тоже должны сохраняться, но их вообще нет. Это может быть связано либо с тем, что для получения из ATG кодонов, кодирующих аланин нужно 2 или больше точечных замен, либо этот факт может опровергать рассуждение выше. Выяснить это из полученных данных трудно.

Среди 1й группы также есть кодоны, полученные 1й точечной мутацией, что говорит о том, что вероятность их возникновения на бумаге такая как и GTG и TTG. Разница в количестве может быть обусловлена несколькими факторами. Во-первых, некоторые из этих кодонов на самом деле ATG, просто в этих местах произошла ошибка секвенирования. Во-вторых, они могут значимо менять функциональность белка (например меняя метионин с серой на аминокислоту с аминогруппой в радикале). В-третьих, нельзя исключать то, что нам просто "повезло" и конкретно в этих 3х геномах некоторых старт кодонов меньше, чем могло бы быть математически.

Касаемо кодонов, которые получены 2мя и 3мя заменами их столь малое количество объясняется тем, что шанс таких мутаций гораздо меньше, чем точечной замены.

КОД

Задание 5

Красивый график через матплотлиб тут

Красивый код (а может и не очень) тут

Не очень красивый файл с посчитанными GC-skew для каждой точки

Считается, что точка с минимальным куммулятивным GC-skew у бактерий соотвествует ориджину репликации, а точка с максимальным находится на противоположном "конце" и является терминалью репликации. Поскольку считали мы GC-skew с шагом 1000, то и ориджин определен с точностью +- 1000 нуклеотидов. При этом, координаты на графике надо умножать на 1000. Поэтому, исходя из полученного графика ориджин находится в точке с координатой 3870000 +- 1000 нуклеотидов. В genbank информация об этом не ищется(( Но, модуль разницы координат равен 235700 +- 1000, что примерно соответствует половине длины генома(≈2270500 +- 1000).

Users/igolkinia48 (последним исправлял пользователь igolkinia48 2023-12-21 22:47:22)