Страница Иголкина Ивана
Образование:
2012-2016 - школа №1317
2016-2023 - школа №1543
2023- - ФББ МГУ
Работы по ЭТ:
КЛАССНАЯ РАБОТА ПР7: https://docs.google.com/spreadsheets/d/1KlAsZirpwLLtcwkXeArkq0b6IWNa_-ybp3NLvvAbV8E/
ДОМАШНЯЯ РАБОТА ПР7: https://docs.google.com/spreadsheets/d/1uDpO-QnIriE2_P5t2YlUpGr_4tZWKXz8eLAPeM7Kf-0/
КЛАССНАЯ РАБОТА ПР8: https://docs.google.com/spreadsheets/d/1uDpO-QnIriE2_P5t2YlUpGr_4tZWKXz8eLAPeM7Kf-0/
генов - 4989
кодирующих последовательностей - 4817
тРНК - 131
рРНК - 37
Некаодирующей РНК -3
транспортно-матричной РНК - 1
МИНИ-ОБЗОР: https://drive.google.com/file/d/13faNh6PPNogtl6jWRuiMH0wKc5WWufvl/view?usp=sharing
Моя почта: <48igolkinia AT SPAMFREE mail DOT ru>
Отчет по практикуму №12\13\14
Код, использованный для решения задач прикреплен в виде ссылки в конце каждой задачи.
Задание 1
Escherichia coli
ATG 3890
ATT 4
CTG 2
GTG 338
TTC 1
TTG 80
Candidatus Gracilibacteria bacterium
ACA 1
ATG 1129
GTG 41
TCA 1
TCT 1
TTG 23
Mycoplasma pneumoniae
AAA 1
ACT 1
ATA 4
ATC 1
ATG 629
ATT 8
CAA 2
CTC 2
CTG 1
GAA 1
GGA 1
GTG 60
GTT 1
TCT 1
TTA 3
TTG 53
Выводы
ATG преобладает преобладает у всех трех организмов, как и должно быть в норме. "Неправильные" старт кодоны поделим на 2 группы по их количеству: те, кто встречается 5 и меньше раз в одном организме, и те, кто встретился больше 5 раз.
У всех организмов кодоны 2й группы совпадают - GTG и TTG. Можно заметить, что они были получены единичной точечной мутацией первого кодона. Данные кодоны кодируют аминокислоты Валин и Лейцин. Обе эти аминокислоты имеют углеводородный радикал, когда радикал метионина содержит серу. Видимо, из всех единичных точечных мутаций замена на аминокислоты с углеводородными радикалами меньше всего влияет на функциональность белка, поэтому не искореняются естественным отбором. По такой логике кодоны, кодирующие аланин тоже должны сохраняться, но их вообще нет. Это может быть связано либо с тем, что для получения из ATG кодонов, кодирующих аланин нужно 2 или больше точечных замен, либо этот факт может опровергать рассуждение выше. Выяснить это из полученных данных трудно.
Среди 1й группы также есть кодоны, полученные 1й точечной мутацией, что говорит о том, что вероятность их возникновения на бумаге такая как и GTG и TTG. Разница в количестве может быть обусловлена несколькими факторами. Во-первых, некоторые из этих кодонов на самом деле ATG, просто в этих местах произошла ошибка секвенирования. Во-вторых, они могут значимо менять функциональность белка (например меняя метионин с серой на аминокислоту с аминогруппой в радикале). В-третьих, нельзя исключать то, что нам просто "повезло" и конкретно в этих 3х геномах некоторых старт кодонов меньше, чем могло бы быть математически.
Касаемо кодонов, которые получены 2мя и 3мя заменами их столь малое количество объясняется тем, что шанс таких мутаций гораздо меньше, чем точечной замены.
Задание 5
Красивый график через матплотлиб тут
Красивый код (а может и не очень) тут
Не очень красивый файл с посчитанными GC-skew для каждой точки
Считается, что точка с минимальным куммулятивным GC-skew у бактерий соотвествует ориджину репликации, а точка с максимальным находится на противоположном "конце" и является терминалью репликации. Поскольку считали мы GC-skew с шагом 1000, то и ориджин определен с точностью +- 1000 нуклеотидов. При этом, координаты на графике надо умножать на 1000. Поэтому, исходя из полученного графика ориджин находится в точке с координатой 3870000 +- 1000 нуклеотидов. В genbank информация об этом не ищется(( Но, модуль разницы координат равен 235700 +- 1000, что примерно соответствует половине длины генома(≈2270500 +- 1000).