Kodomo

Пользователь

Страничка Маши Овсянниковой

Всем привет!

Меня зовут Маша Овсянникова. Мне нравится информатика и хочется ей заниматься, люблю книги и читаю, как только выдается минутка. Иногда плету браслеты и обожаю быть вожатой и в принципе волонтерить, когда есть на это время. Очень люблю мультик про ежика в тумане - и даже хотела название странички сделать в его честь)

Моя почта: <mary.ovsyannikova AT fbb DOT msu DOT ru>

Пока на этой странице будут результаты практикумов)

Блок 3

Вот тут можно найти таблицу CDS бактерии Rossellomorea marisflavi.

А таблица генетических особенностей лежит здесь: тык.

Практика 8

Таблица к заданию 1 из работы в классе classwork 8.

Вывод: в таблице Addinfo не было найдено информации о 10 белках, всего обнаружено 6 разновидностей белков, отвечающих за разные типы метилирования. Большинство белков (1664) соответствуют метилированному аденину - m6A; меньшинство (3) имеют тип метилирования m4C,m6A (N4-метилцитозин и N6-метиладенозин). Еще 5 раз встречается тип m5C,m6A (5-метилцитозин и N6-метиладенозин). Два последних типа соответствуют белкам, способным метилировать два атома двух оснований ДНК в сайте связывания или вокруг него. Так же встречаются m4C, m5C. У 96 белков тип метилирования не определен.

Таблица к заданию 2 из работы в классе Feature_table.

Задание 2 из дз 8: Гистограмма длин белков и Гистограмма GC% по CDS (см страницу "gc_hist")

Toy educational task

Задание 1, таблица Cow_milk.

Вывод: У коровы с кличкой Белуга наименьшее значение (из приведенных в таблице) массовой доли и жира, и белка.


Всё, что касается обзора:

Ссылка на текст мини-обзора в формате .pdf.

Все сопроводительные материалы (а так же текст мини-обзора) собраны на гугл-диске в эту папку.

Ссылка на мини-обзор в Google Documents: minireview.

Гистограмма длин белков (см страницу " prot_lengths_hist") и гистограмма GC% по CDS (см страницу "gc_hist").

Гистограммы межгенных промежутков (см. страницы "inter_cds_intervals" и "inter_cds_intervals_hist").


Практика 14

Ссылка на код в Google Colab

Задание 1: старт-кодоны

В кодирующей последовательности у Bacillus subtilis встречается 21 различный старт-кодон: AAG, ACA, AGA, AGC, ATC, ATG, ATT, CAA, CAT, CGG, CTA, CTG, GAA, GAT, GGT, GTG, GTT, TAT, TTA, TTG, TTT. Больше всего встречается ATG - 3333 раза, несколько меньше: TTG - 562 и GTG - 397 раз. Каждый из остальных кодонов встречается не более 10 раз.

У Peptoclostridium acidaminophilum встречается 12 разных старт-кодонов: AAG, AGC, ATA, ATC, ATG, ATT, CCA, CTA, GGT, GTG, TTA, TTG. Наибольшая встречаемость у ATG - 1680 раз, меньше встречаются TTG - 249 раз и GTG - 191 раз; все остальные менее, чем по 8 раз (каждый).

У Ureaplasma urealyticum parvum в кодирующей последовательности 8 различных старт-кодонов: ATA, ATC, ATG, ATT, GTG, TAT, TTA, TTG. 560 раз встречается ATG - это максимальное значение, TTG - 27 раз, GTG - 22 раза; остальные - не более, чем по два раза (каждый).

Во всех последовательностях абсолютно преобладает (по частоте использования) старт-кодон ATG, так же прослеживается закономерность сравнительно частого использования кодонов TTG и GTG в качестве альтернативных.

Также можно отметить, что наибольшее разнообразие старт-кодонов у грам-положительной почвенной бактерии B. subtilis, а наименьшее - у паразитической микоплазмы U. urealyticum. Эта закономерность может быть связана с образом жизни организма или размером его генома.

Использование разных старт-кодонов может быть связано с регуляцией уровня экспрессии генов. Возможно, использование не ATG может снизить количество синтезируемого белка. Кроме того, возможно, использование различных старт-кодонов может быть связано с перекрываемостью генов у бактерий, позволяя использовать одну и ту же последовательность для кодирования разных белков. Еще это может быть защитой от мутаций, которые могут повредить ATG (основной старт-кодон).

Задание 2:

В геноме Peptoclostridium acidaminophilu встречается 24 последовательности, стоп-кодон в которых встречается не только в конце. Все эти гены - селенопротеины. Опираясь на информацию, содержащуюся в именах последовательностей, можно выделить следующие причины наличия стоп-кодона не в конце последовательности.

Во-первых, кодирование аминокислоты селеноцистеина кодоном TGA. Это встречается в последовательностях: grdH, grdA, grdB, fdhF, selD, saoL, saoP, saoB, saoT, а так же в WP_334292061.1 - последовательности, отвечающей за биоисинтез железо-серных кластеров.

Вторая причина: последовательность является псевдогеном. К ним относятся последовательности htpG rpsP, ruvX, а так же транспозазы IS3 и IS607, последовательности, кодирующие ферменты метаболизма и белок ABC-транспортер. Вероятно, в этих последовательностях накопились мутации, поэтому появилась необходимость в "преждевременном" стоп-кодоне.

Users/mary.ovsyannikova (последним исправлял пользователь mary.ovsyannikova 2025-12-17 21:37:01)