Учебный сайт
Заиры Сефербековой
Результаты работы в Excel
Анализ информации о плазмидах
Задание 1. Упражнения
Задание 2. Анализ информации о плазмидах
При выполнении заданий я узнала много нового о плазмидах:
- к роду Thermococcus, к которому относится и моя архея, принадлежит всего 14 плазмид
- к виду kodakarensis (к которому тоже относится моя архея) не принадлежит ни одной плазмиды
- самая короткая плазмида имеет длину 0,537 (кб), а самая длинная - 2709,28 (кб)
- средняя длина плазмид оказалась равной 88,563 (кб), а медиана длин - 30,673(кб)
- для некоторых плазмид до сих пор не определена видовая и/или родовая принадлежность
- на данный момент описано 439 родов плазмид и 6348 плазмид в целом
Чтобы извлечь род из названия организма я пользовалась функцией ЕСЛИ, с помощью вложения этой функции
поставив условия, чтобы названия не начиналось с маленькой буквы, символов "[" и "'". Сводная таблица составлялась
с помощью инструмента Excel "Сводная таблица".
Мини-обзор протеома археи Thermococcus kodakarensis
Результаты работы в Excel: Исходные данные и гистограмма
Сводка результатов:
- гены действительно распределяются между двумя цепями ДНК и РНК с вероятностью 1/2. Это следует из того,
что количество генов на прямой и обратной цепях равны (в случае РНК) или примерно равны (в случае ДНК)
- в геноме моей археи обнаружилось 983 квазиоперонов с порогом 50 п.н., 573 квазиоперонов с порогом 100 п.н.,
339 квазиоперонов с порогом 150 п.н. и 214 квазиоперонов с порогом 200 п.н. При этом на прямой цепи
их всегда меньше.
- из статистики, приведенной выше, становится ясно, что количество квазиоперонов при увеличении порога
уменьшается. Это логически понятно: чем больше мы задаем порог, тем больше генов попадает в один квазиоперон
и, как следствие, суммарно квазиоперонов становится меньше.
- пересечений оказалось больше на прямой цепи: 345 против 233
- были найдены кодирующие последовательности, длина которых не кратна трем, причем все они расположены
в РНК. Это можно объяснить сдвигами рамок считывания и наличием интронов.
- согласно гистограмме большинство белков имеют длину в пределах 50-400 а.о. При этом максимальное
количество белков (341) имеет длину в пределах 50-100 а.о. Реже встречаются белки с длиной от 450 а.о. до 700 а.о.,
меньше 50 а.о. и больше 1000 а.о. Самая редкая длина - 800-1000 а.о. Для меня оказалось странным, что целых 27 белков
имеют длину больше 1000 а.о.
Мини-обзор по протеому археи: Отчет