Веб-страница Excel
Pr13:
На этом занятии я узнал, что в списке с плазмидами нету рода моей археи, а также то, что плазмиды встречаются в основном у бактерий.
Чтобы извлечь род и вид из таблицы с плазмодиями, я, с помощью Python, разделил первую колонку на три: с первым словом названия организма, со вторым и с остальными. Для создания сводной таблицы использовал кнопку "Сводная таблица" в разделе "Таблицы" вкладки "Вставка".
Файлы Excel:
Pr14:
На гистограмме длин белков мы наблюдаем резкий скачок количества белков между с длиной до 100 аминокислот и с длиной 101-200 аминокислот. Далее идет плавный спад по мере увеличения длины белков. Также можно заметить, что примерно две трети белков имеют длину от 100 до 400 аминокислот.
Согласно таблице, количество генов на прямой и обратной цепях примерно равно, что говорит в пользу гипотезы о том, что гены распределены между двумя цепями ДНК случайно с вероятностью 0.5. Также мы видим, что гены не часто пересекаются, но склонны "объединяться" в квазиопероны, чье число растет по мере уменьшения порога на расстояние. Еще мы можем заметить, что длина некоторых генов не кратна трем, причем все эти гены кодируют РНК. Данное явление может быть объяснено наличием интронов некодирующих участков ДНК. После транскрипции последовательности нуклеотидов, соответствующие интронам, вырезаются из незрелой мРНК (пре-мРНК) в процессе сплайсинга. Интроны характерны для генов эукариот, однако также найдены в генах, кодирующих рибосомальные РНК (рРНК), транспортные РНК (тРНК) и некоторые белки прокариот; эти интроны вырезаются на уровне РНК за счёт автосплайсинга [1].
Файлы Excel:
Подготовка результатов для мини-обзора генома
Pr15:
Мини-обзор протеома археи Vulcanisaeta Moutnovskia.
Источники:
[1] Интрон, Wikipedia.