Учебный сайт Саши Погорельской Эмблема
Главная Семестры Скрипты Обо мне Ссылки
1 семестр
2 семестр
3 семестр
4 семестр
7 семестр
Вирус
Бактерия
Белок
Геном

Анализ генома бактерии Syntrophus aciditrophicus SB.

Исходными данными для анализа является хромосомная таблица, о ее получении написано в разделе "скрипты". Посмотреть хромосомную таблицу можно здесь.

С помощью встроенных функций Excel рассчитаны следующие данные о белках генома бактерии:

Mean protein length296,986
Median protein length254
Minimum protein length39
Maximum protein length1606
Mean intergenic distance109,978
Median intergenic distance52
Maximum intergenic distance4646
CDS on direct strand1708
CDS on reverse strand1458
Overlapping genes749
Median protein length (direct strand)258,5
Median protein length (reverse strand)246
Mean protein length (direct strand)297,170
Mean protein length (reverse strand)296,771

Рассмотрим подробнее длины белков. Как видно из таблицы, длина варьирует от 39 до 1606 аминокислот. График эмпирического распределения длин белков представлен на рисунке 1. Функция показывает количество белков, длина которых меньше некоторого значения. В данном случае взят интервал между соседними такими значениями равный 10. По графику видно, что с ростом значения, темп роста количества белков падает.

Эмпирическая функция распределения длин белков.

Рисунок 1. Эмпирическая функция распределения длин белков. Получена с помощью Excel.

Другой наглядной характеристикой является гистограмма распределения по различным интервалам. Рассмотрим это на примере длин кодирующих участков. Эти значения изменяются от 120 до 4821. Эта гистограмма представлена на рисунке 2.

Гистограмма.

Рисунок 2. Гистограмма встречаемости кодирующих участков по интервалам длин. Получена с помощью Excel.

Для сравнения длин кодирующих участков на прямой и обратной цепи получена двойная гистограмма, представленная на рисунке 3.

Двойная гистограмма.

Рисунок 3. Двойная гистограмма встречаемости кодирующих участков по интервалам длин. На рисунке синие столбики - количество участков на прямой цепи, а красные - на обратной. Получена с помощью Excel.





© Pogorelskaya Sasha Last modification date: 19.02.15