Учебный сайт Сергея Пушкарева

Навигация по сайту:

Основы Excel: лист, таблица, ячейка, адрес, функция.

Ссылка на excel-файл с домашним заданием.

Наблюдения, возникшие в результате обработки биологических данных:

  • 3d. Было проверено предположение: "Чем больше кодонов у аминокислоты, тем больше она представлена в белке". Для этого были проведены расчеты (строки ниже 63), которые показали, что эта гипотеза дает большие значения ошибки на нашей выборке: в среднем 43% для всех аминокислот и 24% для "самых средних"(отсекли по 10% справа и слева, получив 16 аминокислот) по соотношению "процент встречаемости в датасете/количество кодонов, кодирующее аминокислоту" аминокислот. Таким образом, изначальное предположение оказалось неверным.

  • 3i. Наибольшее количество вирусных геномов из датасета лежит в промежутке от 32 до 64 KB. Для вирусов важен небольшой размер их генома, так как это уменьшает время репликации вируса. Кроме того, вирусные(конкретно РНК-вирусов) полимеразы делают больше ошибок, что также не дает их геному быть слишком большим.

  • 5b. Количество генов на прямой цепи уступает количеству генов на комплементарной цепи ровно на 1 ген, т.е. в этом геноме они почти равны: 478 на прямой и 479 на комплементарной. Наибольшая группа генов, лежащих в геноме подряд на прямой цепи, состоит из 30 генов. Для комплементарной цепи аналогичный показатель составил 22 гена.

© Пушкарев Сергей, 2017