Навигация по сайту:
|
Основы Excel: лист, таблица, ячейка, адрес, функция.
Ссылка на excel-файл с домашним заданием.
Наблюдения, возникшие в результате обработки биологических данных:
- 3d. Было проверено предположение: "Чем больше кодонов у аминокислоты, тем больше
она представлена в белке". Для этого были проведены расчеты (строки ниже 63), которые показали,
что эта гипотеза дает большие значения ошибки на нашей выборке: в среднем 43% для всех аминокислот и 24% для
"самых средних"(отсекли по 10% справа и слева, получив 16 аминокислот) по соотношению "процент встречаемости в
датасете/количество кодонов, кодирующее аминокислоту" аминокислот. Таким образом, изначальное предположение оказалось неверным.
- 3i. Наибольшее количество вирусных геномов из датасета лежит в промежутке от 32 до 64 KB. Для
вирусов важен небольшой размер их генома, так как это уменьшает время репликации вируса. Кроме того,
вирусные(конкретно РНК-вирусов) полимеразы
делают больше ошибок, что также не дает их геному быть слишком большим.
- 5b. Количество генов на прямой цепи уступает количеству генов на комплементарной цепи ровно на 1 ген, т.е. в этом геноме
они почти равны: 478 на прямой и 479 на комплементарной. Наибольшая группа генов, лежащих в геноме подряд на прямой цепи, состоит
из 30 генов. Для комплементарной цепи аналогичный показатель составил 22 гена.
|