Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2025

1. Toy educational task

Не обязательное

Задание и подсказки хранятся в этой презентации.

2. Импортируйте в свой Google Sheets таблицы с информацией о генах в выбранном ранее геноме

Обязательное! Нужно закончить до вечера 17 октября и записаться в очередь, задание 7_class. В графу URL при записи в очередь вставьте адрес своей wiki-страницы.

Создайте в Google Sheets новую книгу и назовите её CDS

Инструкцию см. здесь

Поставьте ссылку на эту книгу на своей wiki странице.

Ссылка должна быть не "слепая", то есть зашедший на вашу страницу пользователь интернета должен увидеть что-то вроде надписи "Таблица CDS бактерии Kakajato takaja" (синенькой и подчёркнутой), при щелчке на которую должна открываться книга. Если перед ссылкой будет адекватный подзаголовок, а после неё — небольшое пояснение, будет совсем хорошо.

3. Создайте гистограмму длин белков, т.е. числа аминокислотных остатков в белке

На дом, но лучше начать в классе

3.1. Создайте в Google Sheets новую страницу и назовите её prot_lengths_hist

3.2. Скопируйте на эту страницу колонку с длинами генов в колонку A

3.3. В соседней колонке B вычислите длину белка закодированного в гене по формуле ((дл.гена/3)-1). Минус 1 потому, что в ген входит стоп кодон, но он не кодирует аминокислотного остатка

3.4. вычислите минимальную и максимальную длину белка. Используйте функции MIN(Диапазон) и MAX(диапазон)

3.5. Выберите длину каждого кармана гистограммы такой, чтобы охватить все длины и карманов было бы не слишлом много, не более пары десятков. Напишите в ячейке эту длину. Пусть это число лежит в ячейке D1 и равно 50.

3.6. Для вычисления числа длин попавших в каждый карман потребуется три колонки. В первой, скажем колонке E, написаны границы карманов, например 40, 90, 140, 190, .... Каждое следующее значение равно предыдущему плюс D1. Распространите эту формулу вниз так чтобы покрыть максимальную длину белка.

3.7. В соседней колонке сгенерируйте подписи карманов вида E(i-1) - Ei. Здесь i номер текущей строки, - не минус между E(i-1) и Ei не минус, а чёрточка. Это делается соединением значений функцией =Еi-1&"-"&Ei

3.8. В колонке G найдите число длин белков попадающих в карман от E(i-1) до Ei. Это делается функцией =COUNTIFS(B:B,">="&E(i-1), B:B, "<"& Ei)

не пугайтесь - покажем.

3.9 Выделите колонки F и G И вставьте карту. Посмотрите какая больше подходит.

2025/1/class_work7 (последним исправлял пользователь sas 2025-10-17 09:07:42)