Учебная страница курса биоинформатики,
год поступления 2021
Указания к практикуму 7
Как завести книгу в Google sheets
Зайдите в браузере на страницу https://drive.google.com . Если вы в момент входа не были авторизованы в сервисах Google, вас попросят ввести свой адрес электронной почты. Нужен адрес на gmail и пароль от этой почты.
Нажмите кнопку "Создать" и выберите "Google Таблицы". В левом верхнем углу (где написано "Новая таблица") напишите название таблицы: "Genome features".
Как импортировать данные из текстового файла
Сначала перебросьте файл с таблицей особенностей ("..._feature_table.txt") с kodomo на тот компьютер, на котором вы работаете.
В окне с новой таблицей в меню "Файл" выберите "Импортировать". В открывшемся меню "Импорт" выберите "Загрузка" → "Выбрать файл на устройстве". Найдите файл и нажмите "Открыть". После этого не торопитесь!
Если всё сделано правильно, перед вами откроется меню "Импорт файла". Внимательно прочитайте всё, что там написано.
- В разделе "Выбрать цель" оставьте "Заменить таблицу"
- В разделе "Тип разделителя" выберите тот разделитель, что используется в таблице особенностей генома (это вы должны знать, если забыли — спросите у товарищей).
Уберите галочку против слов "Преобразовывать текст..."! Чтобы избежать неприятных неожиданностей, лучше импортировать все данные как текст (не доверять искусственному интеллекту), а уже потом можно будет преобразовать всё, что нужно, в другой формат.
Только после этого нажмите "Импортировать данные". Импорт может занять заметное время.
С этим листом больше ничего делать не надо, пусть он всё время будет в исходном виде, это может потом понадобиться.
Как сделать выборку нужных строк таблицы и поместить её на отдельный лист
Сначала заведите отдельный лист, нажав плюсик (+) в левом нижнем углу. Переименуйте лист (меню открывается нажатием чёрного треугольника рядом с именем листа).
Далее можно предложить два способа:
- (с помощью сортировки).
- На листе с исходными данными выделите всё, нажав серый прямоугольник в левом верхнем углу (левее A и выше 1).
- В меню "Данные" выберите "Сортировать диапазон". Поставьте галочку в поле "Данные со строкой заголовка"
- В поле "Сортировать по" выберите (оставьте) "#feature"
- Нажмите "Добавить ещё один столбец для сортировки" и в поле "затем по" оставьте "class"
- Нажмите "Сортировать"
Когда сортировка закончится, полистайте таблицу (помогают кнопки PgUp, PgDown и ползунок справа) и найдите последнюю строку, в которой в первых двух столбцах стоит "CDS" и "with_protein"
- Выделите эту последнюю строку, для этого надо ткнуть левой кнопкой мыши в серый прямоугольник с номером строки (слева).
Теперь сдвиньте мышью ползунок в самой верхнее положение, нажмите <Shift> и, не отпуская <Shift>, ткните левой кнопкой мыши в номер строки 1. Если всё сделано правильно, у вас станут выделенными все строки от первой до последней из нужных.
Нажмите <Ctrl>+C, перейдите на лист CDS, ткните мышью в ячейку A1 и нажмите <Ctrl>+V. Подождите, пока данные будут вставляться на новый лист.
- (с помощью фильтра)
- На листе с исходными данными выделите всё, нажав серый прямоугольник в левом верхнем углу (левее A и выше 1).
- В меню "Данные" выберите "Создать фильтр". Рядом с заголовками столбцов появится зелёное нечто (будем называть его "знак фильтра")
- Ткните в знак фильтра столбца "#feature". Уберите галочки против всего, кроме "CDS" и нажмите OK
- Ткните в знак фильтра столбца "class". Уберите галочки против всего, кроме "with_protein" и нажмите OK
- Снова выделите всё на этом листе
Нажмите <Ctrl>+C, перейдите на лист CDS, ткните мышью в ячейку A1 и нажмите <Ctrl>+V. Подождите, пока данные будут вставляться на новый лист.
- Когда всё получится, желательно убрать фильтр с листа с исходными данными
Как вставить столбец и заполнить его последовательными номерами
На листе CDS щёлкните по букве над нужным столбцом (в вашем случае это буква A) правой кнопкой мыши. Откроется меню, в котором выберите "Вставить слева: 1".
В самую верхнюю ячейку нового столбца впишите его название: ID. В ячейки строк 2 и 3 этого столбца впишите соответственно 1 и 2.
Теперь надо воспользоваться автозаполнением. Выделите мышью ячейки с цифрами 1 и 2 и после этого наведите курсор мыши на правый нижний угол выделенной области так, чтобы курсор принял вид плюса +. При курсоре-плюсе выполните двойной щелчок левой кнопкой мыши. Если всё сделано правильно, весь столбец заполнится последовательными числами от 1 до числа закодированных в вашем геноме белков (CDS with proteins).
Как заставить программу воспринимать числа как числа
Вы импортировали исходные данные как текст, однако на листе CDS некоторые поля вам будут нужны именно как числа (над которыми программа сможет производить арифметические действия, правильно сортировать и т. д.). Нужно поменять формат таких ячеек. Можно сделать так:
- Найти нужный столбец. Сделать активной его вторую сверху ячейку.
Удерживая одновременно <Ctrl> и <Shift> нажать стрелку вниз ↓ Всё содержимое столбца (кроме заголовка) станет выделенным.
- В меню "Формат" выбрать "Числа" → "Число"
- Скорее всего числа появятся с двумя нулями после запятой (или точки). Чтобы они выглядели как целые, дважды нажмите на кнопку уменьшения числа разрядов в верхнем меню (сами её найдёте)
Операцию смены формата нужно сделать для всех столбцов листа CDS, в которых находятся числа.
Как создать общедоступную гиперссылку на книгу на своём wiki
В правом верхнем углу окна с таблицей имеется зелёная кнопка "Настройки доступа". Если её нажать, откроется окошко, в котором необходимо щёлкнуть по надписи "Разрешить доступ всем, у кого есть ссылка". После этого, если щёлкнуть по надписи "Копировать ссылку", то URL нужной гиперссылки окажется в буфере вашего компьютера, останется только вставить её в нужное место (в вашем случае на страницу wiki).
Напоминаю, что гиперссылка на wiki оформляется так: [[URL|текст]], например:
[[https://docs.google.com/spreadsheets/d/1iJQwNM0I3I9a5ymIlcjlif6ITgPok5coTK1ne6I7yIo/|Таблица особенностей генома]]