Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2022

Срок для заданий практикума 7 (по понятным причинам) — две недели, так что на следующем занятии можно будет позадавать вопросы. Но постарайтесь всё же выполнить их за неделю, по указаниям (а то и вопросы не возникнут, а потом уже будет поздно).

Указания к практикуму 7

Как завести книгу в Google sheets

Зайдите в браузере на страницу https://drive.google.com . Если вы в момент входа не были авторизованы в сервисах Google, вас попросят ввести свой адрес электронной почты. Нужен адрес на gmail и пароль от этой почты.

Нажмите кнопку "Создать" и выберите "Google Таблицы". В левом верхнем углу (где написано "Новая таблица") напишите название таблицы: "Genome features".

Как импортировать данные из текстового файла

Сначала перебросьте файл с таблицей особенностей ("..._feature_table.txt") с kodomo на тот компьютер, на котором вы работаете.

В окне с новой таблицей в меню "Файл" выберите "Импортировать". В открывшемся меню "Импорт" выберите "Загрузка" → "Выбрать файл на устройстве". Найдите файл и нажмите "Открыть". После этого не торопитесь!

Если всё сделано правильно, перед вами откроется меню "Импорт файла". Внимательно прочитайте всё, что там написано.

Только после этого нажмите "Импортировать данные". Импорт может занять заметное время.

С этим листом больше ничего делать не надо, пусть он всё время будет в исходном виде, это может потом понадобиться.

Как сделать выборку нужных строк таблицы и поместить её на отдельный лист

Сначала заведите отдельный лист, нажав плюсик (+) в левом нижнем углу. Переименуйте лист (меню открывается нажатием чёрного треугольника рядом с именем листа).

Далее можно предложить два способа:

  1. (с помощью сортировки).
    • На листе с исходными данными выделите всё, нажав серый прямоугольник в левом верхнем углу (левее A и выше 1).
    • В меню "Данные" выберите "Сортировать диапазон". Поставьте галочку в поле "Данные со строкой заголовка"
    • В поле "Сортировать по" выберите (оставьте) "#feature"
    • Нажмите "Добавить ещё один столбец для сортировки" и в поле "затем по" оставьте "class"
    • Нажмите "Сортировать"
    • Когда сортировка закончится, полистайте таблицу (помогают кнопки PgUp, PgDown и ползунок справа) и найдите последнюю строку, в которой в первых двух столбцах стоит "CDS" и "with_protein"

    • Выделите эту последнюю строку, для этого надо ткнуть левой кнопкой мыши в серый прямоугольник с номером строки (слева).
    • Теперь сдвиньте мышью ползунок в самой верхнее положение, нажмите <Shift> и, не отпуская <Shift>, ткните левой кнопкой мыши в номер строки 1. Если всё сделано правильно, у вас станут выделенными все строки от первой до последней из нужных.

    • Нажмите <Ctrl>+C, перейдите на лист CDS, ткните мышью в ячейку A1 и нажмите <Ctrl>+V. Подождите, пока данные будут вставляться на новый лист.

  2. (с помощью фильтра)
    • На листе с исходными данными выделите всё, нажав серый прямоугольник в левом верхнем углу (левее A и выше 1).
    • В меню "Данные" выберите "Создать фильтр". Рядом с заголовками столбцов появится зелёное нечто (будем называть его "знак фильтра")
    • Ткните в знак фильтра столбца "#feature". Уберите галочки против всего, кроме "CDS" и нажмите OK
    • Ткните в знак фильтра столбца "class". Уберите галочки против всего, кроме "with_protein" и нажмите OK
    • Снова выделите всё на этом листе
    • Нажмите <Ctrl>+C, перейдите на лист CDS, ткните мышью в ячейку A1 и нажмите <Ctrl>+V. Подождите, пока данные будут вставляться на новый лист.

    • Когда всё получится, желательно убрать фильтр с листа с исходными данными

Как вставить столбец и заполнить его последовательными номерами

На листе CDS щёлкните по букве над нужным столбцом (в вашем случае это буква A) правой кнопкой мыши. Откроется меню, в котором выберите "Вставить слева: 1".

В самую верхнюю ячейку нового столбца впишите его название: ID. В ячейки строк 2 и 3 этого столбца впишите соответственно 1 и 2.

Теперь надо воспользоваться автозаполнением. Выделите мышью ячейки с цифрами 1 и 2 и после этого наведите курсор мыши на правый нижний угол выделенной области так, чтобы курсор принял вид плюса +. При курсоре-плюсе выполните двойной щелчок левой кнопкой мыши. Если всё сделано правильно, весь столбец заполнится последовательными числами от 1 до числа закодированных в вашем геноме белков (CDS with proteins).

Как заставить программу воспринимать числа как числа

Вы импортировали исходные данные как текст, однако на листе CDS некоторые поля вам будут нужны именно как числа (над которыми программа сможет производить арифметические действия, правильно сортировать и т. д.). Нужно поменять формат таких ячеек. Можно сделать так:

Операцию смены формата нужно сделать для всех столбцов листа CDS, в которых находятся числа.

Как создать общедоступную гиперссылку на книгу на своём wiki

В правом верхнем углу окна с таблицей имеется зелёная кнопка "Настройки доступа". Если её нажать, откроется окошко, в котором необходимо щёлкнуть по надписи "Разрешить доступ всем, у кого есть ссылка". После этого, если щёлкнуть по надписи "Копировать ссылку", то URL нужной гиперссылки окажется в буфере вашего компьютера, останется только вставить её в нужное место (в вашем случае на страницу wiki).

Напоминаю, что гиперссылка на wiki оформляется так: [[URL|текст]], например:

[[https://docs.google.com/spreadsheets/d/1iJQwNM0I3I9a5ymIlcjlif6ITgPok5coTK1ne6I7yIo/|Таблица особенностей генома]]

2022/1/hints7 (последним исправлял пользователь sas 2022-10-14 13:52:42)