Учебная страница курса биоинформатики,
год поступления 2018
Подсказки по Excel
Имеется сайт с инструкциями по Excel планета Excel. Но уж очень много всего...
В нашей инструкции см. основные действия: импорт данных, выделение, удаление и вставка строк и столбцов, переход к краю заполненного диапазона, поиск и замена, ввод формул, функция ВПР (VLOOKUP), форматирование ячеек, вставка сводной таблицы, сохранение работы.
Обязательно освоить функцию VLOOKUP (ВПР).
Задание 1
Нужно освоить:
Число π;
- Корень, синус и т.п.;
- Построение графика (Меню "Вставка");
- Распространение формул, знак $;
- Удаление повторяющихся значений (Меню "Данные");
- Транспонирование: строку превратить в столбец или наоборот (специальная вставка по правой кнопке мыши, там ищите чекбокс "Транспонировать");
СЦЕПИТЬ, операция &;
- ПРОПНАЧ;
- ЛЕВСИМВ, ПРАВСИМВ, ПСТР;
- ДЛСТР;
- ЕСЛИ (а также И, ИЛИ);
- СЧЁТЕСЛИ, СЧЁТЕСЛИМН;
- Формулы из раздела "Статистические": СРЗНАЧ, СТАНДОТКЛ, МАКС, МИН, МЕДИАНА;
- ВПР;
... и все, что есть на слайдах презентации :).
Перевод команд на английский найдёте здесь
Задание 2
Как скачать нужный файл из БД на сайте NCBI. Ниже стрелочка "→" значит переход по ссылке.
Найдите базу данных Genome на сайте NCBI (Google: NCBI Genome) → Browse by organism. Введите название вашей бактерии или археи (напр., Bacillus subtilis) → Search → название организма.
На странице организма откройте список геномов (→ list).
Если ссылки list нет, надо поступить так: найти строчку вида Assembly: GCA_000767275.3 ASM76727v3 и из нее составить адрес так: ftp://ftp.ncbi.nlm.nih.gov/genomes/all/GCA/000/767/275/, там найти нужную директорию, после чего перейти к п. 4.
Выберите ваш геном по названию штамма и перейдите по ссылке из колонки FTP (последней). Зелёная ссылка — банк RefSeq, синяя — банк GenBank, годится любой (но в отчёте укажите, каким вы пользовались). Вы попадаете в директорию с файлами, относящимися к вашему геному.
- Вам нужно скачать и разархивировать файл feature_table.txt.gz. Чтобы разархивировать, в FAR зайдите в архив как в директорию и скопируйте файл туда, куда вам надо.
Импортируйте файл в Excel (см. инструкцию) и превратите в плоскую таблицу нужного формата. См. в презентации требования к плоской таблице.
- Отсортируйте строчки по начальным координатам генов.
- Сохраните в формате Excel (.xlsx)