Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2018

Подсказки по Excel

Имеется сайт с инструкциями по Excel планета Excel. Но уж очень много всего...

В нашей инструкции см. основные действия: импорт данных, выделение, удаление и вставка строк и столбцов, переход к краю заполненного диапазона, поиск и замена, ввод формул, функция ВПР (VLOOKUP), форматирование ячеек, вставка сводной таблицы, сохранение работы.

Обязательно освоить функцию VLOOKUP (ВПР).

Задание 1

Нужно освоить:

Перевод команд на английский найдёте здесь

Задание 2

Как скачать нужный файл из БД на сайте NCBI. Ниже стрелочка "→" значит переход по ссылке.

  1. Найдите базу данных Genome на сайте NCBI (Google: NCBI Genome) → Browse by organism. Введите название вашей бактерии или археи (напр., Bacillus subtilis) → Search → название организма.

  2. На странице организма откройте список геномов (→ list).

Если ссылки list нет, надо поступить так: найти строчку вида Assembly: GCA_000767275.3 ASM76727v3 и из нее составить адрес так: ftp://ftp.ncbi.nlm.nih.gov/genomes/all/GCA/000/767/275/, там найти нужную директорию, после чего перейти к п. 4.

  1. Выберите ваш геном по названию штамма и перейдите по ссылке из колонки FTP (последней). Зелёная ссылка — банк RefSeq, синяя — банк GenBank, годится любой (но в отчёте укажите, каким вы пользовались). Вы попадаете в директорию с файлами, относящимися к вашему геному.

  2. Вам нужно скачать и разархивировать файл feature_table.txt.gz. Чтобы разархивировать, в FAR зайдите в архив как в директорию и скопируйте файл туда, куда вам надо.
  3. Импортируйте файл в Excel (см. инструкцию) и превратите в плоскую таблицу нужного формата. См. в презентации требования к плоской таблице.

    1. Отсортируйте строчки по начальным координатам генов.
    2. Сохраните в формате Excel (.xlsx)