Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2017

Сайт с инструкциями по Excel планета Excel на русском яз. Но очень много всего...

Удобности. Основные действия: импорт данных, выделение, удаление и вставка строк и столбцов, переход к краю заполненного диапазона, поиск и замена, ввод формул, функция ВПР (vlookup), форматрование ячеек, вставка сводной таблицы, сохранение

Функция vlookup (русск. ВПР)

Задание 1

Нужно освоить

Перевод команд на аглийский найдете здесь

Задание 2

  1. Как скачать нужный файл из БД на сайте NCBI
    1. Я описываю способ доступа к файлам. Ниже стрелочка "=>" значит переход по ссылке.

    2. Найдите базу данных Genome на сайте NCBI (Google: NCBI Genome) => Browse by organism. Введите название вашей бактерии или археи (напр., Bacillus subtilis) => Search by organism => по имени организма

    3. На странице организма откройте список геномов (=> list), выберите ваш геном по названию штамма и перейдите по ссылке из колонки FTP (последней). Вы попадаете в директорию с файлами, относящимися к вашему геному.

​​​​​Здравствуйте, у меня проблема со 2-м заданием 12 блока, а именно на сайте NCBI не существует листа с моей бактерией

  • (Fervidobacterium islandicum). Подскажите, что делать?

С уважением, ваш ученик Иззи Антон.

Существует :)

https://www.ncbi.nlm.nih.gov/genome/ => Browse by Organism => забиваете название Fervidobacterium islandicum, search => по ссылке Organism

В Вашем случае ссылки list нет. Это усложняет поиск. Надо поступить так. Найти строчку Assembly:

Assembly: GCA_000767275.3 ASM76727v3

Из нее составить адрес так:

ftp://ftp.ncbi.nlm.nih.gov/genomes/all/GCA/000/767/275/

Догадались как он получен из Assembly?

И далее выбрать нужное.

Все просто :)

Если не нравится - претензии к создателям баз данных на сайте NCBI :)

ААл

  1. Вам нужно скачать и разархивировать файл feature_table.txt.zip. Умеете? В FAR зайдите в архив как в директорию и скопируйте файл туда, куда вам надо.
  2. Импортируйте файл в Excel (см. инструкцию) и превратите в плоскую таблицу нужного формата. См. в презентации требования к плоской таблице.

    1. Удалите строки "gene", так как они для прокариот не информативны. Для этого в меню "Данные" установите фильтр, выделите строчки gene и удалите их.

      С удалением строчек я поспешил. Извините. См. пр.13

    2. Отсортируйте строчки по начальным координатам генов.
    3. Сохраните в формате Excel (.xlsx)