Учебная страница курса биоинформатики,
год поступления 2017
Сайт с инструкциями по Excel планета Excel на русском яз. Но очень много всего...
Удобности. Основные действия: импорт данных, выделение, удаление и вставка строк и столбцов, переход к краю заполненного диапазона, поиск и замена, ввод формул, функция ВПР (vlookup), форматрование ячеек, вставка сводной таблицы, сохранение
Функция vlookup (русск. ВПР)
Задание 1
Нужно освоить
- Число пи
- корень, синус и т.п.
- Построение графика: Меню Вставка
- Распространение формул, $
- Удаление повторяющихся значений: меню Данные
- Транспонирование - строку превратить в столбец или наоборот: Специальная вставка по правой кнопке мыши
СЦЕПИТЬ, операция &
- ПРОПНАЧ
- ЛЕВСИМВ, ПРАВСИМВ, ПСТР
- ДЛСТР
- ЕСЛИ
- СЧЁТЕСЛИ, СЧЁТЕСЛИМН
- СУММЕСЛИ, СУММЕСЛИМН (не помню, нужны ли)
- Формулы из раздела Статистика - СРЗНАЧ, СТАНДОТКЛ, МАКС, МИН, МЕДИАНА
- ВПР
... и все, что есть на слайдах презентации :)
Перевод команд на аглийский найдете здесь
Задание 2
- Как скачать нужный файл из БД на сайте NCBI
Я описываю способ доступа к файлам. Ниже стрелочка "=>" значит переход по ссылке.
Найдите базу данных Genome на сайте NCBI (Google: NCBI Genome) => Browse by organism. Введите название вашей бактерии или археи (напр., Bacillus subtilis) => Search by organism => по имени организма
На странице организма откройте список геномов (=> list), выберите ваш геном по названию штамма и перейдите по ссылке из колонки FTP (последней). Вы попадаете в директорию с файлами, относящимися к вашему геному.
Здравствуйте, у меня проблема со 2-м заданием 12 блока, а именно на сайте NCBI не существует листа с моей бактерией
- (Fervidobacterium islandicum). Подскажите, что делать?
С уважением, ваш ученик Иззи Антон.
Существует :)
https://www.ncbi.nlm.nih.gov/genome/ => Browse by Organism => забиваете название Fervidobacterium islandicum, search => по ссылке Organism
В Вашем случае ссылки list нет. Это усложняет поиск. Надо поступить так. Найти строчку Assembly:
Assembly: GCA_000767275.3 ASM76727v3
Из нее составить адрес так:
ftp://ftp.ncbi.nlm.nih.gov/genomes/all/GCA/000/767/275/
Догадались как он получен из Assembly?
И далее выбрать нужное.
Все просто :)
Если не нравится - претензии к создателям баз данных на сайте NCBI :)
ААл
- Вам нужно скачать и разархивировать файл feature_table.txt.zip. Умеете? В FAR зайдите в архив как в директорию и скопируйте файл туда, куда вам надо.
Импортируйте файл в Excel (см. инструкцию) и превратите в плоскую таблицу нужного формата. См. в презентации требования к плоской таблице.
Удалите строки "gene", так как они для прокариот не информативны. Для этого в меню "Данные" установите фильтр, выделите строчки gene и удалите их.
С удалением строчек я поспешил. Извините. См. пр.13
- Отсортируйте строчки по начальным координатам генов.
- Сохраните в формате Excel (.xlsx)