Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2013

Практикум 15

1. Сводная таблица. В файле, созданном при выполнении предыдущего задания, создайте на отдельном листе сводную таблицу, в которой строки соответствовали бы типу и направлению генов хромосомной таблицы, и в каждой строке было бы указано число таких генов и их средняя длина. Отформатируйте ячейки со средней длиной так, чтобы был виден один знак после запятой. Назовите лист "Pivot table".

2. Условное форматирование. На листе с белками сделайте фон ячеек, содержащих длины очень коротких белков (короче 50 аминокислотных остатков) бледно-красным, а фон ячеек, содержащих длины очень длинных белков (длиннее 1000 остатков) – голубым.

3. Импорт текстовых таблиц и функция VLOOKUP. Заведите новый файл Familiya_pr15.xlsx и импортируйте туда (на отдельные листы):

Пояснение. Файл speccodes.txt содержит расшифровку так называемых "кодов видов", принятых в банке белковых последовательностей Swiss-Prot. Файлы с расширениями info содержат списки идентификаторов белковых последовательностей из банка Swiss-Prot, имеющих одинаковый "код функции" (до знака подчёркивания), но разные "коды видов" (после знака подчёркивания).

На листе Species Codes оставьте три столбца: с кодом вида, буквой (E, B, A или V), означающей таксон верхнего уровня (эукариоты, бактерии, археи или вирусы), и официальным названием вида. Все лишние символы, например "N=", необходимо удалить. Удалите также лишние строки, не относящиеся к таблице (в конце).

Второй столбец (с буквами) озаглавьте "Domain".

На листе Proteins создайте второй столбец как копию первого. Уберите из всех ячеек второго столбца код функции белка и знак подчёркивания (заменой соответствующей строки на пустую строку во всех ячейках столбца). Озаглавьте столбцы ID и Species code.

Третий столбец листа "Proteins" озаглавьте "Species name". Используя функцию VLOOKUP (ВПР в русифицированном варианте), вставьте в его ячейки официальные названия видов с листа "Species codes".

4. Ещё раз сводная таблица. На отдельный лист того же файла вставьте сводную таблицу, показывающую, сколько строк с каждой из букв в столбце "Domain" имеется на листе "Species Codes".