Учебная страница курса биоинформатики,
год поступления 2013
Практикум 15
1. Сводная таблица. В файле, созданном при выполнении предыдущего задания, создайте на отдельном листе сводную таблицу, в которой строки соответствовали бы типу и направлению генов хромосомной таблицы, и в каждой строке было бы указано число таких генов и их средняя длина. Отформатируйте ячейки со средней длиной так, чтобы был виден один знак после запятой. Назовите лист "Pivot table".
2. Условное форматирование. На листе с белками сделайте фон ячеек, содержащих длины очень коротких белков (короче 50 аминокислотных остатков) бледно-красным, а фон ячеек, содержащих длины очень длинных белков (длиннее 1000 остатков) – голубым.
3. Импорт текстовых таблиц и функция VLOOKUP. Заведите новый файл Familiya_pr15.xlsx и импортируйте туда (на отдельные листы):
файл speccodes.txt из директории P:\y13\term1\block3\pr15 – на лист "Species codes"
файл с расширением info, соответствующий вашему логину, из той же директории, на лист "Proteins".
Пояснение. Файл speccodes.txt содержит расшифровку так называемых "кодов видов", принятых в банке белковых последовательностей Swiss-Prot. Файлы с расширениями info содержат списки идентификаторов белковых последовательностей из банка Swiss-Prot, имеющих одинаковый "код функции" (до знака подчёркивания), но разные "коды видов" (после знака подчёркивания).
На листе Species Codes оставьте три столбца: с кодом вида, буквой (E, B, A или V), означающей таксон верхнего уровня (эукариоты, бактерии, археи или вирусы), и официальным названием вида. Все лишние символы, например "N=", необходимо удалить. Удалите также лишние строки, не относящиеся к таблице (в конце).
Второй столбец (с буквами) озаглавьте "Domain".
На листе Proteins создайте второй столбец как копию первого. Уберите из всех ячеек второго столбца код функции белка и знак подчёркивания (заменой соответствующей строки на пустую строку во всех ячейках столбца). Озаглавьте столбцы ID и Species code.
Третий столбец листа "Proteins" озаглавьте "Species name". Используя функцию VLOOKUP (ВПР в русифицированном варианте), вставьте в его ячейки официальные названия видов с листа "Species codes".
4. Ещё раз сводная таблица. На отдельный лист того же файла вставьте сводную таблицу, показывающую, сколько строк с каждой из букв в столбце "Domain" имеется на листе "Species Codes".