Учебная страница курса биоинформатики,
год поступления 2012
Задание на контрольную работу
В директории P:\y12\term3\block3 лежат следующие файлы:
Файл speccodes.txt содержит расшифровку так называемых "кодов видов", принятых в банке белковых последовательностей Swiss-Prot.
Файлы с расширениями info содержат списки идентификаторов белковых последовательностей из банка Swiss-Prot, имеющих одинаковый "код функции", но разные "коды видов". Первая часть имени каждого из этих файлов совпадает с логином кого-нибудь из вас.
Ваша задача:
Импортировать в Excel файл speccodes.txt. При импорте используйте разделение столбцов по ширине. В отдельные столбцы должны попасть:
- код вида (в начале),
- буква (E или V или B или A), обозначающая таксон верхнего уровня (эукариоты, вирусы, бактерии, археи),
число (неважно, что оно значит )
- официальное название организма (например, "Homo sapiens" или "Antarctic bacterium DS2-3R").
Сохранить полученную книгу в формате Excel под именем H:\term1\block3\credits\xxxx_cw.xlsx, где xxxx – ваша фамилия латинскими буквами. Это будет ваш отчётный файл.
Импортировать в Excel файл yyyy.info, где yyyy – ваш логин, и перенести данные на отдельный лист вашего отчётного файла, названный "ID". Создать второй столбец – копию первого и стереть в нём код функции и знак "_"(используйте <Ctrl+H>), таким образом, в нём останутся только "коды видов". Добавить строку заголовков и озаглавить столбцы.
- Используя функцию VLOOKUP, добавить столбец на лист ID, в ячейках которого будут возникать официальные названия видов, чьи коды находятся в соответствующих ячейках второго столбца.
- Добавить лист "taxon count". В первый столбец этого листа внести четыре буквы A, B, E, V. Во второй столбец поместить формулы, считающие количество соответствующих букв во втором столбце листа "speccodes". Для этого использовать функцию COUNTIF.
- Сохранить отчётный файл и закрыть программу Excel.