|
|
- Создайте файл в формате Excel.
Создайте в директории H:\public_html\term1 файл XXXX_aa.xls, где "XXXX" - имя Вашего белка.
Создать файл можно двумя способвами:
- Cоздать файл с нужным именем и расширением в FAR и сохранить его. При щелчке по имени файла он откроется в Excel.
- Создать файл непосредственно в программе Excel. Для этого следует запустить программу, а открывшийся пустой файл сохранить через "Меню - Файл - Сохранить как (Menu - File - Save as)". При этом в графе "Тип файла" следует выбрать "Книга Microsoft Excel (Excel Worksheet)"
- Создайте в полученном файле листы.
Всего должно быть четыре листа со следующими названиями:
"aa_names"
“aa_mass”
“protein_seq_input”
“aa_frequencies”
Примечание: “aa” – стандартное сокращение для обозначения аминокислот: от англ. “amino acid”.
Как переименовать существующий лист:
- Кликнуть правой клавишей мыши по имени листа, выбрать в появившемся меню "Переименовать (Rename)".
- Двойным щелчком левой клавиши мыши выделить название листа, вписать новое название.
Как создать новый лист:
- Меню - Вставка - Лист (Menu - Insert - WorkSheet).
- Создайте таблицу с названиями аминокислот.
Таблица должна быть перенесена на лист "aa_names" из файла aanames.txt (он должен быть в папке Н:\Term1\Block1\Practice2, см. Задание 2).
Для этого используйте "Меню - Файл - Открыть (Menu - File - Open)", при этом в поле "Тип файлов" должно стоять "Все файлы (All files)". После того, как Excel предложит разбить текст по столбцам, необходимо выбрать "С разделителями" и установить необходимые разделители (знак табуляции, пробел и т.д.). После этого таблица откроется в новом файле. Перенесите ее в файл XXXX_aa.xls на лист "aa_names". Отсортируйте аминокислоты по возрастающей по однобуквенной номенклатуре.
- Занесите в файл последовательность Вашего белка в виде таблицы.
Есть несколько способов превратить последовательность в столбик букв.
Попробуйте наиболее быстрый способ.
- Откройте в редакторе FAR файл с последовательностью заданного белка.
(Файл my_protein.fasta должен лежать у Вас в папке Н:\Term1\Block1\Practice2);
- Скопируйте только (!) аминокислотную последовательность.
- Вставьте всю скопированную последовательнось в одну ячейку, например, в ячейку А1
листа "protein_seq_input".
- Удалите все пробелы, если они есть (кнопка Edit).
- Создайте столбец с номерами позиций аминокислотных остатков в заданной последовательности;
например, в ячейку А3 вставьте 1, а в ячейку А4 вставьте формулу =А3+1, далее копируйте
эту формулу.
- В ячейку, соседнюю с А3, например, в ячейку В3, введите формулу =ПСТР($A$1;$A3;1);
если все сделано правильно, в ячейке В3 вы увидите первую букву последовательности;
с помощью копирования формулы получите столбик однобуквенных обозначений всех остатков заданного
белка; разберитесь, что за формула вам предложена для облегчения работы.
- Рядом с полученной таблицей создайте ее копию, в ячейках которой будут уже не формулы, а только числа и буквы (подсказка:
используйте опцию "специальной вставки" .
Есть другой, тоже поучительный способ. Для этого выполните следующие действия.
- Откройте в редакторе FAR файл с последовательностью заданного белка;
разбейте последовательность на строки так, чтобы в каждой строке было 10-20 символов; сохраните файл.
- Откройте отредактированный файл с помощью меню "Файл" программы Excel.
- После того, как Excel предложит разбить текст по столбцам, выберите "фиксированной ширины".
- Проставьте разделительные линии так, чтобы каждая аминокислота оказалась в отдельной ячейке.
- Поскольку Excel откроет последовательность в новом файле, перенесите полученную таблицу с последовательностью на лист “protein_seq”.
Таким образом, теперь Вы получили таблицу, в которой последовательность белка представлена в виде нескольких строк, причем каждая аминокислота находится в отдельной ячейке.
Теперь необходимо представить последовательность Вашего белка в виде единого столбца, вот таким образом:
№
|
Аминокислота
|
1
|
M
|
2
|
R
|
3
|
Y
|
и т.д.
|
Для превращения прямоугольной таблицы в столбец следует воспользоваться функцией "Специальная вставка". Для этого копируйте строку с частью последовательности белка (меню вызывается правой клавишей мыши) и затем сделайте специальную встаку (также в меню, вызываемом правой клавишей мыши), отметив "Транспонировать". Эту процедуру надо выполнить для всех строк. Будьте внимательны, не перепутайте порядок строк!
- Рассчитайте встречаемость и частоту каждой аминокислоты в белке
На листе “aa_frequencies” создайте таблицу следующего вида:
Аминокислота
|
Встречаемость
|
Частота
|
А
|
4
|
0,10
|
С
|
2
|
0,05
|
|
|
|
|
|
|
В этой таблице Встречаемость обозначает, сколько остатков этой аминокислоты присутствует в последовательности белка. Частота - отношение всречаемости аминокислоты к общей длине белка.
Для того, чтобы вычислить встречаемость аминокислоты, например, "А", воспользуйтесь функцией СЧЕТЕСЛИ:
- Перенесите колонку с однобуквенными обозначениями аминокислот с листа "aa_names".
- Установите курсор на ячейке, в которой бы Вы хотели посчитать встречаемость остатка "А".
- Зайдите в "Меню - Вставка - Функция (Menu - Insert - Function)".
- Выберите из списка функцию СЧЕТЕСЛИ (COUNTIF).
- Задайте в качестве диапазона последовательность белка в виде столбца - без заголовка (напоминаем, что она находится на листе “protein_seq”).
- В качестве условия задайте ячейку из Вашей таблицы, где стоит "А"
Примечание 1: Обратите внимание, что в этом задании диапазон и условия располагаются на разных листах.
Примечание 2: При задании диапазона используйте абсолютные ссылки.
- Посчитайте встречаемость для других аминокислот. Подумайте, что нужно изменить в формуле, чтобы можно было ее копировать, а не использовать функцию СЧЕТЕСЛИ 20 раз.
- Используя мастер функций и функцию СУММА (SUM), посчитайте общую длину белка, исходя из встречаемости аминокислот.
- Посчитайте частоты каждой аминокислоты, исходя из ее встречаемости и общей длины белка.
Примечание: При подсчете частот используйте числовой формат ячеек с двумя цифрами после запятой.
- Для проверки правильности своих расчетов вычислите сумму частот всех аминокислот.
- Создайте сводную таблицу с расчетом встречаемости аминокислот
- На листе “protein_seq” выделите, теперь уже вместе с заголовком последовательность белка в виде столбца
- Нажмите "Меню – Данные – Сводная таблица (Menu – Data – Pivot Table Report)"
- По умолчанию флажки должны стоять возле "В списке или базе данных Microsoft Excel" и "сводная таблица". После этого можно нажать "Далее".
- Автоматически выставляется выделенный диапазон, причем используются абсолютные ссылки. Если он не выставлен, выставьте его самостоятельно.
- Таблицу необходимо создать на новом листе.
- Нажмите "Макет", перетащите кнопку "Аминокислота" в поле "Строка" и в поле "Данные". Проследите, чтобы в поле "Данные" было установлено "Кол-во значений".
- Таблица будет создана на новом листе. Переименуйте этот лист в "aa_table"
|