Занятие 7: Определение аминокислотного состава белка

   

  1. Создайте файл в формате Excel.
  2. Создайте в директории H:\public_html\term1 файл XXXX_aa.xls, где "XXXX" - имя Вашего белка.
    Создать файл можно двумя способвами:
    • Cоздать файл с нужным именем и расширением в FAR и сохранить его. При щелчке по имени файла он откроется в Excel.
    • Создать файл непосредственно в программе Excel. Для этого следует запустить программу, а открывшийся пустой файл сохранить через "Меню - Файл - Сохранить как (Menu - File - Save as)". При этом в графе "Тип файла" следует выбрать "Книга Microsoft Excel (Excel Worksheet)"

  3. Создайте в полученном файле листы.
  4. Всего должно быть четыре листа со следующими названиями:
        "aa_names"
        “aa_mass”
        “protein_seq_input”
        “aa_frequencies”

    Примечание: “aa” – стандартное сокращение для обозначения аминокислот: от англ. “amino acid”.

    Как переименовать существующий лист:
    • Кликнуть правой клавишей мыши по имени листа, выбрать в появившемся меню "Переименовать (Rename)".
    • Двойным щелчком левой клавиши мыши выделить название листа, вписать новое название.

    Как создать новый лист:
    • Меню - Вставка - Лист (Menu - Insert - WorkSheet).

  5. Создайте таблицу с названиями аминокислот.
  6. Таблица должна быть перенесена на лист "aa_names" из файла aanames.txt (он должен быть в папке Н:\Term1\Block1\Practice2, см. Задание 2).
    Для этого используйте "Меню - Файл - Открыть (Menu - File - Open)", при этом в поле "Тип файлов" должно стоять "Все файлы (All files)". После того, как Excel предложит разбить текст по столбцам, необходимо выбрать "С разделителями" и установить необходимые разделители (знак табуляции, пробел и т.д.). После этого таблица откроется в новом файле. Перенесите ее в файл XXXX_aa.xls на лист "aa_names". Отсортируйте аминокислоты по возрастающей по однобуквенной номенклатуре.

  7. Занесите в файл последовательность Вашего белка в виде таблицы.
  8. Есть несколько способов превратить последовательность в столбик букв.
    Попробуйте наиболее быстрый способ.
    1. Откройте в редакторе FAR файл с последовательностью заданного белка. (Файл my_protein.fasta должен лежать у Вас в папке Н:\Term1\Block1\Practice2);
    2. Скопируйте только (!) аминокислотную последовательность.
    3. Вставьте всю скопированную последовательнось в одну ячейку, например, в ячейку А1 листа "protein_seq_input".
    4. Удалите все пробелы, если они есть (кнопка Edit).
    5. Создайте столбец с номерами позиций аминокислотных остатков в заданной последовательности;
      например, в ячейку А3 вставьте 1, а в ячейку А4 вставьте формулу =А3+1, далее копируйте эту формулу.
    6. В ячейку, соседнюю с А3, например, в ячейку В3, введите формулу =ПСТР($A$1;$A3;1);
      если все сделано правильно, в ячейке В3 вы увидите первую букву последовательности;
      с помощью копирования формулы получите столбик однобуквенных обозначений всех остатков заданного белка; разберитесь, что за формула вам предложена для облегчения работы.
    7. Рядом с полученной таблицей создайте ее копию, в ячейках которой будут уже не формулы, а только числа и буквы (подсказка: используйте опцию "специальной вставки" .

    Есть другой, тоже поучительный способ. Для этого выполните следующие действия.
    • Откройте в редакторе FAR файл с последовательностью заданного белка; разбейте последовательность на строки так, чтобы в каждой строке было 10-20 символов; сохраните файл.
    • Откройте отредактированный файл с помощью меню "Файл" программы Excel.
    • После того, как Excel предложит разбить текст по столбцам, выберите "фиксированной ширины".
    • Проставьте разделительные линии так, чтобы каждая аминокислота оказалась в отдельной ячейке.
    • Поскольку Excel откроет последовательность в новом файле, перенесите полученную таблицу с последовательностью на лист “protein_seq”.
    Таким образом, теперь Вы получили таблицу, в которой последовательность белка представлена в виде нескольких строк, причем каждая аминокислота находится в отдельной ячейке.
    Теперь необходимо представить последовательность Вашего белка в виде единого столбца, вот таким образом:
    Аминокислота
    1 M
    2 R
    3 Y
    и т.д.

    Для превращения прямоугольной таблицы в столбец следует воспользоваться функцией "Специальная вставка". Для этого копируйте строку с частью последовательности белка (меню вызывается правой клавишей мыши) и затем сделайте специальную встаку (также в меню, вызываемом правой клавишей мыши), отметив "Транспонировать". Эту процедуру надо выполнить для всех строк. Будьте внимательны, не перепутайте порядок строк!

  9. Рассчитайте встречаемость и частоту каждой аминокислоты в белке
  10. На листе “aa_frequencies” создайте таблицу следующего вида:
    Аминокислота Встречаемость Частота
    А 4 0,10
    С 2 0,05
         
         

    В этой таблице Встречаемость обозначает, сколько остатков этой аминокислоты присутствует в последовательности белка. Частота - отношение всречаемости аминокислоты к общей длине белка.

    Для того, чтобы вычислить встречаемость аминокислоты, например, "А", воспользуйтесь функцией СЧЕТЕСЛИ:
    • Перенесите колонку с однобуквенными обозначениями аминокислот с листа "aa_names".
    • Установите курсор на ячейке, в которой бы Вы хотели посчитать встречаемость остатка "А".
    • Зайдите в "Меню - Вставка - Функция (Menu - Insert - Function)".
    • Выберите из списка функцию СЧЕТЕСЛИ (COUNTIF).
    • Задайте в качестве диапазона последовательность белка в виде столбца - без заголовка (напоминаем, что она находится на листе “protein_seq”).
    • В качестве условия задайте ячейку из Вашей таблицы, где стоит "А"
      Примечание 1: Обратите внимание, что в этом задании диапазон и условия располагаются на разных листах.
      Примечание 2: При задании диапазона используйте абсолютные ссылки.
    • Посчитайте встречаемость для других аминокислот. Подумайте, что нужно изменить в формуле, чтобы можно было ее копировать, а не использовать функцию СЧЕТЕСЛИ 20 раз.
    • Используя мастер функций и функцию СУММА (SUM), посчитайте общую длину белка, исходя из встречаемости аминокислот.
    • Посчитайте частоты каждой аминокислоты, исходя из ее встречаемости и общей длины белка.
      Примечание: При подсчете частот используйте числовой формат ячеек с двумя цифрами после запятой.
    • Для проверки правильности своих расчетов вычислите сумму частот всех аминокислот.

  11. Создайте сводную таблицу с расчетом встречаемости аминокислот
    • На листе “protein_seq” выделите, теперь уже вместе с заголовком последовательность белка в виде столбца
    • Нажмите "Меню – Данные – Сводная таблица (Menu – Data – Pivot Table Report)"
    • По умолчанию флажки должны стоять возле "В списке или базе данных Microsoft Excel" и "сводная таблица". После этого можно нажать "Далее".
    • Автоматически выставляется выделенный диапазон, причем используются абсолютные ссылки. Если он не выставлен, выставьте его самостоятельно.
    • Таблицу необходимо создать на новом листе.
    • Нажмите "Макет", перетащите кнопку "Аминокислота" в поле "Строка" и в поле "Данные". Проследите, чтобы в поле "Данные" было установлено "Кол-во значений".
    • Таблица будет создана на новом листе. Переименуйте этот лист в "aa_table"