Kodomo

Пользователь

Задания 1

  1. Установите на свой компьютер следующие программы:
  2. Посмотрите на запись банка EMBL. Занесите в протокол ответы на следующие вопросы:

    1. Из какого организма взята ДНК, последовательность которой описывается?
    2. Авторы записи.
    3. Из какого класса данных данная запись?
    4. В каком таксономическом разделе EMBL находится запись? Какие последовательности содержит это раздел?
    5. Каков ее номер доступа (AC)?
    6. Каковы координаты последовательности лейциновой тРНК в этой записи?
  3. Пользуясь текстовым редактором, создайте файл, в котором в Fasta-формате находилась бы последовательность Leu-тРНК из записи EMBL предыдущего задания.
  4. Посмотрите на запись банка EMBL, описывающую геном фага λ. Найдите в этой записи информацию о закодированных в геноме компонентах капсида (capsid component) фага. Занесите в протокол координаты генов, а также номера доступа соответствующих записей банка Uniprot. Сохраните последовательность одного из белков в отдельном файле в Fasta-формате.

  5. По адресу http://www.uniprot.org/uniprot/P03305.txt находится одна из записей банка UniprotKB. Занесите в протокол ответы на следующие вопросы:

    1. Из какого организма взят белок, последовательность которого описана?
    2. Что это за белок?
    3. Каковы идентификатор и номер доступа записи?
    4. Каковы номера доступа записей банка EMBL, в которых описана последовательность гена этого белка?
    5. Каким (зрелым) белкам принадлежат остатки 500, 1000, 2000 этой последовательности?
    6. Последовательность какого зрелого белка слегка варьируется у разных изолятов данного штамма?
    7. В какой публикации описана структура генома? Открыт ли к ней бесплатный доступ? Скопируйте в протокол аннотацию статьи.
  6. Просмотрите содержание записей Uniprot, упомянутых в презентации (P00174, P37869, P27358). Если в результате этого просмотра вы поняли что-то новое об Uniprot, опишите это в протоколе.
  7. Выучите наизусть первые четыре столбца таблицы аминокислот (остальные столбцы тоже невредно выучить).

Указания и подсказки

  1. Разумеется, если всё пройдёт нормально, отчёт об установке программ вносить в протокол не надо :). Впрочем, если будут какие-то неожиданности, можно о них написать. То же касается заданий 6 и 7.

  2. (c и d) Класс данных и раздел EMBL указаны в первой строке документа. См. списки классов и разделов в описании банка EMBL: ftp://ftp.ebi.ac.uk/pub/databases/embl/doc/usrman.txt , глава 3. (f) Координаты генов, в том числе генов тРНК, ищите в поле FT.

  3. Описание формата Fasta см. в презентации или в Википедии: https://en.wikipedia.org/wiki/FASTA_format . Описание (description) последовательности не обязательно, но желательно; название (identifier) последовательности в данном случае не нужно делить на поля, но оно должно быть достаточно информативным. Если для редактирования файлов используете Word или что-то подобное, то следите за тем, чтобы сохранить файл в текстовом формате. Расширение файла (часть имени файла после точки) должно быть “fasta” (например, файл можно называть leutrna.fasta, но нельзя leutrna.txt или leutrna.fasta.txt). Если редактор упорно добавляет расширение txt, переименуйте файл после сохранения.

  4. В поле FT смотрите информацию о закодированных белках и находите нужные данные.
  5. (d) поле DR. (e) поле FT, ключ CHAIN. (f) поле FT, ключи VARIANT и CHAIN. (g) поля, начинающиеся с "R", далее PubMed.