Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2012

Первое занятие третьего блока

Отчёты по упражнениям должны быть к следующему занятию выставлены на веб-страницы, на которые должны вести надлежащим образом оформленные гиперссылки со страницы третьего семестра

Выучите к следующему занятию ambiguity codes, будет мини-контрольная.

Полезные ссылки: SRS

1. Знакомство со структурой банка RefSeq посредством поисковой системы SRS

a. Через SRS выведите список хромосом дрожжей Saccharomyces cerevisiae. Вставьте его в отчёт как преформатированный текст.

Указание: на странице "Select Databanks" отметьте чекбокс "RefSeq_DNA (release)" и нажмите "Standard Query Form". Затем введите нужные значения полей Organism Name (название организма) и Molecule (DNA). Не нужно копировать таблицу непосредственно со страницы с результатом SRS. Сначала поставьте галочки только против тех строк, которые отвечают хромосомам, затем нажмите Save и ещё раз Save. Полученный текст уже можно вставлять в HTML-файл, обрамив тегами <PRE>...</PRE>.

b. Для заданной хромосомы запишите ее длину, количество генов и тРНК в ней. Номер заданной хромосомы равен 1 + остаток от деления на 16 вашего порядкового номера в списке.

Указание: пройдите по соответствующей гиперссылке на странице с результатом поиска.

c. Приведите примеры четырёх генов на заданной хромосоме, а именно:

– гена, который находится на прямой цепи и не имеет интронов;

– гена, который находится на обратной цепи и не имеет интронов;

– гена, который находится на прямой цепи и имеет хотя бы один интрон;

– гена, который находится на обратной цепи и имеет хотя бы один интрон.

Для каждого гена приведите его название (gene=) и координаты соответствующей CDS в записи.

Указание: нажмите Text Entry, чтобы увидеть полный текст записи RefSeq.

2. Получение последовательности, кодирующей заданный белок

В таблице найдите против своей фамилии идентификаторы белка в UniProt. Определите AC записи EMBL, в которой описан ген этого белка.

Указание: на kodomo выполните команду entret sw:xxxxx, где xxxxx – AC вашего белка в Swiss-Prot. В полученном файле найдите строку, начинающуюся с "DR   EMBL", сразу после "EMBL" идёт AC записи EMBL.

Вырежьте участок, кодирующий ваш белок, в отдельный файл с подходящим названием. Указание: сначала определите границы кодирующего участка ("CDS"). Для этого нужно сначала получить файл с полной записью EMBL. Это можно сделать через SRS или командой entret embl:xxxxxx. Когда выясните границы и направление, воспользуйтесь командой seqret с опцией -sask.

Сам файл с последовательностью гена нужно скопировать в директорию H:\term3\block3\credits. Промежуточные файлы – в директории practice11. Все необходимые сведения (AC записи EMBL, координаты гена, как всё это получено и т.п.) кратко изложите в отчёте на сайте.

3*. Выравнивание белков и их генов

Для своего белка и какого-нибудь его гомолога создайте: а) выравнивание последовательностей белков программой needle; б) выравнивание последовательностей их генов программой needle; в) выравнивание последовательностей их генов программой tranalign. Сравните результаты.

4*. Поиск в нуклеотидном банке NCBI по имени гена

Возьмите какое-нибудь имя гена из упр. 1 или 2 и поищите его в нуклеотидном банке NCBI. Опишите свои ощущения.