Учебная страница курса биоинформатики,
год поступления 2012
Первое занятие третьего блока
Отчёты по упражнениям должны быть к следующему занятию выставлены на веб-страницы, на которые должны вести надлежащим образом оформленные гиперссылки со страницы третьего семестра
Выучите к следующему занятию ambiguity codes, будет мини-контрольная.
Полезные ссылки: SRS
1. Знакомство со структурой банка RefSeq посредством поисковой системы SRS
a. Через SRS выведите список хромосом дрожжей Saccharomyces cerevisiae. Вставьте его в отчёт как преформатированный текст.
Указание: на странице "Select Databanks" отметьте чекбокс "RefSeq_DNA (release)" и нажмите "Standard Query Form". Затем введите нужные значения полей Organism Name (название организма) и Molecule (DNA). Не нужно копировать таблицу непосредственно со страницы с результатом SRS. Сначала поставьте галочки только против тех строк, которые отвечают хромосомам, затем нажмите Save и ещё раз Save. Полученный текст уже можно вставлять в HTML-файл, обрамив тегами <PRE>...</PRE>.
b. Для заданной хромосомы запишите ее длину, количество генов и тРНК в ней. Номер заданной хромосомы равен 1 + остаток от деления на 16 вашего порядкового номера в списке.
Указание: пройдите по соответствующей гиперссылке на странице с результатом поиска.
c. Приведите примеры четырёх генов на заданной хромосоме, а именно:
– гена, который находится на прямой цепи и не имеет интронов;
– гена, который находится на обратной цепи и не имеет интронов;
– гена, который находится на прямой цепи и имеет хотя бы один интрон;
– гена, который находится на обратной цепи и имеет хотя бы один интрон.
Для каждого гена приведите его название (gene=) и координаты соответствующей CDS в записи.
Указание: нажмите Text Entry, чтобы увидеть полный текст записи RefSeq.
2. Получение последовательности, кодирующей заданный белок
В таблице найдите против своей фамилии идентификаторы белка в UniProt. Определите AC записи EMBL, в которой описан ген этого белка.
Указание: на kodomo выполните команду entret sw:xxxxx, где xxxxx – AC вашего белка в Swiss-Prot. В полученном файле найдите строку, начинающуюся с "DR EMBL", сразу после "EMBL" идёт AC записи EMBL.
Вырежьте участок, кодирующий ваш белок, в отдельный файл с подходящим названием. Указание: сначала определите границы кодирующего участка ("CDS"). Для этого нужно сначала получить файл с полной записью EMBL. Это можно сделать через SRS или командой entret embl:xxxxxx. Когда выясните границы и направление, воспользуйтесь командой seqret с опцией -sask.
Сам файл с последовательностью гена нужно скопировать в директорию H:\term3\block3\credits. Промежуточные файлы – в директории practice11. Все необходимые сведения (AC записи EMBL, координаты гена, как всё это получено и т.п.) кратко изложите в отчёте на сайте.
3*. Выравнивание белков и их генов
Для своего белка и какого-нибудь его гомолога создайте: а) выравнивание последовательностей белков программой needle; б) выравнивание последовательностей их генов программой needle; в) выравнивание последовательностей их генов программой tranalign. Сравните результаты.
4*. Поиск в нуклеотидном банке NCBI по имени гена
Возьмите какое-нибудь имя гена из упр. 1 или 2 и поищите его в нуклеотидном банке NCBI. Опишите свои ощущения.