Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2024

Подсказки и рекомендации к практикуму № 8

Задания практикума здесь

1. К заданию 1

  1. Искать δ-субъединицу АТФ-синтазы имеет смысл по ключевой фразе, например, ATP synthase subunit delta, или сделать запрос короче (ATP synthase), но пройтись по всем вариантам на случай, если белок называется как-то немного иначе (например, если это аннотация GenBank, т.е. того кто белок клал в базу данных, то он мог вполне иначе назвать тот же белок: Delta subunit of the ATP synthase, или даже Subunit delta of the ATP-synthase.

  2. Для поиска идентификатора нуклеотидной записи, в которой аннотирован белок, нужно открыть файл с последовательностями генома с аннотацией (GBFF) и найти в нем данный белок по идентификатору, а потом воспользоваться поиском строчки LOCUS (в режиме чувствительности к регистру / "case sensitive") в обратном направлении от места, где найден идентификатор белка (т.е. это будет поиск не "вниз" по файлу, а "вверх").

  3. Получить последовательность ДНК нужного гена можно так: откройте соответствующую нуклеотидную запись в NCBI Nucleotide, перейдите в режим геномного браузера – нажмите на ссылку Graphics в верхней части записи, в поле Find введите идентификатор белка. Вы должны увидеть последовательность гена белка с небольшой окрестностью до и после. Сохраните последовательность гена с окрестностью: это можно сделать через кнопку Download – Download FASTA – FASTA (Visible Range). Можно пользоваться и любыми другими (правильными) способами :)

  4. Последовательности можно приводить в виде ссылки на файл, а можно вставить в виде текста, только обратите внимание на шрифт – последовательности принято записывать моноширинным шрифтом, таким как Courier New.

2. К заданию 2

3. К заданию 3

4. К заданию 4

Геномы можно искать несколькими способами:

Возможно, придётся перебрать несколько пар. Варианты для геномов (хромосом) такие: разные штаммы одного вида, разные виды одного рода. Из разных родов вряд ли найдётся хорошая пара, хотя бывают исключения.

Карту локального сходства нужно построить посредством BLAST 2 sequences на сайте NCBI. Для этого на странице нуклеотидного BLAST нужно отметить галочку "Align two or more sequences", после чего появится второе окошко. В оба окошка можно вводить Accession записей GenBank, ENA (они точно такие же, как в GenBank) или RefSeq. Сама карта — по ссылке DotPlot на странице с результатом. Чтобы скачать графический файл с картой, щёлкните по изображению правой кнопкой мыши; другой вариант — воспользоваться приложением "Ножницы".

Не возбраняется менять "Advanced" параметры: порог на e-value, у BLASTN также длину слова (c 11 на 7) и Match/mismatch (в некоторых случаях имеет смысл поставить 1/–1). Если меняете, обязательно указывайте это в комментариях.

Чтобы воспользоваться программой TBLASTX, нужно сначала открыть страницу запроса другого варианта BLAST (например, BLASTN), а затем найти вверху малозаметную серую кнопочку переключения на TBLASTX.

2024/3/hints8 (последним исправлял пользователь sas 2025-10-21 07:17:29)