|
|||||
|
|||||
Онлайн BLAST Программа BLAST (Basic Local Alignment Search Tool) на сайте NCBI служит для поиска последовательностей белков или нуклеиновых кислот, сходных с входной последовательностью. Существует несколько видов этой программы. Одна из которых рассматривалась BLASTP ранее, создана для поиска последовательностей белков гомологичных входной последовательности. Другой вид — BLASTN. И эта программа ищет нуклеиновые последовательности, сходные с входной. Также есть другие виды: BLASTX, TBLASTN, TBLASTX. Программа BLAST реализованна в двух формах: онлайн программа и локальная программа. Программа BLASTNВ данной работе будет рассмотрена онлайн форма программы BLASTN (работу с локальной программой ищи далее). Данная программа предоставляет следующие возможности: 1. Поиск организма по фрагменту нуклиотидной последовательностиИмея последовательность из неивестного организма, с помощью вышеуказанной программы, можно установить этот организм. Например, был осуществлен поиск с помощью программы BLASTN данной последовательности длинной 300 нк. Поиск проводился со следующими параметрами:
В результате поиска мы установили, что рассматриваемая последовательность взята из генома археи вида Methanocella paludicola (АС записи RefSeq NC_013665.1). А также, что рассматриваемый фрагмент расположен с 1145 по 1444 нуклеотид в геноме археи. Далее мы определели, что этот фрагмент является частью гена cdc6-1 (см. рис.1), координаты которого — 599-1900. Данный ген кодирует гомолог белка, контролирующий деление клетки.
Рис.1. Исследуемый фрагмент и ген cdc6-1 из генома Thermoanaerobacter pseudethanolicus ATCC 33223. Область изображенная на рисунке — от 764 до 2794 нуклеотида. Рисунок получен с помощью геномного браузера на сайте NCBI 2. Поиск гомологов последовательности и поиск некодирующих последовательностейПрограмма BLASTN предоставляет возможность найти гомологов входной нуклеотидной последовательности. Из генома уже много раз рассматриваемой ранее бактерии Thermoanaerobacter pseudethanolicus ATCC 33223 была выбрана последовательность какой-то тРНК, а именно сериновой тРНК, координаты которой 32953..33042. Для выбора тРНК использовался FTP-сервер NCBI, оттуда был скачен файл с раширением .frn, где уже храняться вырезанные тРНК бактерии. Из этого файла по традиции была выбрана первая же последовательность тРНК. Далее был проведен поиск гомологов данной последовательности по всем бактериям, относящимся к тому же порядку, что и бактерия Thermoanaerobacter pseudethanolicus, а именно к порядку Thermoanaerobacterales. Поиск был проведиен тремя разными вариантами:
Заметим, что, применяя алгоритм megablast, находится меньше гомологичных последовательностей, чем при использовании алгоритма blastn. Из чего можно сделать вывод, что алгоритм megablast является более строгим, чем blastn. При запуске алгоритма blastn с более чувствительными параметрами привело, как и ожидалось, к нахождению большего количества гомологов. Но стоит обратить внимание, что количество находок при использование алгоритма blastn с разными степенями чувствительности с E-value<0.001 сохраняется практически одинаковым, из чего можно сделать вывод, что увеличение чувствительности параметров приводит к увеличению недостоверных последовательностей. Поиск гомолога белка человека в слонеПомимо работы с программой BLASTN, была проведена работа по поиску гомологов белка с помощью сайта ENA (это также можно осуществить с помощью программы BLASTP). Для начала был выбран такой белок человека, для которого идентификатор в Swiss-Prot и моя фамилия начинаются
с максимального количесва одинаковы букв. Для этого была введена следующая команда EMBOSS: Далее был получен файл kapcb_human.fasta
с последовательностью выбранного белка , используя команду: Затем был проведен непосредственно поиск гомологов выбранного белка в геноме африканского слона. Для это были установлены следующие параметры поиска:
В результате поиска было найдено 82 гомолога. Подробнее была рассмотрена лучшая находка:
|
|||||
© Alyona Koryagina aakor@fbb.msu.ru
Дата последнего изменения: 12.11.2014 |