Главная Семестры Проекты Обо мне

Программы пакета BLAST

1.Поиск в геноме участков, кодирующих белки, похожие на заданный


Для работы взят белок ENGB_BACSU (P38424) из Bacillus subtilis и искали гомологи в геноме Streptococcus agalactiae.

Команда для создания индексных файлов пакета BLAST+:
>makeblastdb -in sa_genome.fasta -out sa -dbtype nucl

Далее воспользуемся программой TBLASTN для поиска гомологов. Для этого выполним команду:
>tblastn -query engb_bacsu.fasta -db sa -out engb_sa.txt -evalue 0.001

Файл engb_sa.txt.

Поиск гомологов белка ENGB_BACSU (P38424) в геноме Streptococcus agalactiae.
Число находок с E-value < 0,001 2
E-value лучшей находки 2e-71
Название последовательности с
лучшей находкой
Streptococcus agalactiae NEM316 complete (AL766850)
Координаты лучшей находки (от-до) 118585 - 119151
Доля последовательности вашего
белка, вошедшая в выравнивание с лучшей находкой
189/195≈0,97



2. Нахождение записи EMBL по последовательности программой BLASTN


Для последовательности, данной мне, нашла, пользуясь интерфейсом к программе BLASTN на сайте EBI:


а) Эта последовательность присутствует в записи AB001031 банка EMBL (класс данных Standard, раздел Prokaryotes);

б) Kоординаты заданной последовательности в записи: 658 - 837;
Заданной последовательность соответствует направлению записи;

в) B поле FT описан участок, включающий данную последовательность.


Участок: 1-1331
Пересекающийся участок: 178-1317
Направление прямое (относительно записи)


3. Поиск гомологов гена программой BLASTN


Создадим в своей рабочей директории fasta-файл с нуклеотидной последовательностью, кодирующей нужный белок.

Понадобится:
1) Запись Swiss-Prot
2) Одна из записей EMBL в записи Swiss-Prot. Возьмем X76424

После при помощи команды seqret U18532.embl -sask вырежем участок с координатами 348 - 2672 по прямой цепи.

Получила нужную fasta - последовательность.

Теперь ищем гомологи этого гена в геноме бактерии Streptococcus agalactiae с помощью программы blastn: blastall -p blastn -d gt -i x.fasta -o btn.txt

Получили текстовый файл btn.txt.

К сожалению, гомологов не найдено. (также посмотрела с помощью программы blastn -query x.fasta -db sa -out bln.txt -evalue 0.001 -task blastn файл bln.txt оказался полностью пустым)
Причина может быть в том, что blastn находит очень короткие участки последовательностей. Сходства между более-менее удаленными друг от друга гомологами эта программа не видит. Также в blastn не учитывается, что разные триплеты могут кодировать одну и ту же аминокислоту. И отличии от tblastn, здесь выравниваются не аминокислотные, а нуклеотидные последовательности.


©Melnichuk Anastasia