Пакет BLAST

Третий семестр На главную
Банк EMBL Пакет BLAST Поиск сходных нуклеотидных последовательностей

Были созданы индексные файлы для vc_genome.fasta, pa_genome.fasta, pm_genome.fastа, с помощью команды такого типа:
formatdb -i pa_genome.fasta -p F -n pa.
Далее для получения выравниваний были использованы команды такого типа:
blsatall -p tblastn -d pa -i ampC.fasta -o result1.txt.
Результаты выравнивания:
Поиск гомологов ampC_Ecoli Геном Pasteurella multocida Геном Pseudomonas aeruginosa Геном Vibrio cholerae
Характеристика лучшей находки:      
     E-value находки 1,4 5*10-86 2.5
  координаты выравнивания(-ий)
в записи генома
3880-4002 5527-6606 11764-11567
AC соответствующей записи EMBL AE006202 AE004827 AE004315
  Координаты CDS в записи EMBL (если они есть) 3124..4128   complement(2897..5113)
  AC UniProt в записи EMBL (если есть) Q9CKG7   Q9S3S3
Число находок с Е-value<0,01
0 4 0
Изменение E-value лучшей находки
7.6 9*10-86 7.6

Можно с достаточной точностью сказать, что среди Pseudomonas aeruginosa был найден потенциальный гомолог, т.к. E-Value оказалось очень низким (5*10-86).

После поиска по трем геномам было выявлено следующее изменение:
E-Value всех находок (в том числе и Pseudomonas aeruginosa) увеличилось.
Это может быть связано с примерно троекратным увеличением базы данных, по которой и рассчитывается E-value.7

Поиск гомологов с помощью программы BLASTN

Чтобы получить выравнивания, была выполнена команда
blastall -p blastn -d 3g -i ampCgen.fasta -o result24.txt.

Лучшее выравнивание:
>embl|AE004827|AE004827 Pseudomonas aeruginosa PAO1, section 388 of
            529 of the complete genome.
          Length = 11609

 Score = 36.2 bits (18), Expect = 0.18
 Identities = 18/18 (100%)
 Strand = Plus / Plus
                              
Query: 847  cagggcctgggctgggaa 864
            ||||||||||||||||||
Sbjct: 6322 cagggcctgggctgggaa 6339


E-value лучшей находки равно 0.18. Лучшей находкой стала нуклеотидная последовательность из организма Pseudomonas aeruginosa PAO1, section 388 of 529 of the complete genome.
Такое E-Value имеет слишком большое значение, чтобы точно утверждать, что исследуемая последовательность и находка являются гомологами. Кроме того, длина выравнивания небольшая.
©Виктор Соколов