include ("../../inc/apss.inc"); ?>
Дана аминокислотная последовательность белка. Задача — определить, закодированы ли похожие белки
в геноме другого организма (Pasteurella multocida), не пользуясь аннотацией генома. Необходимо было определить AC записи нынешнего релиза EMBL по последовательности старого AE006206.
Им оказался участок, являющийся частью аннотированной кодирующей последовательности AC - AE004439.
Ген clpB. CDS - 1910791..1913358. Различия в результатах, вероятно, связаны с вырожденностью генетического кода.
blastn работает непосредственно с нуклеотидной последовательностью, в отличии от tblastn.
Если в последовательности были единичные мутации типа замены нуклеотида, то это могло
отразиться на выравнивании при помощи blastn, а tblastn – нет.
Программы пакета BLAST для работы с нуклеотидными последовательностями
Поиск в геноме бактерии Pasteurella multocida участков, кодирующих белки, похожие на
CLPB_ECOLI из Escherichia coli K-12.
Число находок с Е-value<0,001
2
Характеристика лучшей находки:
E-value находки
0.0
Название геномной последовательности
AE006206
Координаты выравнивания(-ий) в найденной последовательности
Query:1-857
Sbjct:9541-12105Нахождение записи EMBL по последовательности с помощью программы BLASTN
UniProtKB/Swiss-Prot:Q9CKC0
Нахождение записи EMBL по последовательности с помощью программы BLASTN
Таблица 2. Результаты поиска гомологов белка CLPB_ECOLI в геноме Pasteurella multocida
при помощи программы BLASTN
E-value находки
3e-41
Название геномной последовательности
AE006206
Координаты выравнивания в найденной последовательности
Query:1349-2052
Sbjct:10763-10060
Таблица 3. Сравнение результатов,
полученных при помощи TBLASTN и BLASTN
tblastn
blastn
Score
1274
167
Expect
0.0
3e-41
Identities
73%
77%
Positives
83%
-