BLAST


Поиск гипотетических гомологов изучаемого белка в разных банках


Параметры Поиск по Swiss-Prot Поиск по PDB Поиск по "nr"

1. Лучшая находка (в принципе должна соответствовать заданному белку)

Accession P96579 1NSL NP_388302
E-value 2e-133 2e-131 6e-132
Вес (в битах) 378 370 378
Процент идентичности 100 99 100

2. Сколько хороших кандидатов в гомологи найдено? (число находок в списке описаний с E-value < 1e-10)

5 7 1287

3. "Худшая из удовлетворительных" находка (последняя в выдаче с E-value < 1)

Номер находки в списке описаний 16 23 8848
Accession Q7VG78 2ZW4 ZP_09143647
E-value 0.66 0.082 0.99
Вес (в битах) 33.9 33.1 37.4
% идентичности 25 27 33
% сходства 43 45 58
Длина выравнивания 113 97 55
Координаты выравнивания (от-до, в запросе и в находке) запрос: 76-183
находка: 380-490
запрос: 75-170
находка: 77-170
запрос: 95-149
находка: 99-153
Число гэпов 7 4 0


Изучаемый белок нашёлся в SwissProt и nr, но не нашёлся в pdb (нет последовательности со 100%-ной идентичностью).

Наибольшее число возможных гомологов найдено в nr (так как индексирует несколько банков данных). Гораздо меньше в SwissProt и PDB.

При задании очень большого предельного размера выдачи (10000 и более в случае nr) получены следующие результаты:
sw
: 35 находки, E-value последней=10.0
pdb: 34 находки, E-value последней=9.6
nr: 9980 находок, E-value последней=10.0


Поиск гипотетических гомологов изучаемого белка с фильтром по таксонам


Повторим поиск гомологов с фильтром по организму, использую банк данных SwissProt. Для этого в разделе "Choose Search Set" в поле "Organism" введём наименование требуемого таксона.
Для начала введём Eukaryota (taxid:2759). В верхнеё строчке получим один из неохарактеризованных белков у Saccharomyces cerevisiae S288c.
 
Номер находки в списке описаний/td> 1
Accession P40586.1
E-value 1e-09
Вес (в битах) 48.5
% идентичности 29
% сходства 47
Длина выравнивания 102
ККоординаты выравнивания (от-до, в запросе и в находке) 79-179, 101-202
Число гэпов 1


Сравнение выравниваний, выданных программой BLASTP, с оптимальными глобальным и локальным выравниваниями.

Выравнивание белков YDAF_BACSU и YIW2_YEAST с помощью программы BLAST:
>sp|P40586.1|YIW2_YEAST  RecName: Full=Uncharacterized protein YIR042C
Length=236

 GENE ID: 854860 YIR042C | hypothetical protein [Saccharomyces cerevisiae S288c]
(10 or fewer PubMed links)

 Score = 48.5 bits (114),  Expect = 1e-09, Method: Compositional matrix adjust.
 Identities = 30/102 (29%), Positives = 48/102 (47%), Gaps = 1/102 (1%)

Query  79   CGMISLHNLDQVNRKAEIGYWI-AKEFEGKGIITAACRKLITYAFEELELNRVAICAAVG  137
             G + L  +D+ N   E+GY + + E +   I T A   L+ Y F++L+  R        
Sbjct  101  VGTLCLIRIDEANGSLEVGYVVFSPELQKTIIATEAQFLLMKYVFDDLQYRRYEWKCDSL  160

Query  138  NEKSRAVPERIGFLEEGKARDGLYVNGMHHDLVYYSLLKREW  179
            N  SR    R+GF  EG  R  +   G   D  ++S++ +EW
Sbjct  161  NGPSRRAAMRLGFKYEGTFRQVVVYKGRTRDTQWFSIIDKEW  202


Создадим оптимальное частичное выравнивание прграммой water, используя параметры программы BLAST по умолчанию: матрица BLOSUM62, штраф за открытие гэпа =11, а за расширение =1. Для этого с помощью Putty зайдём в рабочую директорию (см. предыдущее занятие) и введём команду
water sw:P96579 sw:P40586 blast.water -gapopen 11 -gapextend 1
Получим файл blast.water
YDAF_BACSU        15 LEPKDAERLAELIIQNQQRLGK--WLFFAENP-SSADTYRETI-------     54
                     |||.|.||....:.......|:  |.:....| ::.:.|.|.|
YIW2_YEAST        36 LEPLDRERHGSELFSAYSEAGQKLWTYLPAGPFTNLEEYLEFIKELNETK     85

YDAF_BACSU        55 --IPDWRRQYADLNGIEAGLLYDGSLCGMISLHNLDQVNRKAEIGYWI-A    101
                       :|     :|.:|......:  |:||    |..:|:.|...|:||.: :
YIW2_YEAST        86 DTVP-----FAIINKETERAV--GTLC----LIRIDEANGSLEVGYVVFS    124

YDAF_BACSU       102 KEFEGKGIITAACRKLITYAFEELELNRVAICAAVGNEKSRAVPERIGFL    151
                     .|.:...|.|.|...|:.|.|::|:..|........|..||....|:||.
YIW2_YEAST       125 PELQKTIIATEAQFLLMKYVFDDLQYRRYEWKCDSLNGPSRRAAMRLGFK    174

YDAF_BACSU       152 EEGKARDGLYVNGMHHDLVYYSLLKREW    179
                     .||..|..:...|...|..::|::.:||
YIW2_YEAST       175 YEGTFRQVVVYKGRTRDTQWFSIIDKEW    202



Проделаем то же самое для оптимального полного выравнивания с помощью программы needle. Для этого введём команду
needle sw:P96579 sw:P40586 blast.needle -gapopen 11 -gapextend 1 
Получим файл blast.needle
YDAF_BACSU         1 ---------------------MFTCKVNEHITIRLLEPKDAERLAELIIQ     29
                                          .|..||........|||.|.||....:..
YIW2_YEAST         1 MANLNIFGQEVGADVEGWTTRAFPEKVVLKGNTCRLEPLDRERHGSELFS     50

YDAF_BACSU        30 NQQRLGK--WLFFAENP-SSADTYRETI---------IPDWRRQYADLNG     67
                     .....|:  |.:....| ::.:.|.|.|         :|     :|.:|.
YIW2_YEAST        51 AYSEAGQKLWTYLPAGPFTNLEEYLEFIKELNETKDTVP-----FAIINK     95

YDAF_BACSU        68 IEAGLLYDGSLCGMISLHNLDQVNRKAEIGYWI-AKEFEGKGIITAACRK    116
                     .....:  |:||    |..:|:.|...|:||.: :.|.:...|.|.|...
YIW2_YEAST        96 ETERAV--GTLC----LIRIDEANGSLEVGYVVFSPELQKTIIATEAQFL    139

YDAF_BACSU       117 LITYAFEELELNRVAICAAVGNEKSRAVPERIGFLEEGKARDGLYVNGMH    166
                     |:.|.|::|:..|........|..||....|:||..||..|..:...|..
YIW2_YEAST       140 LMKYVFDDLQYRRYEWKCDSLNGPSRRAAMRLGFKYEGTFRQVVVYKGRT    189

YDAF_BACSU       167 HDLVYYSLLKREWEGEK------------------------------    183
                     .|..::|::.:||...:
YIW2_YEAST       190 RDTQWFSIIDKEWLRIRKTFEEWLDKTNFENGKQKRGIAAIRESLSN    236


Параметры Одно из выравниваний BLASTp Оптимальное частичное выравнивание Оптимальное полное выравнивание
Значения Score 114 120 106
Длины выравниваний 102 178 247
Проценты совпадения 29 26,4 20,2
Проценты сходства 47 42,1 32
Сравнения выравниваний с выравниванием BLASTp -
  1. В целом выравнивания сходны,но:
  2. В частичном выравнивании дополнительно выравниваются начальные участки (15-78 последовательности белка YDAF_BACSU и 36-100 последовательности белка YIW2_YEAST)
  3. Участок 80-83 последовательности белка YDAF_BACSU соответствует гэпам в последовательности белка YIW2_YEAST (В выравнивании BLAST этот участок соответствует участку 102-105 в последовательности белка YIW2_YEAST)
Выравнивания также сходны, но дополнительные начальные участки полного выравнивания гораздо длиннее (1-78 и 1-100)