8 (926) 907 94 08 Здесь должен быть мальчик с мензуркой!
Всё на свете является чудом!

               

      Программа B L A S T

BLAST (англ. Basic Local Alignment Search Tool) — семейство компьютерных программ, служащих для поиска гомологов белков или нуклеиновых кислот, для которых известна первичная структура (последовательность) или её фрагмент. Используя BLAST, исследователь может сравнить имеющуюся у него последовательность с последовательностями из базы данных и найти последовательности предполагаемых гомологов. Является важнейшим инструментом для молекулярных биологов, биоинформатиков, систематиков.

Для выполнения упражнений воспользуемся web-интерфейсом к программе BLASTP на сервере NCBI. Заходим на страницу с программой BLASTP, после чего в разделе "Basic BLAST" переходим по гиперссылке "protein blast".

basic_blast

Программа BLASTP относится к белковой группе программ серии BLAST, предназначенной для сравнения изучаемой аминокислотной последовательности белка с имеющейся базой данных белков и их участков.

Конкретно BLASTP позволяет найти все сходные последовательности (
подробнее о программе BLAST).

1. Поиск гипотетических гомологов белка THIS_BACSU в разных банках

- заходим на веб-страницу, где реализована программа BLASTP, и в поле "Enter Query Sequence" вписываем код доступа - AC O31617 - белка THIS_BACSU

- затем проводим поиск гомологов в банках
Swiss-Prot, PDB (Protein Data Bank proteins) и nr (Non-redundant protein sequences) - для этого изменяем значение параметра "database"

- закончив поиски, заполняем таблицу

 

Поиск по Swiss-Prot

Поиск по PDB

Поиск по "nr"

1. Лучшая находка (соответствует с заданным для поиска белком)

Accession

O31617.1

1 TYG_B

1 TYG_B

E-value

1,00E-40

4,00E-42

2,00E-39

Вес (в битах)

133 bits

134 bits

134 bits

Процент идентичности

100%

100%

100%

2. Сколько хороших кандидатов в гомологи найдено? (число находок в списке описаний с E-value < 1e-10)

0

0

32

3. "Худшая из удовлетворительных" находка (последняя в выдаче с E-value < 1)

Номер находки в списке описаний

8

2

644

Accession

Q2RRL3.2

1 RYJ_A

ZP_05551609.1

E-value

0,74

0,1

0,99

Вес (в битах)

30.4 bits

28.1 bits

32.7 bits

% идентичности

46%

27%

37%

% сходства

65%

55%

61%

Длина выравнивания

289

70

68

Координаты выравнивания (от-до, в запросе и в находке)

В запросе: 41-66

В запросе: 65-66

В запросе: 56-66

В находке: 1-26

В находке: 69-70

В находке: 54-64

Число гэпов

0

4

12


- исходный белок THIS_BACSU удалось найти в Swiss-Prot и nr, а в банке PDB нашли структуру белка

- при поиске явных гомологов (E-value < 1e-10) в базе данных Swiss-Prot их должно быть меньше, чем в nr, но больше, чем в PDB. Это обусловлено тем, что банки сильно отличаются числом имеющихся последовательностей. В банке nr более 17 млн последовательностей, а у Swiss-Prot и PDB около 450000 и 57000 соответственно. Увы, в нашем случае мы вообще не нашли явных гомологов, ни в Swissprot, ни в nr.


- всего находок мы получаем: 26-Swiss_Prot, 8-PDB, 734-nr. Для Swiss-Prot и PDB мы ограничиваем количество находок значением E-value (выбрав значение 100, число находок оказывается меньше, чем 100), а для банка nr лимитирующим фактором является предельный размер выдачи, который мы повысили до 1000, и тем самым смогли узнать конечное число находок.

2. Поиск гипотетических гомологов белка THIS_BACSU с фильтром по таксонам

Необходимо найти лучшего гомолога белка THIS_BACSU в организмах таксона, филогенетически как можно более далекого.

Таксономия «Bacillus subtilis» и «Bacillus anthracis»

Bacteria

царство

Eukaryota

Firmicutes

отдел

Actinobacteria

Bacilli

класс

Clostridia

Bacillales

порядок

Lactobacillales

Bacillaceae

семейство

Listeriaceae

Bacillus

род

Geobacillus

Bacillus subtilis

вид

Bacillus anthracis


- для поиска гомолога белка THIS_BACSU в банке Swiss-Prot вводим название таксона в окошко "Organism"

- проверяем на наличие гипотетического гомолога (критерий: E-value < 0,001) в порядке приближения к "Bacillus subtilis"

- во время первого же поиска в царстве Eukaryota натыкаемся на интересующий нас гомолог


Интересующая информация

Результат поиска по Swiss-Prot

Номер находки в списке описаний

1

Accession

P49535.5

E-value

1e-07

Вес (в битах)

39.3 bits

Процент идентичности

30%

Процент сходства

59%

Длина выравнивания

73

Координаты выравнивания

В запросе: 64-66
В находке:
71-73

Число гэпов

1


3. Сравнение выравниваний, выданных программой BLASTP, с оптимальными глобальным и локальным выравниваниями

1) Для сравнения воспользуемся выравниванием последовательностей белков THIS_BACSU (AC O31617) и YCF40_ODOSI (AC P49535), которое было получено с помощью программы BLASTP при выполнении предыдущего задания.
>sp|P49535.1|YCF40_ODOSI  RecName: Full=Uncharacterized protein ycf40
Length=73

GENE ID: 801820 ycf40 | ORF73 [Odontella sinensis]

Score = 39.3 bits (90),  Expect = 1e-07, Method: Compositional matrix adjust.
Identities = 19/63 (30%), Positives = 37/63 (59%), Gaps = 1/63 (2%)

Query  4   LNGKDVKWKKDTGTIQDLLASYQLENKIVIVERNKEIIGKERYHEVELCDRDVIEIVHFV  63
           +NG++  +  +T  + DLL  +   + ++++E N  I  K+ + ++ + + D IEIV  V
Sbjct  12  INGQEY-YTTNTINLHDLLNYFDFNSSLLVLEYNNFICNKKNWEKIMISNNDKIEIVTIV  70

Query  64  GGG  66
           GGG
Sbjct  71  GGG  73
Параметры, использованные в программе BLASTP, применяем и для оптимальных полного и частичного выравниваний.
# Matrix: EBLOSUM62     -> матрица весов замен
# Gap_penalty: 11.0     -> штраф за открытие гэпа
# Extend_penalty: 1.0   -> штраф за удлинение гэпа

2) С
помощью программы
needle из пакета EMBOSS, построим полное выравнивание для тех же белков THIS_BACSU и YCF40_ODOSI.  Для этого написали команду (needle sw:O31617 sw:P49535 O31617_P49535.needle -gapopen 11 -gapextend 1)
THIS_BACSU   1 --------MLQLNGKDVKWKKDTGTIQDLLASYQLENKIVIVERNKEIIG 42
                       ...:||::. :..:|..:.|||..:...:.::::|.|..|..
YCF40_ODOSI  1 MTKISTAKTFFINGQEY-YTTNTINLHDLLNYFDFNSSLLVLEYNNFICN 49

THIS_BACSU  43 KERYHEVELCDRDVIEIVHFVGGG 66
               |:.:.::.:.:.|.||||..||||
YCF40_ODOSI 50 KKNWEKIMISNNDKIEIVTIVGGG 73

3) Теперь при помощи программы
water из пакета EMBOSS, строим частичное выравнивание этих белков. Для этого написали команду (water sw:O31617 sw:P49535 O31717_P49535.water -gapopen 11 -gapextend 1)

THIS_BACSU   4 LNGKDVKWKKDTGTIQDLLASYQLENKIVIVERNKEIIGKERYHEVELCD 53
               :||::. :..:|..:.|||..:...:.::::|.|..|..|:.:.::.:.:
YCF40_ODOSI 12 INGQEY-YTTNTINLHDLLNYFDFNSSLLVLEYNNFICNKKNWEKIMISN 60

THIS_BACSU  54 RDVIEIVHFVGGG 66
               .|.||||..||||
YCF40_ODOSI 61 NDKIEIVTIVGGG 73

Получив все три выравнивания, сравним их по определённым параметрам

С р а в н и в а е м ы й

п а р а м е т р

BLASTP

needle

water

Длина выравнивания

64

74

64

Вес выравнивания

90

88

92

Процент идентичности

30 %

25,7 %

30,2 %

Процент сходства

59 %

50 %

58,7 %

Число гэпов

1

9

1

Координаты выравнивания

В запросе: 4-66

В находке: 12-73

В запросе: 1-66

В находке: 1-73

В запросе: 4-66

В находке: 12-73


Мерой совпадения двух выравниваний является процент согласованных колонок 1-ого выравнивания относительно общего числа колонок (аналогично и для 2-ого выравнивания).

При расчетах ограничиваемся участками: в запросе 4-66, в находке 12-73.

Рассчитаем меру совпадения локального выравнивания, полученного программой BLASTP, c оптимальными глобальным и частичным выравниваниями:


 

BLASTP -||- needle

BLASTP -||- water

Число согласованных колонок

64

64

Общее число колонок

64

64

64

64

Мера совпадения

100%

100%


Выбранный фрагмент оптимального глобального выравнивания составляет 86,5% от общей длины этого глобального выравнивания. А выравнивание, построенное с помощью программы BLASTP, и оптимальное частичное выравнивание абсолютно одинаковые.

1*. Дополнение страницы писание программ" (раздел "пакет EMBOSS")

В разделе "EMBOSS" практикума "Описание программ" добавили описания недавно используемых программ:

- seqret


-- matcher

--- stretcher

---- needle

----- water


2*. Поиск с другими параметрами программы BLAST

3*. Гомология находки с E-value>1

4*. Дополнительные интерфейсы к программе BLAST

Главная
Об авторе
Учебные семестры
Проекты автора
Друзья
Ссылки партнеров
Extra
Контакты


Главная Об авторе Учебные семестры Проекты автора Друзья Ссылки партнеров Extra Контакты

Mneff © 2011-2012