Практикум 10. Программа BLAST

1. Нахождение в Swissprot гомологов белка

При запуске BLAST были заданы следующие параметры:

  • AC:CAJ51144.1
  • Databases: Standard databases
  • Database: UniProtKB/Swiss-Prot (swissprot)
  • Algorithm: blastp (protein-protein BLAST)
  • Max target sequences: 100
  • Short queries: Automatically adjust parameters for short input sequences
  • Expect threshold: 0.05
  • Word size: 6
  • Max matches in a query range: 0
  • Matrix: BLOSUM62
  • Gap Costs: Existence:11 Extension: 1
  • Compositional adjustments: Conditional compositional score matrix adjustment
  • Filter:Low complexity regions
  • Mask:off

Всего по результатам запроса было 36 белков в выдаче.

Для множественного выравнивания были выбраны белки:

  1. Q5V0R5.1 Haloarcula marismortui ATCC 43049
  2. P29563.1 Halobacterium sp. AUS-2
  3. P69051.1 Halorubrum chaoviator
  4. P96787.1 Halorubrum sodomense
  5. P02945.2 Halobacterium salinarum NRC-1

Множественное выравнивание проводилось в программе Jalview алгоритмом muscle. Выравнивание показывает высокое сходство последовательностей, так как оно имеет очень много консервативных участков,гэпы находятся только в начале и конце, поэтому можно сделать вывод о том, что белки выранивания являются гомолагами, что подтверждается крайне низкими значениями E-value.

2. Нахождение в Swissprot гомологов зрелого вирусного белка, вырезанного из полипротеина

В качестве полипротеина был выбран геномный полипротеин вируса свекловичной мозаики:

  • ID: POLG_BTMV
  • AC: Q6XW15
  • OS: Beet mosaic virus (BtMV)

Среди 10 белков, на которые разрезается зрелый полипротеин был выбран капсидный белок (Capsid protein), имеющий координаты 2810-3085.

Для капсидного белка был выполнен поиск гомологов с теми же параметрами, что и в первом задании, без указания организма. Всего по результатам запроса было найдено 49 последовательностей (результат поиска).

Для множественного выравнивания были выбраны:

  1. P20235.1 Watermelon mosaic virus 2 (isolate Australia)
  2. P32576.1 Passionfruit woodiness virus (strain tip bright)
  3. P32575.1 Passionfruit woodiness virus (strain severe)
  4. Q89251.3 Watermelon mosaic virus 2 (isolate Tonga)
  5. P11897.1 Potato virus Y strain YO

В множественном выравниваним 6 белков, включая исходный белок,видна негомологичность белка P32576.1, так как в нем очень мало консервативных позиций, в отличие от остальных белков, в которых имеются очень крупные консервативные участки. Поэтому было выполнено еще одно выравнивание без негомологичного белка. У получившегося выравнивания хорошо видна высокая схожесть последовательностей, так как показано много высококонсервативных участков.

3. Исследование зависимости E-value от объёма банка

При повторении запроса из предыдущего задания с теми же параметрами, но с ограничением поиска по вирусами, список содержал такое же количество находок, но значение E-value у белка Q6XW15.1 понизилось с 4e-174 до 2e-175, то есть в 20 раз, значит, доля вирусных белков в Swissprot 5%.