Varyaaas
  • Главная
  • Обо мне
  • Семестры
    • 1 семестр (I курс)
    • 2 семестр (I курс)
    • 3 семестр (II курс)
  • ФББ МГУ

Практикум 10. Программа BLAST

Задание 1

Параметры поиска:

Choose Search Set: databases - Standard databases (nr etc.); Compare - галочку не ставлю

Standard: Database - UniProtKB/Swiss-Prot; organism и Exclude - пустые, галочку не ставлю

Algorithm: blastp (protein-protein BLAST)

General Parameters: Max target sequences - 100; Short queries - ставлю галочку; Expect threshold - 0.05; Word size - 6; Max matches in a query range - 0

Scoring Parameters: Matrix - BLOSUM62; Gap Costs - Existence: 11 Extension: 1; Compositional adjustments - conditional compositional score matrix adjustment

Filters and Masking: Filter - ставлю галку; Mask - не ставлю галочки

Файл с текстовой выдачей

Просмотрев выравнивание, я решила оставить все белки, так у них всех есть несколько консервативных участков, хотя судить о гомологии белков точно нельзя.

Скачать выравнивание можно ссылке.

Задание 2

Выбранный вирус: Hepatitis C virus genotype 2c (isolate BEBE1) (HCV)

ID: POLG_HCVBB AC: Q68749

Выбранный белок: Serine protease/helicase NS3 1031..1661

Последовательность белка в fasta-формате

В результате поиска было обнаружено 36 последовательностей, из которых я выбрала 7 (Q68749.3, P26660.3, Q00269.3, P26662.3, Q68798.3, P26664.3, Q913D4.3)

Проект множественного выравнивания зрелого белка

Задание 3

После поиска с фильтром было найдено такое же количество белков (36), я думаю, что это связано с тем, что белок Serine protease/helicase встречается только у вирусов. Значение E-value изменилось для белка Pea seed-borne mosaic virus (strain DPD1) с 6e-04 на 3e-05, то есть уменьшилось в 20 раз. Изменение E-value отображает, что доля вирусных белков в Swissprot - 5%.