Практикум 10. Программа BLAST
Задание 1
Параметры поиска:
Choose Search Set: databases - Standard databases (nr etc.); Compare - галочку не ставлю
Standard: Database - UniProtKB/Swiss-Prot; organism и Exclude - пустые, галочку не ставлю
Algorithm: blastp (protein-protein BLAST)
General Parameters: Max target sequences - 100; Short queries - ставлю галочку; Expect threshold - 0.05; Word size - 6; Max matches in a query range - 0
Scoring Parameters: Matrix - BLOSUM62; Gap Costs - Existence: 11 Extension: 1; Compositional adjustments - conditional compositional score matrix adjustment
Filters and Masking: Filter - ставлю галку; Mask - не ставлю галочки
Файл с текстовой выдачей
Просмотрев выравнивание, я решила оставить все белки, так у них всех есть несколько консервативных участков, хотя судить о гомологии белков точно нельзя.
Скачать выравнивание можно ссылке.
Задание 2
Выбранный вирус: Hepatitis C virus genotype 2c (isolate BEBE1) (HCV)
ID: POLG_HCVBB AC: Q68749
Выбранный белок: Serine protease/helicase NS3 1031..1661
Последовательность белка в fasta-формате
В результате поиска было обнаружено 36 последовательностей, из которых я выбрала 7 (Q68749.3, P26660.3, Q00269.3, P26662.3, Q68798.3, P26664.3, Q913D4.3)
Проект множественного выравнивания зрелого белка
Задание 3
После поиска с фильтром было найдено такое же количество белков (36), я думаю, что это связано с тем, что белок Serine protease/helicase встречается только у вирусов. Значение E-value изменилось для белка Pea seed-borne mosaic virus (strain DPD1) с 6e-04 на 3e-05, то есть уменьшилось в 20 раз. Изменение E-value отображает, что доля вирусных белков в Swissprot - 5%.