Поиск гомологов белка F1YXH4 в Swiss-Prot:

Использованные параметры при запуске BLAST:

Enter accession number(s), gi(s), or FASTA sequence(s): Файл с последовательностью

Database: UniProtKB/Swiss-Prot(swissprot)

Algorithm: blastp (protein-protein BLAST)

Max target sequences: 100

Short queries: yes

Expect threshold: 0.05

Word size: 5

Max matches in a query range: 0

Matrix: BLOSUM62

Gap Costs: Existence: 11 Extension:1

Compositional adjustments: Conditional compositional score matrix adjustment

Filters and Masking: no

Текстовая выдача программы: 0YTZDNSJ016-Alignment.txt

Былo выбраны 7 находок (AC): Q8CWX8; P51835; P75362; O32861; P57137; Q6MTB9; Q726P7

Множественное выравнивание в Jalview

После выравнивания можно заметить участки с высокой контервативностью (237-250, 313-332, 339-361, 401-421, 433-450, 462-482). Это говорит о том, что все белки гомологичны, но, видимо, разошлись в ходе эволюции, тк в начале довольно большое количество гэпов и не консерватиных участков.

Гомологи вирусного белка

Использованные параметры при запуске BLAST:

Enter accession number(s), gi(s), or FASTA sequence(s): Файл с последовательностью CHAIN

Для анализа я выбрала белок вируса Гепатита С (OS: Hepatitis C virus (isolate HCT18) (HCV)).

ID: POLG_HCVH8

AC: P27956.

Название ключа СHAIN: Core protein precursor

OB

Координаты в полипротеине: 1-75

Вырезанный CHAIN

Текстовая выдача программы: 0ZPD353C013-Alignment.txt

Было выбрано 7 находок (AC): P27956 - исходный зрелый белок; P27957; Q913D4; Q81754; P26664; P27955; O39928

Множественное выравнивание в Jaclview

Исходя из результатов выравнивания можно сказать, что все последовательности гомологинчны, так как наблюдается большое количество высококонсервативных участков, содержащих мнегочисленные идентичные участки (133-141, 163-172 и тд). Однако последовательность белка O39928 немного отличается от других, что может свидетельствовать о том, что этот белок в большей степени разошелся с другими и является менее родственным для них.

Исследование зависимости E-value от объёма банка

При добавлении таксона Viruses количество находок не изменилось (как было 43, так и осталось).

Но значения E-value изменились.

Для оценки доли вирусных белков в Swiss-Prot я выбрала находку Q913D4.

По формуле E-value=mn·2–B, где m - длина исходной последовательности; n - размер базы данных; B - вес в битах, выражаем nвир и nобщ.

Получаем nвир/общ = E-valueвир/общ/(m·2–Bвир/общ). Делим nвир на nобщ, получаем выражение:

nвир/nобщ=(E-valueвир·2–Bобщ)/(E-valueобщ·2–Bвир)=(9·10−45·2-151)/(2·10−43·2-151)=0,045.

Таким образом, доля вирусных белков составляет всего 4,5% от общего кол-ва белков в Swiss-Prot.