Enter accession number(s), gi(s), or FASTA sequence(s): Файл с последовательностью
Database: UniProtKB/Swiss-Prot(swissprot)
Algorithm: blastp (protein-protein BLAST)
Max target sequences: 100
Short queries: yes
Expect threshold: 0.05
Word size: 5
Max matches in a query range: 0
Matrix: BLOSUM62
Gap Costs: Existence: 11 Extension:1
Compositional adjustments: Conditional compositional score matrix adjustment
Filters and Masking: no
Текстовая выдача программы: 0YTZDNSJ016-Alignment.txt
Былo выбраны 7 находок (AC): Q8CWX8; P51835; P75362; O32861; P57137; Q6MTB9; Q726P7
Множественное выравнивание в Jalview
После выравнивания можно заметить участки с высокой контервативностью (237-250, 313-332, 339-361, 401-421, 433-450, 462-482). Это говорит о том, что все белки гомологичны, но, видимо, разошлись в ходе эволюции, тк в начале довольно большое количество гэпов и не консерватиных участков.
Enter accession number(s), gi(s), or FASTA sequence(s): Файл с последовательностью CHAIN
Для анализа я выбрала белок вируса Гепатита С (OS: Hepatitis C virus (isolate HCT18) (HCV)).
ID: POLG_HCVH8
AC: P27956.
Название ключа СHAIN: Core protein precursor
OBКоординаты в полипротеине: 1-75
Текстовая выдача программы: 0ZPD353C013-Alignment.txt
Было выбрано 7 находок (AC): P27956 - исходный зрелый белок; P27957; Q913D4; Q81754; P26664; P27955; O39928
Множественное выравнивание в Jaclview
Исходя из результатов выравнивания можно сказать, что все последовательности гомологинчны, так как наблюдается большое количество высококонсервативных участков, содержащих мнегочисленные идентичные участки (133-141, 163-172 и тд). Однако последовательность белка O39928 немного отличается от других, что может свидетельствовать о том, что этот белок в большей степени разошелся с другими и является менее родственным для них.
При добавлении таксона Viruses количество находок не изменилось (как было 43, так и осталось).
Но значения E-value изменились.
Для оценки доли вирусных белков в Swiss-Prot я выбрала находку Q913D4.
По формуле E-value=mn·2–B, где m - длина исходной последовательности; n - размер базы данных; B - вес в битах, выражаем nвир и nобщ.
Получаем nвир/общ = E-valueвир/общ/(m·2–Bвир/общ). Делим nвир на nобщ, получаем выражение:
nвир/nобщ=(E-valueвир·2–Bобщ)/(E-valueобщ·2–Bвир)=(9·10−45·2-151)/(2·10−43·2-151)=0,045.
Таким образом, доля вирусных белков составляет всего 4,5% от общего кол-ва белков в Swiss-Prot.