1Гомологи белка
Исследуемый белок - бифункциональный фермент GlmU из организма Desulfotalea Psychrophila.
Параметры при запуске BLAST
Enter accession number(s), gi(s), or FASTA sequence(s): Q6AMF9
Database: UniProtKB/Swiss-Prot(swissprot)
Algorithm: blastp (protein-protein BLAST)
Max target sequences: 1000
Expect threshold: 0.05
Word size: 5
Max matches in a query range: 0
Matrix: BLOSSUM62
Gap Costs: Existence: 11 Extension: 1
Compositional adjustments: Conditional compositional score matrix adjustment
Filters and Masking: no
Результат работы программы
Для дальнейшего анализа были отобраны следующие белки:
Q2RMC5.1 (Moorella thermoacetica)
A5GDL4.1 (Geotalea uraniireducens)
C0ZHD4.1 (Brevibacillus brevis)
Q04C57.1 (Lactobacillus delbrueckii subsp. bulgaricus)
Q39ZH2.1 (Geobacter metallireducens)
Ссылка на выравнивание
Можно сказать, что отобранные белки являются гомологами, так как выравнивание показало наличие консервативных участков по всей длине, небольшое количество гэпов, за исключением одного участка, где у шести из семи белков наблюдается по 17 гэпов, что произошло из-за того, что у белка Q39ZH2.1 есть участок, отсутствующий у других рассматриваемых белков.
2Гомологи зрелого вирусного белка, вырезанного из полипротеина
Выбранный вирус:
ID: ENV_MLVRK
AC: P31794
Название вируса: Radiation murine leukemia virus (strain Kaplan)
Выбранный в поле FT CHAIN :
Название: Transmembrane protein
Положение в полипротеине: 468..644
Последовательность белка
Параметры при запуске программы
Enter accession number(s), gi(s), or FASTA sequence(s): последовательность белка
Database: UniProtKB/Swiss-Prot(swissprot)
Algorithm: blastp (protein-protein BLAST)
Max target sequences: 1000
Expect threshold: 0.05
Word size: 2
Max matches in a query range: 0
Matrix: BLOSSUM62
Gap Costs: Existence: 11 Extension: 1
Compositional adjustments: Conditional compositional score matrix adjustment
Filters and Masking: no
Количество находок: 80
Результат работы программы
Для дальнейшего анализа были отобраны следующие белки:
P08360.1 (Cas-Br-E murine leukemia virus)
P04502.1 (Kirsten murine leukemia virus (KiMSV))
P03387.1 (FBJ murine osteosarcoma virus (FBJ-MSV) (Finkel-Biskis-Jinkins murine osteosarcoma virus))
P26803.1 (Friend murine leukemia virus (isolate PVC-211) (FrMLV))
P08359.1 (Feline leukemia virus (strain A/Glasgow-1))
Ссылка на выравнивание
По результатам выравнивания видно, что белки гомологичны, так как их последовательности совпадают практически полностью.
3Исследование зависимости E-value от объёма банка
Параметры при запуске программы
Enter accession number(s), gi(s), or FASTA sequence(s): последовательность белка
Database: UniProtKB/Swiss-Prot(swissprot)
Organism: Viruses (taxid:10239)
Algorithm: blastp (protein-protein BLAST)
Max target sequences: 1000
Expect threshold: 0.05
Word size: 2
Max matches in a query range: 0
Matrix: BLOSSUM62
Gap Costs: Existence: 11 Extension: 1
Compositional adjustments: Conditional compositional score matrix adjustment
Filters and Masking: no
Количество находок: 67 (уменьшился по сравнению с предыдущим поиском, когда фильтр по организмам не был применен)
Результат работы программы
Для оценки доли вирусных белков был выбран белок P03390.3. При поиске по полной базе Swiss‑Prot её E‑value составило 4·10⁻⁹⁴, тогда как при поиске только по вирусной части базы E‑value равно 2·10⁻⁹⁵. Отношение этих значений (E_full/E_virus) приблизительно равно 20, то есть при переходе от вирусной подбазы к полной базе значимость выравнивания уменьшается примерно в 20 раз. Поскольку при фиксированном запросе E‑value примерно пропорционально размеру базы данных, обратное отношение E_virus/E_full ≈ 1/20 ≈ 0,05 даёт оценку доли вирусных белков в Swiss‑Prot около 5 % записей.