Blast
Гомологи своего белка из практикума 8
Документ с результатом поиска: документ
Ниже представлена информация о том, какие параметры использовались при поиске:
- Database: UniProtKB/Swiss-Prot(swissprot)
- Organism: нет ограничений
- Algorithm: blastp (protein-protein BLAST)
- Max target sequences: 50
- Expect threshold: 10
- Word size: 6
- Matrix: BLOSUM62
- Gap Costs: Existence 11 Extension 1
Для выравнивания были взяты 6 последовательностей, которые имеют наименьшее значение E-value, но отличный от нуля, и достаточно высокий процент идентичности (должен быть более 25%).
По итогам выраванивания можно говорить о гомологичности белков, так как последовательности имеют участки гомологичности, хоть они и короткие, зато их достаточно, много, что может говорить о локальных заменах в процессе эволюции.
Файл с проектом: файл
Гомологи вирусного белка
Ниже предоставлена информация о белке взятого для исследования из UniProt:
- Protein name: RNA1 polyprotein
- Organism: Cowpea mosaic virus (strain SB) (CPMV)
- ID: POL1_CPMVS
- AC: P03600
- Chosen protein: Protease cofactor
- Coordinates: 2..326
Файл с вырезанной последовательностью: файл
Документ с результатом поиска: документ
Для выравнивания были взяты все найденные последовательности. Также стоит отметить то, что при поиске было выдано всего 4 последовательности, поэтому была взята и та последовательность, что имеет E-value равный нулю.
По итогам выравнивания видно, что данные последовательности имеют достаточно много консервативных участков, что говорит о том, что данная последовательность особо не менялась с ходом эволюции. Поэтому про гомологичность этих белков можно говорить не только основываясь на E-value и проценте идентичности.
Файл с проектом: файл
Исследование зависимости E-value от объёма банка
Документ с результатом поиска: документ
Повторив поиск из предыдущего пункта с ограничением по вирусами (Viruses), мы увидим, что список находок изменился с 4 до 5, также изменились значения E-value — увеличились примерно на 1 порядок. Значение E-value зависит от размера базы данных линейно, поэтому мы можем примерно оценить долю вирусных белков в Swissprot, а именно мы получим значение 3e-64/7e-63=0.0428
Примерная доля вирусных белков в базе Swiss-prot составляет 0.0428 (4.28%).