Blast

Гомологи своего белка из практикума 8

Документ с результатом поиска: документ

Ниже представлена информация о том, какие параметры использовались при поиске:

Для выравнивания были взяты 6 последовательностей, которые имеют наименьшее значение E-value, но отличный от нуля, и достаточно высокий процент идентичности (должен быть более 25%).

По итогам выраванивания можно говорить о гомологичности белков, так как последовательности имеют участки гомологичности, хоть они и короткие, зато их достаточно, много, что может говорить о локальных заменах в процессе эволюции.

Файл с проектом: файл

Гомологи вирусного белка

Ниже предоставлена информация о белке взятого для исследования из UniProt:

Файл с вырезанной последовательностью: файл

Документ с результатом поиска: документ

Для выравнивания были взяты все найденные последовательности. Также стоит отметить то, что при поиске было выдано всего 4 последовательности, поэтому была взята и та последовательность, что имеет E-value равный нулю.

По итогам выравнивания видно, что данные последовательности имеют достаточно много консервативных участков, что говорит о том, что данная последовательность особо не менялась с ходом эволюции. Поэтому про гомологичность этих белков можно говорить не только основываясь на E-value и проценте идентичности.

Файл с проектом: файл

Исследование зависимости E-value от объёма банка

Документ с результатом поиска: документ

Повторив поиск из предыдущего пункта с ограничением по вирусами (Viruses), мы увидим, что список находок изменился с 4 до 5, также изменились значения E-value — увеличились примерно на 1 порядок. Значение E-value зависит от размера базы данных линейно, поэтому мы можем примерно оценить долю вирусных белков в Swissprot, а именно мы получим значение 3e-64/7e-63=0.0428

Примерная доля вирусных белков в базе Swiss-prot составляет 0.0428 (4.28%).