Программа BLAST

Гомологи белка 2-hyoxy-6-oxo-6-phenylhexa-2,4-dienoate hyolase

Таблица 1. Параметры поиска при запуске BLAST
Параметры поискаЗначение
DatabaseUniProtKB/Swiss-Prot(swissprot)
Organismнет ограничений
Algorithmblastp (protein-protein BLAST)
Max target sequences50
Expect threshold10
Word size6
MatrixBLOSUM62
Gap CostsExistence 11 Extension 1

Текстовый документ с результатами поиска:

здесь


Выравнивание

Для выравнивания были выбраны следующие белки: 2-hydroxy-6-oxo-6-phenylhexa-2,4-dienoate hydrolase [Burkholderiaceae], 2-hydroxy-6-oxo-6-phenylhexa-2,4-dienoate hydrolase [Pseudomonas], 2-hydroxy-6-oxo-6-phenylhexa-2,4-dienoate hydrolase [Pseudomonas toyotomiensis], 2-hydroxy-6-oxo-6-phenylhexa-2,4-dienoic acid hydrolase [Achromobacter sp. BP3], 2-hydroxy-6-oxo-6-phenylhexa-2,4-dienoate hydrolase [Malikia spinosa], 2-hydroxy-6-oxo-6-phenylhexa-2,4-dienoate hydrolase [Hydrogenophaga], 2-hydroxy-6-oxo-6-phenylhexa-2,4-dienoate hydrolase [Pseudomonas stutzeri].

Все организмы являются грамм-отрицательными, аэробными, почвенными бактериями, использующие в своем метаболизме углеводороды. 2-hydroxy-6-oxo-6-phenylhexa-2,4-dienoate hydrolase гидролтзует С-С связи, обеспечивая метаболизм бензольных соединений. Это все объясняет гомологичность последовательностей исследуемых белков. Выравнивания имеют большой процент схожести. Во всех последовательностях совпадают участки с 24-56, 63-101, 128-149, 151-166, 250-278 и еще некоторые участки. Моя бактерия Burkholderia xenovorans LB400, Achromobacter sp., Malikia spinosa, Hydrogenophaga входят в порядок Burkholderiales, который родственнен порядку Pseudomonadales - подтвержается при сравнении выравнивааний. При этом ближе всего к последовательностям бактерий рода Pseudomonas последовательность Achromobacter sp. BP3, а на мой белок из прктикума 8 больше всего похожа последовательноть Malikia spinosa.

Ссылка на проект Jalview:

Protein alignment

Гомологи вирусного белка

Таблица 2. Характеристики вирусного белка

Protein NameIDACНазвание вируса
mRNA-capping enzyme nsP1POLN_SINDVP03317Sindbis virus (SINV)

Для дальнейших действий был выбран зрелый белок — mRNA-capping enzyme nsP1, с координатами: 1..540

Ссылка на последовательность в формате fasta:

здесь

Таблица 3. Параметры поиска при запуске BLAST

Параметры поискаЗначение
DatabaseUniProtKB/Swiss-Prot(swissprot)
Organismнет ограничений
Algorithmblastp (protein-protein BLAST)
Max target sequences100
Expect threshold10
Word size3
MatrixBLOSUM62
Gap CostsExistence 11 Extension 1

Текстовый документ с результатами поиска:

здесь

Для выравнивания были выбран белок Polyprotein P1234 следующих вирусов: Sindbis virus, Ockelbo virus, Aura virus, Getah virus, Sagiyama virus

Последовательности данных белков хорошо покрасились по идентичности на участках, например, участки 32-49, 261-300,358-371.Выравнивания были обрезаны по номерам а.к. на которые выровнялись крайние буквы исходного белка. Идентичность выше 20%, поэтому данные белки можно считать гомологичными.

Ссылка на проект Jalview:

Protein alignment

Исследование зависимости E-value от объёма банка

Повторив поиск из предыдущего пункта с ограничением по вирусами (Viruses), мы увидим, что список находок уменьшился со 90 до 87, также изменились значения E-value — увеличились примерно на 1-2 порядка. Значение E-value зависит от размера базы данных линейно, поэтому мы можем примерно оценить долю вирусных белков в Swissprot: по находке белка Q8JJX1 [Salmon pancreas disease virus] 3е-132/8e-131=0,0375

Примерная доля вирусных белков в базе Swiss-prot составляет 0,0375 (3,75%).

Текстовый документ с результатами поиска:

здесь