Программа BLAST.

1. Из практикума 7 был взят белок DsbD, далее в окно "Enter query sequence" был введен AC:Q9XDB2. Остальные параметры при заупске BLAST можно увидеть ниже.

Параметры 1 Параметры 2

Текстовая выдача программы доступна по ссылке:

Выдача выравнивания.

При выборе находок(всего их - 54) и скачивания их в формате .fasta, все они доступны ниже:

Fasta Tatumella citrea.

Fasta Citrobacter koseri ATCC BAA-895.

Fasta Escherichia coli K-12.

Fasta Salmonella enterica subsp. enterica serovar Paratyphi A str. ATCC 9150.

Fasta Salmonella enterica subsp. enterica serovar Typhi.

Fasta Cronobacter sakazakii ATCC BAA-894.

Fasta Salmonella enterica subsp. enterica serovar Typhimurium str. LT2.

Далее эти последовательности были подгружены в Jalview и было выполнено множественное выравнивание, доступное по ссылке ниже(по второй ссылке выравнивание с удалёнными последовательностями):

Multiple alignment DsbD.

Multiple alignment DsbD edited.

По резульатам выравнивания мне показалось что наиболее родственне были все кроме моей tatumella citrea и Cronobacter (которого в отредактированном выраванивании я удалила позже). Но в принципе все 7 белков кажутся близкородственными, так как у них много участков консервативности и мало гэпов. Но по второй ссылке вы можете найти множественное выравнивание без Cronobacter, так как у него больше инделей чем у остальных последовательностей на всем протяжении.

2. В даном задании с помощью SwissProt был выбран полипротеин по запросу (taxonomy_id:10239) AND (protein_name:polyprotein) всего Reviewed было 1200. Был выбран полипротеин P33455, ID:GP_SEOU8, AC:P33455, OS:Seoul virus (strain 80-39)(с помощью команды ниже).

entret sw:GP_SEOU8 -filter |grep '^OS'

Координаты белков в полипротеине искались по команде:

entret sw:GP_SEOU8 -filter |grep '^FT'|grep 'CHAIN'> protein.txt

Просметреть их можно тут:

Координаты белков в полипротеине.

Белок был вырезан с помощью команды:

descseq 'sw:GP_SEOU8[18:646]' -outseq pep2.fasta

Чтобы увидеть его, кликните:

Последовательность белка 18-646 в полипротеине Envelopment polyprotein.

Выдача в прграмме BLAST: Выдача BLAST Envelopment polyprotein.

Находки: Fasta Seoul virus 80-39., Fasta Seoul virus SR11.,

Fasta Hantaan virus B-1, Fasta Seoul virus R22,

Fasta Dobrava-Belgrade orthohantavirus, Fasta Hantaan virus 76-118,

Fasta Hantaan virus Lee.

Со всеми этими находками и нашим вырезанным зрелым белком (GP_SEOU8 P33455 (Glycoprotein N {ECO:0000250|UniProtKB:P08668})) было произведено множественное выравнивание. Буквы до и после нашего зрелого белка были удалены:

GP Multiple alignment

Все белки имеют довольно высокую степень идентичности, что говорит об их гомологии.

3. При исследование показателя E-value от объема банка в BLAST был применён фильтр по организмам (Viruses). Выдача стала выглядеть так: Выдача BLAST(по Viruses). Изменились значения E-value для последних 4 белков: для Puumala virus strain berkel: 2*10^(-122)/4*10^(-121) = 1/20=0,05; для Puumala virus udmurtia/894cg/91:5*10^(-95)/10^(-93)=1\20=0,05; для Hazara virus (isolate JC280): 10^(-5)/3*10^(-4)=1/30=0,033; для Crimean-Congo hemorrhagic fever virus strain IbAr10200: 3*10^(-4)/0,008=0,0375. Таким образом получили значения - доли вирусных белков в SwissProt.