1. Из практикума 7 был взят белок DsbD, далее в окно "Enter query sequence" был введен AC:Q9XDB2. Остальные параметры при заупске BLAST можно увидеть ниже.
Текстовая выдача программы доступна по ссылке:
При выборе находок(всего их - 54) и скачивания их в формате .fasta, все они доступны ниже:
Fasta Citrobacter koseri ATCC BAA-895.
Fasta Salmonella enterica subsp. enterica serovar Paratyphi A str. ATCC 9150.
Fasta Salmonella enterica subsp. enterica serovar Typhi.
Fasta Cronobacter sakazakii ATCC BAA-894.
Fasta Salmonella enterica subsp. enterica serovar Typhimurium str. LT2.
Далее эти последовательности были подгружены в Jalview и было выполнено множественное выравнивание, доступное по ссылке ниже(по второй ссылке выравнивание с удалёнными последовательностями):
Multiple alignment DsbD edited.
По резульатам выравнивания мне показалось что наиболее родственне были все кроме моей tatumella citrea и Cronobacter (которого в отредактированном выраванивании я удалила позже). Но в принципе все 7 белков кажутся близкородственными, так как у них много участков консервативности и мало гэпов. Но по второй ссылке вы можете найти множественное выравнивание без Cronobacter, так как у него больше инделей чем у остальных последовательностей на всем протяжении.
2. В даном задании с помощью SwissProt был выбран полипротеин по запросу (taxonomy_id:10239) AND (protein_name:polyprotein) всего Reviewed было 1200. Был выбран полипротеин P33455, ID:GP_SEOU8, AC:P33455, OS:Seoul virus (strain 80-39)(с помощью команды ниже).
entret sw:GP_SEOU8 -filter |grep '^OS'
Координаты белков в полипротеине искались по команде:
entret sw:GP_SEOU8 -filter |grep '^FT'|grep 'CHAIN'> protein.txt
Просметреть их можно тут:
Координаты белков в полипротеине.
Белок был вырезан с помощью команды:
descseq 'sw:GP_SEOU8[18:646]' -outseq pep2.fasta
Чтобы увидеть его, кликните:
Последовательность белка 18-646 в полипротеине Envelopment polyprotein.
Выдача в прграмме BLAST: Выдача BLAST Envelopment polyprotein.
Находки: Fasta Seoul virus 80-39., Fasta Seoul virus SR11.,
Fasta Hantaan virus B-1, Fasta Seoul virus R22,
Fasta Dobrava-Belgrade orthohantavirus, Fasta Hantaan virus 76-118,
Со всеми этими находками и нашим вырезанным зрелым белком (GP_SEOU8 P33455 (Glycoprotein N {ECO:0000250|UniProtKB:P08668})) было произведено множественное выравнивание. Буквы до и после нашего зрелого белка были удалены:
Все белки имеют довольно высокую степень идентичности, что говорит об их гомологии.
3. При исследование показателя E-value от объема банка в BLAST был применён фильтр по организмам (Viruses). Выдача стала выглядеть так: Выдача BLAST(по Viruses). Изменились значения E-value для последних 4 белков: для Puumala virus strain berkel: 2*10^(-122)/4*10^(-121) = 1/20=0,05; для Puumala virus udmurtia/894cg/91:5*10^(-95)/10^(-93)=1\20=0,05; для Hazara virus (isolate JC280): 10^(-5)/3*10^(-4)=1/30=0,033; для Crimean-Congo hemorrhagic fever virus strain IbAr10200: 3*10^(-4)/0,008=0,0375. Таким образом получили значения - доли вирусных белков в SwissProt.