Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2018

Практикум 11. Алгоритмы выравнивания. Подсказки

По заданию 1. Сравните выравнивания последовательностей гомологичных белков и негомологичных белков

infoseq 'sw:*_human' -only -name -length -out human.txt

Файл human.txt выглядит так

Name           Length 
AMPL_HUMAN     519    
ARP5L_HUMAN    153    
CT55_HUMAN     264    
..................

  • Не выбирайте мнемоники функций, начинающиеся на букву Y — это как правило белки с неизвестной функцией и скорее всего даже при совпадении мнемоник белки из разных организмов не будут гомологичны.

  • Не выбирайте мнемонику ENO – она использована в образце в таблице.

entret sw:eno_bacsu stdout -auto | grep ^DE

Там ищите слова "RecName: Full=", название белка — после знака равенства. Например, если вы видите в поле DE строку:
DE   RecName: Full=GSX1 {ECO:0000303|PubMed:7768864};
то пишите в качестве названия белка "GSX1".

Имейте в виду, что у выходного файла тоже есть имя по умолчанию, но как раз его лучше задать явно. Например, если ваша пара — ENO_ECOLI и ENO_BACSU, то можно использовать строку вида

needle sw:eno_ecoli sw:eno_bacsu eno.needle -auto

выравнивание появится в файле с именем eno.needle.

По заданию 2.1. Построить множественное выравнивание 5 - 7 гомологичных белков

infoseq 'sw:eno_*' -only -name -length -out eno.txt

Создайте списочный файл (скажем, eno.txt) со строками:

sw:eno_bacsu
sw:eno_ecoli
sw:eno_myctu
sw:eno_haein

Создайте файл в fasta-формате:

seqret @eno.txt eno.fasta

muscle -in eno.fasta -out eno_alignment.fasta

Предупреждение. muscle не из ENBOSS. В EMBOSS'е для множественного выравнивания есть программа emma, основанная на старом алгоритме ClustalW

ENO_BACSU or ENO_ECOLI or ENO_MYCTU or ENO_HAEIN
и запустите поиск. Отметьте галочками все правильные находки и нажмите кнопку Align. Когда появится выравнивание, нажмите кнопку Download (сразу над словом "Alignment"). Выберите формат FASTA, отметьте Uncompressed и сохраните файл.

По заданию 2.2. Сравнение выравниваний

последовательности из окна в нужный файл

muscle -profile -in1 eno1-aln.fasta -in2 eno2-aln.fasta -out eno1-2.fasta

и далее

muscle -profile -in1 eno1-2.fasta -in2 eno3-aln.fasta -out eno1-2-3.fasta

Далее файл eno1-2-3.fasta открыть в Jalview. Но как с ним обходиться в Jalview, сделать три группы (selection > make group) а потом раскрасить отдельные группы, а не все выравнивание ... Сегодня уже не напишу... ААл