Указания к заданию 2
Чтобы найти в Swiss-Prot белки с мнемоникой функции "aaa", нужно написать в строке поиска mnemonic:aaa_* (звёздочка, как всегда, заменяет собой любое количество любых букв. в данном случае – мнемонику вида). Чтобы затем ограничить список только требуемым таксоном, нажмите "Advanced search", выберите Field "Taxonomy [OC]" и укажите нужный таксон. При поиске по DE нужно писать name:function (где "function" – слово, которое должно встретиться в поле DE) или сразу воспользоваться Advanced Search.
Напоминаю, что чтобы получить запись в формате Swiss-Prot, нужно на странице записи нажать жёлтую кнопку "text".
Формат запуска программы needle:
needle file1.fasta file2.fasta outfile.needle -auto
В этом случае последовательности из файлов file1.fasta и file2.fasta будут выровнены со значениями параметров по умолчанию.
Если опустить -auto, то программа спросит вас о параметрах. Если опустить имя выходного файла, то программа его спросит. Если набрать просто needle, то вас спросят обо всём, начиная с входных последовательностей.
Если, наоборот, хотите задать параметры в командной строке, можно написать, например:
needle file1.fasta file2.fasta outfile.needle -gapopen 15. -gapextend 3.5
Входные последовательности могут быть в любом распознаваемом формате (fasta, swiss, embl, genbank, plain, ...). Если в файле несколько последовательностей, будет взята первая.
Формат запуска water точно такой же.
Программа shuffleseq:
shuffleseq sequence.fasta shuffled.fasta
выдаёт последовательность, полученную случайным перемешиванием букв входной последовательности.