Практикум №9. EMBOSS
Упражнения
1. (seqret) Объединение нескольких файлов в один в формате fasta.
Команда (sw - swissprot): seqret sw:g* g1.fasta
Полученный файл
2. (seqretsplit) Разделение одного файла, содержащего несколько
последовательностей, на несколько разных.
Входной файл
Команда: seqretsplit g2.fasta ff.fasta
4. (transeq) Трансляция кодирующих последовательностей, лежащих
в одном fasta файле.
Входной файл
Команда: transeq g3-1.fasta g3-2.fasta
Полученный файл
5. (transeq) Трансляция одной нуклеотидной последовательноти в 6 рамках.
Входной файл (одна последовательность)
Команда: transeq g4-1.fasta g4-2.fasta -frame 6
Полученный файл (6 последовательностей)
6. (seqret) Перевод формата выравнивания из fasta в msf.
Входной файл
Команда: seqret g5.fasta msf::g5_1.msf
Полученный файл
Сравните аннотации генов белков в одной хромосоме бактерии с трансляциями длинных открытых рамок считывания
Для выполнения задания была выбрана одна хромосома бактерии Magnetospirillum magneticum: последовательность хромосомы в формате GenBank
1. Получение списка трансляций открытых рамок с помощью команды getorf
- Получение трансляций orf.
Команда: getorf -minsize 180 -table 11 -find 1 -circular yes magn.fasta out.fasta
magn.fasta - это последовательность генома бактерии Magnetospirillum magneticum, а out.fasta - результат.
Table - таблица генетического кода для данного генома; minsize - минимальный размер рамки; circular - хромосома кольцевая; find 1 - открытая рамка от стоп-кодона до стоп-кодона. Полученный файл - Получение списка координат и ориентаций найденных открытых рамок.
Команда: infoseq NC_007626.orf -only -name -length -description -outfile NC_out
Полученный файл - Редактирование таблицами средствами Excel
Полученный файл
2. Получение списка аннотированных генов белков
- Файл с последовательностями белков: NC_007626.faa
- Список аннотированных белков: NC_007626.ptt
- Результат: Excel
3. Сравнение двух таблиц.
Объединенная таблица
Рис.1 Пример открытой рамки и гена, последовательности который сдвинуты на 3 нуклеотида

Рис.2 Рамка 31953 полностью находится внутри рамки 13.

Рис.3 Антипараллельные перекрывающиеся рамки.