Учебный сайт Григория Сафронова

Практикум №9. EMBOSS

Упражнения

1. (seqret) Объединение нескольких файлов в один в формате fasta.
Команда (sw - swissprot): seqret sw:g* g1.fasta
Полученный файл
2. (seqretsplit) Разделение одного файла, содержащего несколько последовательностей, на несколько разных.
Входной файл
Команда: seqretsplit g2.fasta ff.fasta
4. (transeq) Трансляция кодирующих последовательностей, лежащих в одном fasta файле.
Входной файл
Команда: transeq g3-1.fasta g3-2.fasta
Полученный файл
5. (transeq) Трансляция одной нуклеотидной последовательноти в 6 рамках.
Входной файл (одна последовательность)
Команда: transeq g4-1.fasta g4-2.fasta -frame 6
Полученный файл (6 последовательностей)
6. (seqret) Перевод формата выравнивания из fasta в msf.
Входной файл
Команда: seqret g5.fasta msf::g5_1.msf
Полученный файл

Сравните аннотации генов белков в одной хромосоме бактерии с трансляциями длинных открытых рамок считывания

Для выполнения задания была выбрана одна хромосома бактерии Magnetospirillum magneticum: последовательность хромосомы в формате GenBank


1. Получение списка трансляций открытых рамок с помощью команды getorf

2. Получение списка аннотированных генов белков

3. Сравнение двух таблиц.

Объединенная таблица

Рис.1 Пример открытой рамки и гена, последовательности который сдвинуты на 3 нуклеотида

Рис.2 Рамка 31953 полностью находится внутри рамки 13.

Рис.3 Антипараллельные перекрывающиеся рамки.

©Сафронов Григорий