EMBOSS: пакет программ для анализа последовательностей.
1. Упражнения:
Упражнение 1. Файлы в формате fasta собраны в единый файл.
Input: scaffold-10.fasta, scaffold-11.fasta, scaffold-12.fasta, scaffold-13.fasta, scaffold-14.fasta, scaffold-15.fasta, scaffold-16.fasta, scaffold-17.fasta, scaffold-18.fasta, scaffold-19.fasta.
Output: comb.fasta
Упражнение 2. Один файл в формате fasta с несколькими последовательностями разделен на отдельные fasta файлы.
Input: comb.fasta
Output: scaffold-10.fasta, scaffold-11.fasta, scaffold-12.fasta, scaffold-13.fasta, scaffold-14.fasta, scaffold-15.fasta, scaffold-16.fasta, scaffold-17.fasta, scaffold-18.fasta, scaffold-19.fasta.
Упражнение 3. Транслирована последовательность.
Input: scaffold-11.fasta.
Output: prot.fasta
Упражнение 4. Последовательность транслирована в 6 рамках.
Input: scaffold-11.fasta.
Output: 6fr.fasta
Упражнение 5. Выравнивание переведено в формат msf.
Input: align.fasta.
Output: align.msf
2a. Карта локального сходства и крупные эволюционные события для архей Vulcanisaeta distributa и Vulcanisaeta moutnovskia:
Характеристики полученного выравнивания:
- E-value: 0.
- Identity: 81%.
- Query cover: 81%.
- Total score: 1.855e+06.
Рисунок 1. Карта локального сходства исследуемых последовательностей.
1. Инверсия в одном из геномов.
2. Транслокация в одном из геномов.
3. Делеция или вставка в одном из геномов.
4. Разрыв посередине скорее всего связан с тем, что у данных архей ДНК кольцевые.
Все остальные случаи можно объяснить, как один из приведенных примеров. Таким образом, можно заключить, что геномы достаточно гомологичны.