В данной работе были проделаны упражнения для освоения программ из пакета EMBOSS, ниже приведён список команд и отчёт по каждому выполненному заданию.
Используемая программа - seqret. Исходные файлы: AAC74885.2.fasta, AAC74886.1.fasta, AAC74887.1.fasta, AAC74888.1.fasta, AAC74889.2.fasta, AAC74890.1.fasta, AAC74891.2.fasta, AAC74892.1.fasta, AAC74893.1.fasta. Команда:
seqret 'AAC*.fasta' join.fasta |
Ссылка на результат: join.fasta
Используемая программа - seqretsplit. Исходные файлы: coding1.fasta. Команда:
seqretsplit coding1.fasta |
Ссылка на результат: aac73113.1_2.fasta, aac73114.1_3.fasta, aac73115.1_4.fasta
Используемая программа - seqret. Была выбрана последовательность полного генома Escherichia coli str. K-12 с идентификатором U00096, и из неё были выбраны три кодирующих участка, координаты которых записаны в следующем файле: mylist. Команда:
seqret @mylist l3.fasta |
Ссылка на результат: l3.fasta
Используемая программа - transeq. Исходные файлы: coding.fasta. Команда:
transeq coding.fasta 1.txt |
Ссылка на результат: pr.txt
Используемая программа - transeq.
Исходные файлы: coding.fasta. Команда:
transeq coding.fasta -frame 6 6.fasta |
Ссылка на результат: 6.fasta
Используемая программа - seqret.
Исходные файлы: alignment.fasta. Команда:
seqret alignment.fasta msf::alignment.msf |
Ссылка на результат: alignment.msf
Используемая программа - infoalign.
Исходные файлы: alignment.fasta. Команда:
infoalign alignment.fasta -refseq 2 -only -name -idcount alignment.infoalign |
Ссылка на результат: alignment.infoalign
Используемая программа - featcopy. Исходные файлы: chromosome.gb. Команда:
featcopy chromosome.gb chromosome.gff |
Ссылка на результат: chromosome.gff
Используемая программа - extractfeat. Была выбрана последовательность полного генома Escherichia coli str. K-12 с идентификатором U00096, он записан в следующем файле: seq2.gb. Команда:
extractfeat seq2.gb -type CDS -describe product prot1.fasta |
Ссылка на результат: prot1.fasta
Используемая программа - shuffleseq. Исходные файлы: coding.fasta. Команда:
shuffleseq coding.fasta shuffle.fasta |
Ссылка на результат: shuffle.fasta
Используемая программа - makenucseq. Исходные файлы: нет. Команда:
makenucseq -amount 1 -length 200 random.fasta |
Ссылка на результат: random.fasta. Был выполнен поиск blastn с E-value 10 и найдено одно сходство с E-value = 3,5, что не является достоверным совпадением, выдача blastn представлена на Рис. 1.
![]() |
Используемая программа - compseq. Показывает частоту встречаемости кодонов при любых рамках считывания. Исходные файлы: gene_sequences.fasta. Команда:
compseq gene_sequences.fasta -word 3 genecompseq.fasta |
Ссылка на результат: genecompseq.fasta
Используемая программа - cusp. Показывает частоту встречаемости кодонов при конкретной рамке считывания. Исходные файлы: gene_sequences.fasta. Команда:
cusp gene_sequences.fasta genecompseq.cusp |
Ссылка на результат: genecompseq.cusp
Используемая программа - compseq. Исходные файлы: chromosomey.fasta - последовательность хромосомы Y человека. Команда для получения частот встречаемости динуклеотидов:
compseq chromosomey.fasta -word 2 ydin.fasta |
Ссылка на результат: ydin.fasta Команда для получения частот встречаемости нуклеотидов:
compseq chromosomey.fasta -word 1 ydin1.fasta |
Ссылка на результат: ydin1.fasta Затем с помощью программы Excel полученные данные были обработаны и сравнены с ожидаемыми по следующей формуле: ожидаемая частота XY = (наблюдаемая частота X) * (наблюдаемая частота Y). Ссылка на файл Excel. В результате выявлено, что частота встречаемости динуклеотида TT больше всего отклоняется от ожидаемой.
Используемая программа - tranalign. Исходные файлы: sequence.fasta - нуклеотидная последовательность, protein_alignment.fasta - белковая последовательность. Команда:
tranalign sequence.fasta protein_alignment.fasta |
Ссылка на результат: 1573620-1574456.fasta
Используемая программа - edialign. Исходные файлы: 16.3.fasta Команда:
edialign -seq 16.3.fasta -outseq align_16.fasta -outfile out_16.edialign |
Ссылка на результат: out_16.edialign и align_16.fasta
Используемая программа - degapseq. Исходные файлы: gap.fasta. Команда:
degapseq gap.fasta degap.fasta |
Ссылка на результат: degap.fasta
Используемая программа - noreturn. Исходные файлы: coding.fasta. Команда:
noreturn coding.fasta codingunix.fasta |
Ссылка на результат: codingunix.fasta
Используемая программа - makenucseq. Исходные файлы: нет. Команда:
makenucseq -amount 3 -length 100 -auto ran3.fasta |
Ссылка на результат: ran3.fasta.
Используемая программа - seqret. Исходные файлы: sra_data.fastq. Команда:
seqret sra_data.fastq fasta::sra.fasta |
Ссылка на результат: sra.fasta.