1. EMBOSS: пакет программ для анализа последовательностей

  1. Объединим несколько файлов в формате fasta в единый с помощью команды seqret. Предварительно был создан файл seqlist.txt , содержащий адреса исходных последовательностей в формате usa. С помощью команды seqret @seqlist.txt seq.fasta был получен файл seq.fasta с последовательностями.
  2. Разделим полученный файл seq.fasta на несколько файлов с отдельными последовательностями с помощью команды seqretsplit seqretsplit mysequences.fasta -auto Полученные файлы: abi3_arath.fasta, c7e4j6_tobac, vird2_agrfc.
  3. С помощью команды seqret необходимо было из файла с хромосомой в формате .gb три кодирующих последовательности по указанным координатам "от", "до", "ориентация" и сохранить в одном fasta файле. Для работы использовали последовательность Arabidopsis thaliana chromosome 1, файл sequence.gb; chrlist2.txt файл, содержащий координаты кодирующих последовательностей: seqret @chrlist2.txt chrseq.fasta; выходной файл chrseq.fasta.
  4. Полученные в предыдущем пункте последовательности протранслируем в аминокислотные с помощью команды transeq, результат который будет записан в один fasta-файл trans_chrseq.fasta : transeq chrseq.fasta tran_chrseq.fasta.
  5. С помощью той же команды транслируем заданную последовательность в шести рамках. На вход подаем at_gene.fasta : transeq at_gene.fasta transat.fasta -frame 6 ; выходной файл - transat.fasta.

      .

      2. Построение карты локального сходства геномов двух бактерий

      В качестве примера были рассмотрены геномы бактерий одного вида: Streptococcus pneumoniae R6 и Streptococcus pneumoniae CGSP14
      Геномы:
      1. Streptococcus pneumoniae R6 - 2 038 615 п.н.
      2. Streptococcus pneumoniae CGSP14 -2 209 198 п.н.

Streptococcus pneumoniae — грамположительные каталазо- и оксидазоотрицательные бактерии, являющиеся факультативными наэробами, рост которых усиливается при повышении содержания углекислого газа в атмосфере инкубации до 5—7%.Строение клеточной стенки стрептококков типично для грамположительных бактерий. Её основой являетсяпептидогликан со встроенными углеводами, тейхоевыми кислотами, липопротеинами и поверхностными белками. Для пневмококков дополнительно характерно наличие мощной полисахаридной капсулы, которая выполняет защитную функцию, препятствуя опсонизации и последующему фагоцитозу.Пневмококки являются одним из основных возбудителей менингита, среднего отита, синусита, внебольничной пневмонии.

Для построения карты был использован алгоритм blast2seq на сайте NCBI.

Характеристики полученного выравнивания:

  • E-value: 0.0
  • Query cover: 94%
  • Identity: 99%


По оси абсцисс представлен штамм Streptococcus pneumoniae R6, по оси ординат - Streptococcus pneumoniae CGSP14 . Карта локального сходства отражает крупные эволюционные события, такие как вставки, делеции, транслокации, инверсии. Она отбражает информацию о том, какой участок генома одной бактерии соответствует определенному участку генома другой бактерии.

Как видно из рисунка, участок У2 перевернут, что говорит о возможной инверсии в одном из геномов.

Усток х1-у1: возможная инсерция в геноме штамма Streptococcus pneumoniae R6 или делеция в штамме Streptococcus pneumoniae CGSP14. Желтыми квадратами отмечены аналогичные случаи.

При картировании не наблюдается явных признаков транслокации, однако, трудно сказать об этом с уверенностью, в связи с тем, что масштаб карты сильно сжат.