Практикум 10. Выравнивания. Summary
Краткая последовательность действий
- Последовательность белка была взята из практикума прошлого года. И переименована в VIOD_CHRVO.fasta
- Геном бактерии был взят с сайта NCBI
- Из него был извлечен ген данного белка при помощи команды
seqret genome.fasta[3559549:3560670:r] CDS.fasta
Цифры 3559549 3560670 это координаты гена данного белка, их мы искали в 6 практикуме в первом семестре. Ген находится на обратной цепи, поэтому за ними стоит буква r. Результат записан в файл CDS.fasta - Для самопроверки транслируем этот белок командой
transeq CDS.fasta translated.fasta - И выравниваем
needle VIOD_CHRVO.fasta translated.fasta alignment.fasta -aformat3 fasta
Есть один гэп. Он появился на месте стоп-кодона. Дело в том, что transeq транслирует стоп-кодоны в виде *, а так совпадение полное.
Параметр -aformat3 fasta говорит needle записать выравнивание в формате fasta - Копируем CDS.fasta в mutatedCDS-1.fasta, вносим мутацию.
- Транслируем
transeq mutatedCDS-1.fasta translated-1.fasta - Выравниваем
needle VIOD_CHRVO.fasta translated-1.fasta alignment-1.fasta -aformat3 fasta - Смотрим через JalView
- Повторяем пункты 6-9 для всех мутаций.
Комментарии к заданиям
Все основные комментарии были прописаны в таблице. Здесь привожу небольшие уточнения.
Даже синонимичная мутация может влиять на экспрессию гена. Это связано с разной частотой встречаемости тРНК в клетке.
В работе получилось относительно мало стоп-кодонов. Например в случаях с 1 по 5 ни разу. Не везло.
Ниже приведен пример выравнивания, полученный с помощью JalView