Мне были выданы файлы с хроматограммами прямой
14_F.ab1
и обратной
14_R.ab1 последовательности.
Для работы с хроматограммами я выбрала программу UGENE.
Результат - консенсусную
последовательность в формате fasta.
Выравнивание прямой и обратной последовательностей в формате fasta.
Изображение фрагмента выравнивания.
Так как программа всего лишь распознает пики флюоресценции, она может делать ошибки, связанные с нечеткими или нечитаемыми пиками
хроматограммы. Для прямой последовательности нечитаемый участок составил приблизительно 30 нуклеотидов с 5'-конца и 3 нуклеотида с 3'-конца.
Для обратной - 70 и 2 нуклеотида соответственно. В целом, качество всей хроматограммы удовлетворительное (могло быть хуже, но и лучше тоже).
Уровень шумов колеблется и в середине хроматограммы от низкого до такого, что не понятно, что происходит. Высота пиков также очень непостоянна, но у
цитозина (С) пики достигали максимальных значений по сравнению с остальными нуклеотидами.
Выровненная интерпретация двух
последовательностей была вручную отредактирована в сложных "спорных" позициях. Рассмотрим некоторые из таких проблемных нуклеотидов.
Из 5'-конца обратной последовательности
14_R.ab1 был выбран нечитаемый фрагмент (рис.5)
Сразу видно, что проблема в интерпретации этого участка заключается не в отсутствии пиков, а наоборот, в том, что их слишком много.
Если долго смотреть на данный участок хроматограммы, создается впечатление, что все затекло цитозином, потому как именно его пиков здесь больше всего,
они максимальны и мешают распознаванию других нуклеотидов. Но надо отметить, что такая картина типична для концевых участков хроматограммы последовательности.
Рис. 5. Изображение нечитаемого фрагмента.
В ходе практикума я научилась пользоваться программами, визуализирующими хроматограммы, полученные при секвенировании
нуклеиновых кислот, а так же интерпретировать значения пиков флюоресценции этих хроматограмм, что безусловно очень важно для меня.