Третий семестр
Чтение последовательностей по Сэнгеру.Были даны два файла в формате .ab1, соответствующие прочтению прямой и обратнойцепочки анализируемой ДНК Задание заключалось в нахождении и исправлении ошибок, допущенных программой при расшифровке детектирования сигнала на электрофорезе. Для просмотра файлов была использована бесплатная версия программы Chromas lite. Сначала были получены две последовательности ( прямой и обратной, но перевернутой цепочек) в формате fasta. В Jalveiw они были выровнены вручную (см.рис1). Далее, основываясь на этом выравнивании, вручную "выравнивались" хроматограммы в Chromas. Из предварительного выравнивания видно, что 5'-конец последовательности лучше определен на перевернутой цепи, в то время как 3'-конец - на прямой.
Рис1. Выровненные вручную в Jalview прямая и обратная, но перевернутая последовательности ДНК. Нуклеотиды (A,T,G,C, N, где N - неизвестный нуклеотиды обозначен каждый своим цветом). Определения нечитаемых концов. Для начала определим границы читаемости хроматограммы с двух концов по координатам прямой последовательности.
Так как первые 17 нуклеотидов в прямой цепи не читаются, в обратной читаются с 11, но некоторых из их даже нет в прямой, нумерация пойдет в минус.
Визуальная характериcтика хроматограммы. В данной хроматограмме уровень шума нисколько не мешает определять последовательность. В среднем сигнал превосходит шум в 5 раз.
Различие между пиками очевидных ситуаций присутствует и отвечает некоторой закономерности ( а может и не закономерности) (см. таблицу 1) Исходя из наблюдений, можно сказать, что высота пика сигнала цитозина и тимина, а также разброс в их значениях в среднем почти одинаковы, аденина - чуть больше, а у гуанина, во-первых, уровень зарегистрированного сигнала выше и разность высот ощутемее. Возможно это связано с чувствительностью детектора. Еще мне показалось, что изображение пиков при детектировании нуклеотидов (когда какой-то нуклеотид в последовательности долго не появляется, а затем повторяется 3 раза (в частности), они образуют более менее одинаковый "профиль" (см. рис. 5 - пример с гуанином)
Надо сказать, что это хроматограмма хорошо сделана, так как уровень шума был достаточно низким. (см. рис 6) C 450 нуклеотида (по прямой) шум незначительно, но увеличивается.
Нахождение проблемных мест в хроматограмме прямой цепи и проверка по обратной.В основном, места, в которых возникали трудности при определении нуклеотида, оказывались на "концах" последовательностей. Что к сожалению, нельзя объяснить как полиморфизм, так как шум до этого места не был однородно низок. Итак.
Далее хроматограмма прямой читается нормально. И трудностей не возникает. В обратной перевернутой цепи гораздо больше неопределенных мест не в начале, а в конце цепи. Во-первых, высота пиков неравномерна по последовательности. В следствии этого есть место с очень низким сигналом, к которому программа не чувствительна (см. рис.9). Но в сравнении с прямой цепью все определяется.
Во-вторых, есть два пятна краски, что помешало программе определить несколько нуклеотидов (см. рис.10)
Пример нечитаемой хроматограммы.Чтобы понять, насколько можно доверять предыдущей хроматограмме, рассмотрим пример плохого представления детектирования сигнала. Здесь не читается ниодин пик. Программа пыталась сначала определять сигналы, но уже с 6-ого остановилась. Затем после двух пиков идет "пропасть". (см. рис.2) Интересно, почему программа не остановилась именно на этом участке, а прервала работу чуть раньше. По всей длине хроматограммы шум и сигнал на одном уровне, а иногда их вообще почти нет. Чтобы определить в чем причина плохой хроматографии (делеция нуклеотида, две разных ДНК), я пыталась найти какие-нибудь закономерности в последовательности пиков. Мне показалось, что в разных местах последовательности есть участки, где "профиль" повторяется через четыре нуклеотида. Также если сранить с предыдущей хроматограммой, то начало (5' конец) резко отличается по ширине пиков: в хорошей начало расплывчатое, пики сливаются образуя широкие "горы", а в плохой пики сразу различимы. Но это только наблюдения. Никаких выводов из них не следует. Предположение о причине получения: в пробе было несколько ДНК.
В результате анализа была получена следующая "чистая" последовательность.
Дата последнего изменения: 10.10.15
© 2014 Макарова Надежда |