Чтение последовательностей по Сэнгеру

Задание 1.

Для работы я использовал файлы с хроматограммами прямой и обратной цепи ДНК. Файлы:
Прямая цепь
Обратная цепь
 
Открыв оба файла в программе Chromas Lite, я начал анализировать и сравнивать две последовательности.
Не читаемые 5'- и 3'- концы (координаты определены по прямой последовательности)
  Прямая цепь Обратная цепь
5'-нечитаемый конец 1 - 20 1 - 25
3'-нечитаемый конец
-
-
 
После этого я в файле с обратной последовательностью перешёл к комплементарной цепочке и продолжил работу.
5'-нечитаемые концы обеих последовательностей были удалены. Соответственно, нумерация нуклеотидов оказалась сдвинута, так что все номера участков последовательностей, которые я буду указывать далее, будут в "новых координатах".
В среднем уровень сигнала на обеих хроматограммах превышает уровень шума в 5 - 10 раз, причём встречаются места, в которых шумов нет вообще.
В среднем, пики имеют примерно одну высоту, зависимости высоты пика от типа нуклеотида выявлено не было. Однако были найдены и некоторые проблемные участки.
Например, в обеих цепях есть участки, на которых пики имеют чрезмерную высоту и ширину. Ниже можно увидеть изображения проблемного участка и соответствующего ему участка из цепи, комплементарной обратной.
Участок хроматограмм с чрезмерно высокими и широкими пиками.
Прямая цепь Комплементарная обратной цепь
 
Также встречались участки, где шумы по величине сравнимы с сигналами, и сложно понять, что же представлено на хроматограмме.
Пики с высоким уровнем шума.
Прямая цепь Комплементарная обратной цепь
 
Встречались участки, на которых вместо нескольких узких пиков можно было увидеть один широкий (два пика нуклеотида А в прямой цепи сливаются в один широкий)
Совмещённые пики.
Прямая цепь Комплементарная обратной цепь
 
Данный участок в прямой цепи находится близко к 5'-нечитаемому концу, и поэтому можно наблюдать общую расплывчатость пиков.
При редактировании прямой цепи я пользовался цепью, комплементарной к обратной, сопоставляя нуклеотиды и решая, какой должен стоять в конкретном проблемном месте. Однако на участке, где у обратной цепи находится 5'-нечитаемый участок, сравнивать стало невозможно, поэтому в некоторых позициях я редактировал на свой страх и риск. Так, в позициях 327 и 330 я решил поставить тимин, поскольку пик тимина в этих позициях вдвое выше остальных (шумовых) пиков. В данных местах, возможно, проявляется эфффект полиморфизма - два пика сравнимой высоты. В позиции 336 невозможно разделить пик и шум, поэтому я обозначил это место буквой y.
 
В позиции 360 сложно сказать, какой там должен быть нуклеотид, потому что в этой позиции видны три разновеликих пика, соответствующих тимину, гуанину и аденину, поэтому это место я обозначил буквой d. В 361 позиции виден очень высокий пик, соответствующий гуанину. Несмотря на чрезмерную высоту, этот пик довольно узкий, не распространяющийся на другие позиции, поэтому это место я обозначил буквой g. Почему-то на хроматограмме не было обозначено 362-й позиции, на которой находится довольно хороший чёткий пик аденина, поэтому я обозначил это место буквой a.
 
Аналогичным образом я редактировал и комплементарную к обратной последовательность. В 3 позиции видны три пика, соответствующих тимину, цитозину и гуанину, однако определить, какой из них - основной, а какие - шум, не представляется возможным. Поэтому эта позиция была обозначена буквой b. Аналогичная ситуация в 40 позиции, которую я обозначил буквой v.
 
В остальных проблемных позициях ситуация решилась просто - сравнением с хроматограммой прямой цепи.
 
Последовательность прямой цепи в FASTA-формате.
 
Последовательность цепи, комплементарной к обратной, в FASTA-формате.
 
Выравнивание отредактированных прямой и комплементарной к обратной цепей.
 

Задание 2.

Пример нечитаемой хроматограммы.
Открыв эту хроматограмму, я сперва удивился появившейся картине:
 
Потом я подумал: а что, если такие большие и широкие "горы" обусловлены пятнами краски, и если уменьшить вертикальный масштаб, будут видны приличные пики? Однако я ошибался...
 
Видно, что пики, соответствующие разным нуклеотидам, настолько плотно перекрываются, что становится невозможно определить, на какой позиции какой нуклеотид стоит. Возможно, такая картина связана с тем, что при секвенировании по Сэнгеру праймеры отжигались на нескольких разных последовательностях ДНК (исследуемая ДНК была недостаточно хорошо очищена).
 
 

Ссылка на главную страницу


© Головачев Ярослав