Ралдугина Василиса

Студентка Факультета биоинженерии и биоинформатики

МГУ имени М.В. Ломоносова

Обо мне

Главная

Сайт ФББ МГУ

Чтение последовательностей по Сэнгеру

Задание 1.

Чтение последовательности ДНК на основании данных, полученных из капиллярного секвенатора по Сэнгеру.

Были проанализированы два файла в формате .ab1, соответствующие прочтению прямой и обратной цепочки секвенируемой ДНК. Для просмотра и редактирования хроматограмм мы использовали бесплатную программу Chromas Lite.

Ссылки на скачивание:

Прямое прочтение WSWS2962_COI_F_H11_WSBS-Seq-1-08-15.ab1
Обратное прочтение WSWS2962_COI_R_H12_WSBS-Seq-1-08-15.ab1

    Общая характеристика хроматограммы:

  • По хроматограмме (H11) были определены длины нечитаемых участков для прямого прочтения. Хроматограмма оказалась нечитаема до 39 основания и с 635 основания.
    После определения нечитаемых участков для прямого прочтения, я открыла обратное и перешла к комплементарной цепочке.
    Комплементарное обратное прочтение читаемо с 95 нуклеотида, который соответствует 60 нуклеотиду на прямой цепи и до 655 нуклеотида, соответствующего 620 нуклеотиду на прямой цепи.
  • Далее, я установила соотвествие между двумя цепочками. На хроматограмме H11 искомое соотсветсвие начинается с 19 основания, а на H12 (reverse) с 54 основания.
  • Уровень шума достаточно низок - около 10% от нормального сигнала и меньше.
  • Сила сигнала в обоих прочтениях варьирует в достаточно сильно, но сигнал всегда отличим от шума. Шум практически всегда на очень низком уровне и не мешает различить сигнал. Таким образом, можно сделать вывод, что качество хроматограммы довольно высокое

    Примеры исправления нуклеотидов:

1 2 3-5

Обратное прочтение (хроматограмма снизу).
383-й нуклеотид программа обозначила как N, однако при прямом прочтении ясно читается С.

Прямое прочтение (хроматограмма сверху).
53-й нуклеотид обозначен программой как G, при этом пик довольно расплывчатый. Если мы сопоставим два прочтения, то мы увидим, что одна G из трех лишняя.

Прямое прочтение.
78 нуклеотид обозначен программой как G. Однако сопоставлние с обратным прочтением (хроматограмма снизу) позволяет удостовериться, что это действительно G, т.к. пик выделяется гораздо лучше.


Исправленные последовательности в fasta-формате:

Прямое прочтение straight.fasta
Обратное прочтение reverse.fasta


После редактирования хроматограмм вручную, результаты были сохранены в fasta-формате. Последовательности были глобально выравнены с помощью программы needle пакета Emboss: needle straight.fasta reverse.fasta -outfile result.fasta -aformat3 fasta. Штрафы за гэпы были выбраны по умолчанию.

Результаты:


Ссылки:
Fasta-файл
Визуализация в программе JalView


Задание 2.

Пример нечитаемого фрагмента хроматограммы

Хроматограмму невозможно достоверно прочитать, т.к. на ней присутсвует много шума, который перебивает сигнал. Разобрать что-либо нельзя. Видимо, это результат того, что препарат содержал больше одной ДНК. Также в центре фрагмента находится большое пятно краски.


© Raldugina Vasilisa 2016