Чтение последовательностей по Сэнгеру.


Задание 1. Получение последовательности фрагмента ДНК.


1. Исходные файлы с хроматограммами:

  • прямая цепьfasta формате)
  • обратная цепьfasta формате)


  • 2. Выравнивание прямой и комплементарной к обратной последовательности в проекте JalView: проект

    Маленькими буквами отмечегны нуклеотиды, которые были изменены.


    3. "Чистая" последовательность прямой цепи в формате fasta.

    Порядок выполнения работы:

    1) С помощью программы Chromos я открыла 2 файла с хромотограммами прямой и обратной цепи фрагмента ДНК.
    2) Затем я изменила обратную цепь на комплементарную ей и "переписала" её наоборот (для этого была использована программа reserve complement). Такая замена была осуществлена для того, чтобы можно было сравнивать последовательности обеих цепей.
    3) Далее я выровняла последовательности относительно друг друга, используя опцию find.
    4) Определив границы нечитаемых 5'- и 3'-концов каждой последовательности, я их удалила.

    Границы нечитаемых участков:

    Цепь
    Прямая Компплементарная к обратной
    5' нечитаемый участок 1-32 1-25
    3' нечитаемый участок 673-до конца 688-до конца


    5) Теперь оченим качество кождой хроматограммы:

    Прямая цепь:

  • В среднем сигнал превосходит шум в 8 раз.
  • Средняя сила сигнала вдоль оси X равномерна.
  • Cила шума заметно увеличивается к концу хроматограммы где-то в 4 раза.
  • У разных очевидных сигналов сила может различаться в 7 раз. Самый сильны разброс наблюдается у нуклеотидов G и A, когда T и C принимают средние значения почти на всём промежутке.
  • Обратная цепь:

  • В среднем сигнал превосходит шум в 6 раз.
  • Средняя сила сигнала вдоль оси X практически равномерна, только увеличивается в самом конце хроматограммы отдельными фоагментами.
  • Сила шума в середине участка равномерна, по краям она немного выше.
  • Сила у разных очевидных сигналов может отличаться в 15 раз. Самые высокие пики чаще всего наблюдаются у С.
  • Хроматограмма хорошая, но хуже первой.



  • 6) Редактирование прямой последовательности:

  • Сначала приведу пример хорошо получившегося участка, прочтение которого однозначно.





  • "клякса" в области 75-85



  • Пики накладываются друг на друга, также слишком силен шум.
    К счастью, на обратной цепи проблем в этом месте нет, и последовательность полностью восстанавливается.



  • Слабый сигнал на фоне сильного шума. Сильный шум или наложение пиков в позициях 607, 673, 676, 679, 685.



  • К сожалению, обратная цепь не позволяет понять, что в этих позициях должено стоять.
    Но можно сделать предположение, что в 607 позиции стоит T, a пик G является просто результатом шума.
    Однако в других позициях ситуация совсем не может быть предугадана, поэтому в 673 позиции ставлю r (там может стоять как G, так и А), а в поцициях 676, 679 и 685 ставлю y (там с одинаковой вероятностью может быть как С, так и Т).

  • Аналогично были присвоены названия оставшимся неоднознаяным позициям.



  • 691 - r
    703 - g
    710 - c
    711 - c
    721 - w
    714 - a

    Редактирование обратной цепи

  • "кляксы" в позициях 595-605 и 630-650

  • Большую часть этой области программа прочитала правильно. Сравнение с прямой цепочкой позволило полностью восстановить последовательность.


    Задание 2. Привести пример нечитаемой хроматограммы.



    Прочитать такую хроматограмму невозможно, так как пики накладываются друг на друга. (шум и сигнал сливаются).

    СПАСИБО ЗА ПРОСМОТР


    © Мария Медведева