Прочтение последовательностей по Сэнгеру


Задание 1:

Ссылки на исходные файлы: прямая цепь и обратная цепь.


Таблица 1. Координаты нечитаемых 5'- и 3'-концов.
Цепь Координаты нечитаемого 5'-конца Координаты нечитаемого 3'-конца
Прямая 1-19 621-833
Обратная 849-868 1-94

Характеристика хроматограммы прямой цепи:

  • В среднем сигнал превосходит шум в 11 раз.
  • Сила сигнала распределена вдоль оси Х равномерно, среднее значение составляет 700-800, однако наблюдаются пики с значением силы сигнала от 341 (рис.1) до 1723 (рис.2). Хотя данные числа и не имеют абсолютного значения, являясь характеристиками программы, они дают некоторое представление о масштабе. Шум в целом распределен равномерно.
  • В целом, сила сигнала не зависит от нуклеотида, хотя наиболее сильный сигнал наблюдается у нуклеотидов A и G. Сигналы со слабыми значениями не зависят от нуклеотидов (Проиллюстрировано на рис.3).

Рис. 1.
Рис. 2.
Рис. 3.

Характеристика хроматограммы обратной цепи:

  • В среднем сигнал превосходит шум в 9 раз
  • Сила сигнала распределена вдоль оси Х равномерно, составляя в среднем 1000-1100, но присутствуют и пики с значением силы сигнала от 385 (рис.4) до 2078 (рис.5). Шум распределен равномерно.
  • Наиболее сильный сигнал наблюдается у нуклеотидов Т и С, хотя в целом сила сигнала не зависит от нуклеотидов (рис.6).
Рис. 4.
Рис. 5.
Рис. 6.

После визуального анализа неоднозначные места были отредактированы в каждой хроматограмме, основываясь на данных из другой хроматограммы. Исправления отмечены маленькими буквами. Примеры исправлений:

  • Непрочитанные места в одной хроматограмме однозначно читались в другой (рис. 7 и 8):

    Рис. 7.
    Рис. 8.
  • Такая ситуация встречалась не один раз (рис. 9 и 10):
    Рис. 9.
    Рис. 10.
  • Один раз на прямой цепи встретился неопознанный нуклеотид, который можно однозначно восстановить, исходя из этой же хроматограммы (Рис. 11 и 12):
    Рис. 11.
    Рис. 12.
  • В некоторых местах встречалось наложение пиков, для однозначной расшифровки которого опять же требовалось обращаться к комплементарной цепи (Рис. 13 и 14):
    Рис. 13.
    Рис. 14.
  • Других проблем при расшифровке хроматограмм не возникало.

    Обе последовательности были выравнены в JalView: Ссылка

    На основании полученного выравнивания была построена "гипотетически чистая последовательность"; N = A, T, G, C


Задание 2:
на рисунках 9 и 10 приведен пример "плохой" хроматограммы: kamp3_18SIII_F_F03_WSBS-Seq-1-08-15.
На рисунке 15 виден широкий пик, "внутри" которого есть сигналы всех четырёх нуклеотидов, не похожие на обычный шум. На рис.16 шум и сигналы нуклеотидов сливаются в нечитаемые помехи, что в результате приводит к появлению в последовательности большого количества неопознанных нуклеотидов на близком расстоянии друг от друга.

Рис. 15.
Рис. 16.

Назад к странице семестров

© Andrew Sigorskih,2015.