Выбор хромосомы и прочтение таблицы с генами

Создание файлов с последовательностями для train, test, negative

https://rest.ensembl.org/sequence/region/human/{номер хромосомы}:{thickStart}..{thickEnd}:{ прямая или обратная цепь : 1, -1}?expand_3prime={кол-во нуклеотидов после стоп -кодона};expand_5prime={кол-во нуклеотидов перед ATG}

Создание PWM для train

F(b,j) = [N(b,j) + e] /(N + e) F = d[ /len(d)+e

w(G,15) = ln(0.38/0.35) = 0.1 w(G,15) = ln(мое число из таблички/fr_gc)

TEST </H3>

NEGATIVE CONTROL

Вариант 2 положительный контроль множество тестовое генов человека отрицательный отберите сами ATG, которые не являются стартами трансляции, т.е. лежат вне кодиующей последовательности или наоборот лежт внутри гена.

Сравните распределения весов для положительного и отрицательного контроля и сделайте выводы.

Negative testing PWM