Сигналы и мотивы


Задание 1.Сигнал рибосомного сдвига рамки считывания HIV-1

Сигнал рибосомного сдвига рамки ВИЧ - это рибосомный сдвиг рамки (PRF), который вирус иммунодефицита человека (ВИЧ) использует для трансляции нескольких разных белков из одной и той же последовательности.

Рис.1 . Прогнозируемая вторичная структура и сохранение последовательности HIV_FE

Вирус иммунодефицита человека (ВИЧ) требует запрограммированного сдвига рамки считывания рибосом -1 для экспрессии гена Pol. Сайт сдвига рамки считывания ВИЧ состоит из последовательности гептануклеотидов (UUUUUUA), за которой следует спейсерная область и расположенная ниже структура «стебель-петля» РНК. ВИЧ-1 PRF индуцирует ~5% рибосом смещаться в рамку считывания -1, таким образом производя полипротеин Gag-Pol. Эффективность сдвига рамки считывания составляет 5%, определяет соотношение продуцируемых вирусных белков и важна для репликации и инфекционности вируса. Снижение эффективности сдвига рамки считывания может ингибировать репликацию вируса. Однако соотношение Gag к Gag-pol оценивается как 20:1, из чего можно сделать вывод, что сигнал низко эффективен.

Задание 2.

Для это задания был исполнен скрипт Смирнова.М main.py, который получает на вход таблицу с информацией о генах человека, и создаёт файлы:

kozak-learn.fasta, содержащий обучающую выборку последовательностей Козак, kozak-test.fasta, содержащий тестовую выборку последовательностей Козак, pseudokozak1.fasta, содержащий фрагменты следующего вида: 7 нуклеотидов до ATG + ATG + 3 нуклеотида, для случайных ATG в геноме человека, result.csv, содержащий позиционную весовую матрицу с псевдоттсчетами, посроенную по данным из kozak-learn.fasta, ic.csv, содержащий матрицу IC, посроенную по данным из kozak-learn.fasta, result.txt, содержащий средние веса для положительного и отрицательного контролю, p-значение для гипотезе о равенстве средних весов для положительного и отрицательного котроля и итоговое IC сигнала.

Из файла result.txt можно узнать, что среднее значение веса для положительного контроля равняется 5.243, а для отрицательного - 1.634, p-value составляет 1.884e-10.

Задание 3.

Матрица IC: ic.csv, итоговое IC сигнала: 9.4933

Рис.2 . LOGO последовательности Козак человека

Из рисунка 2 видно, что сигнал сильнее всего в пределах 3 нуклеотидов от ATG, но сигнал всё равно слабый.

Литература

HIV-1 frameshift efficiency is primarily determined by the stability of base pairs positioned at the mRNA entrance channel of the ribosome. doi: 10.1093/nar/gks1254