Сигнал рибосомного сдвига рамки считывания HIV-1 - сигнал, закодированный в геноме HIV-1, состоящий из двух элементов: семинуклеотидной последовательности и особой вторичной структуры РНК. Семинуклеотидная последовательность имеет вид: N NNW WWH, где NNW и WWH - кодоны до сдвига, а NNN WWW - кодоны после него. Сдвиг рамки считывания позволяет рибосоме вместо короткого полипротеина Gag, синтезировать длинный полипротеин Gag-pol.[1] При этом отношение Gag к Gag-pol оценивается как 20:1.[2] Из этого следует, что сигнал низко эффективен.
Задание 2
Для выполнения задания 2 был написан скрипт main.py. Он получает на вход таблицу с информацией о генах человека, и создает следующие файлы:
pseudokozak1.fasta, содержащий фрагменты следующего вида: 7 нуклеотидов до ATG + ATG + 3 нуклеотида, для случайных ATG в геноме человека,
result.csv, содержащий позиционную весовую матрицу с псевдоттсчетами, посроенную по данным из kozak-learn.fasta,
ic.csv, содержащий матрицу IC, посроенную по данным из kozak-learn.fasta
result.txt, содержащий средние веса для положительного и отрицательного контролю, p-значение для гипотезе о равенстве средних весов для положительного и отрицательного котроля и итоговое IC сигнала
Среднее значение веса для положительного контроля равняется 5.24, а для отрицательного - 1.54, при этом они достовено отличаются (p-value = 3.08e-12)
Рис. 1. LOGO последовательности Козак человека.
Как видно на рис. 1 сигнал сильнее всего в пределах 3 нуклеотидов от ATG, однако в целом это довольно слабый сигнал.
Список литературы
Wang X, Xuan Y, Han Y, Ding X, Ye K, Yang F, Gao P, Goff SP, Gao G. Regulation of HIV-1 Gag-Pol Expression by Shiftless, an Inhibitor of Programmed -1 Ribosomal Frameshifting. Cell. 2019 Jan 24;176(3):625-635.e14. doi: 10.1016/j.cell.2018.12.030. PMID: 30682371; PMCID: PMC8486322.
Shehu-Xhilaga M, Crowe SM, Mak J. Maintenance of the Gag/Gag-Pol ratio is important for human immunodeficiency virus type 1 RNA dimerization and viral infectivity. J Virol. 2001 Feb;75(4):1834-41. doi: 10.1128/JVI.75.4.1834-1841.2001. PMID: 11160682; PMCID: PMC114093.