Первое задание включало в себя сравнение трёх способов нахождения спаренных нуклеиновых кислот, при этом find_pair работал с PDB-структурой, а einverted и RNAfold с fasta-последовательностью. Далее представленна сравнительная таблица (без указания расположения) со шпильками, найденными программами.
По результатам find_pair | С помощью einverted | По алгоритму Зукера | |
Акцепторный стебель | 6 | 6 | 6 |
D-стебель | 3 | 0 | 3 |
T-стебель | 5 | 0 | 5 |
Антикодоновый стебель | 8 | 8* | 5 |
Видно, что любая из программ с точностью предсказывает акцепторный стебель, так как он наиболее очевиден и не имеет неканонических пар. D- и T-стебли не предсказываются с помощью einverted, так как антикодоновый и акцепторный стебель более существенны, а программа не умеет искать спаривания, расположенные на одной цепи. Для нахождения этих спариваний можно попытаться разделить последовательность на 4 части, но это сильно усложняет работу. Также антикодоновый стебель был найден со сдвигом на одну пару оснований. Не было идентифицировано неканоническое спаривание 44-26, зато было найдено отсутствующее в структуре спаривание 36-34. Для работы программы использовались стандартные параметры, за исключением Match score, которому было придано значение 100. Параметры были подобраны со второго раза после недолгих раздумий, так как первый был пущен со стандартными параметрами. Дальнейшие попытки что-то улучшить не давали изменений в сторону большей точности.
Далее были построены структуры по алгоритму Зукера. Видно, что он нашёл все спаривания, которые были. Однако, антикодоновая шпилька оказалась короче с обеих сторон. Судя по всему, это связано с тем, что с одной из сторон последовательность прерывается неканонической парой, а другая нестабильна без белковой части. Изменение параметров не помогло улучшить структуру, однако, удалось пронаблюдать изменения структуры при изменении температуры с 1 до 100 градусов по Цельсию. Полученные структуры лежат в архиве. Наиболее правильная из них выложена ниже.
Далее необходимо было выполнить некоторые задания, используя скрипт.
Контакты атомов белка с | Полярные | Неполярные | Всего |
Остатками 2'-дезоксирибозы | 10 | 5 | 15 |
Остатками фосфорной кислоты | 57 | 15 | 72 |
Со стороны большой бороздки | 8 | 3 | 11 |
Со стороны малой бороздки | 5 | 10 | 15 |
Далее из обрезанной структуры был сгенерирован файл ps, переведённый в pdf. Наиболее содержательная его часть представленна ниже.
Видно, что аспарагин 81, аргинин 33, лизин 79 и лизин 25 контактируют с белком два раза. Однако, остаток аспарагин 81 важнее, так как он взаимодействует с двумя отнованиями, когда лизин 25 реагирует с одним и сахарофосфатным остовом, а остальные реагируют только с сахарофосфатным остовом.
Asn81 контактирует с цитозином и тимином.
Lys25 контактирует с тимином и сахаро-фосфатным остовом.