После настройки einverted путем подбора было установлено, что наиболее близкая к реальности выдлача получаются при параметрах:
-gap 10 -threshold 10 -match 5 -mismatch -10
Однако даже в таком случае выдача остается не просто грубой, а фактически бессмысленной:
В свою очередь, предсказание при помощи алгоритма Зукера выдает достаточно близкую к правде структуру тРНК:
Позиции в структуре (по результатам find_pair) | Результаты предсказания с помощью einverted | Результаты предсказания по алгоритму Зукера | |
Акцепторный стебель | 1-7...72-66 | 4/8 | 7/8 |
D-стебель | 10-14...25-21 | 0/5 | 3/5 |
T-стебель | 49-53(54)...65-61(58) | 0/5 | 5/5 |
Антикодоновый стебель | 38-44...32-26 | 0/7 | 5/7 |
Общее число связей в стеблях | 25 | 4/25 | 20/25 |
Скрипт, показывающий множества
Для подсчета связей использовались следующие команды:
Полярные с остатками 2'-дезоксирибозы: select within(3.5, (*.O? or *.N?) and protein) and set1
Неполярные с остатками 2'-дезоксирибозы: select within(4.5, (*.S? or *.C? or *.P?) and protein) and *.C?'
Полярные с остатками фосфорной кислоты: select within(3.5, (*.O? or *.N?) and protein) and set2
Неполярные с остатками фосфорной кислоты: select within(4.5, (*.S? or *.C? or *.P?) and protein) and *.P
Контакты атомов белка с | Полярные | Неполярные | Всего |
остатками 2'-дезоксирибозы | 8 | 46 | 54 |
остатками фосфорной кислоты | 15 | 14 | 29 |
Многие анимокислотные остатки имеют 2 контакта с цепью ДНК, но не один не имеет трех, однако главным для определения цепи я выбрал Ser176(A)*, так как он контактирует в 2 местах с азотистыми основаниями, а не с сахарами остова.