8-916-939-49-78
jiabicht@rambler.ru
vk.com/allweiss
Исходя из табличных значений частот встречаемости каждой аминокислоты в БД Swiss-Prot, найдем вероятность появления слова "angel":
V = 0.0825*0.0406*0.0707*0.0675*0.0966 = 1.71*10-6
Теперь, используяобщее количество аминокислотных остатков и вероятность появления слова, узнаем количество возможных встреч с этим словом:
N = 1.71*10-6 * 191670831 = 328.846.., т.е. примерно 329 раз
Далее при помощи PROSITE я вел поиск по паттерну A-N-G-E-L
. Результат - found: 315 hits in 315 sequences.
Вывод: Значения теоретическое и практическое практически одинаковые, причем в большинстве присутствуют нименования растений и фотобактерий. Можно предположить, что белок содержащий эту последовательность играет какую-то роль в фотосинтезе.
Характеристика паттерна | Паттерн | В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну | Все ли последовательности из моего выравнивания найдены |
Фрагмент последовательности | AQTAEKG | 1 | Найден только искомый белок |
Сильный | [AVG]-[QR]-[TLA]-[AL]-E-X(1)-[GAL]-[GL]-[FIY]-X(3)-F-[LI]-A-D | 2 | Да |
Слабый | [AVG]-[QR]-[TLA]-[AL]-X(2)-[GAL]-[GL]-[FIY]-X(5)-A-D | 16 | Да |
При помощи сервера UniProt были получены полные аминокислотные последовательности белков, найденных с помощью сильного паттерна. Затем на сервере Европейского Биоинформатического Института программой "Muscle" проведено множественное выравнивание. Полученное выравнивание в программе "JalView" окрашено стандартной схемой ClustalX. Результат изображён на рисунке