Задание 1.
Выбранный для паттерна фрагмент выделен малиновым цветом. " Создание паттернов аминокислотных последовательностей"
При поиске последовательностей по сильному паттерну было найдено 20 последовательностей, однако все остальные последовательности, не входящие в множественное выравнивание, по которому делался паттерн, принадлежат одинаковым белкам организмов одного рода.
Это было предсказуемо изначально, ведь паттерн строился по выравниванию, в котором большинство белков из организмов того же рода.
Такое небольшое количество найденных последовательностей еще раз говорит о редкости белка.
При поиске последовательностей по слабому паттерну нашлись те же самые 20 белков. В таблице указан первоначальный слабый паттерн, который однако не намного отличается от сильного. Но в ходе выполнения работы я провела поиск по еще более слабым паттернам: [DER] -[KRST]-[DT] -[GS] -V-[AILV] -[LR] -[ACL]-[DENQ]-Q-[ILPV] -[KR]-[ST]-[ILMV]-[AD] -X(0,3)-[KR]-[AKRNQ] (табличный) [DEKNRQ]-[KRST]-[DST]-[GST]-V-[AILMV]-[ILRK]-[ACL]-[DENQ]-Q-[ILMPV]-[KR]-[ST]-[ILMV]-[ADENQ]-X(0,3)-[KR]-[AKRNQ] [KRST]-[DST]-[GST]-V- X -[ILRK]-[ACL]-[DENQ]-Q- X -[KR]-[ST]-[ILMV]-[ADENQ]-X(0,3)-[KR] [KRST]-[DST]-[GST]-V- X -[ILRK]-[ACL]-[DENQ]-Q- X -[KR]-[ST]-[ILMV]-[ADENQ] Однако результат все время оказывался одинаковым: 20 одних и тех же белковых последовательностей. Создание слабого паттерна: [FILQ]-[DER]-[KRT] -[DT]-[GS]-V-[AIV] -[LR]-[ACL]-[DE] -Q-[IPV] -[KR]-[ST]-[IL] -[AD]-X(0,1)-[KR]-[AKNQ]-R-[GL] [DER]-[KRST]-[DT]-[GS]-V-[AILV]-[LR]-[ACL]-[DENQ]-Q-[ILPV]-[KR]-[ST]-[ILMV]-[AD]-X(0,3)-[KR]-[AKRNQ] Обрезаны 1 позиция сначала и 2 позиции сконца; в 3 позицию добавлен S (на основании родства S-T); в 7 позицию добавлен L (на основании родства L-I-V ); в 10 позицию добавлены N, Q (родство D-N, E-Q), в 12 добавлен L (родство L-I-V); в 15 добавлены M, V (родство L-I-V-M); в 17 позиции ослаблены условия пропуска с(0,1)до (0,3). Задание 2. Все описанные в PROSITE мотивы в заданном белке ENDOA_BACSU
|