Мотивы в белках

Консервативные мотивы в выравнивании

Для этого практикума я выбрала домен SH2, последовательностей между онкопротеинами Src и Fps. PF00017. Seed содержит 52 белков. Для исследования мотива я выбрала последовательность G.FL[VIAL]R.S, всего таких мотив оказалось 32. Паттерн в формате Prosite: G-x-F-L-[VIAL]-R-x-S.

af
Рис.1 Seed PF00017, покрашен Clustal по 70% индентичности.

Пропустив этот мотив через MyHits я нашла 335 совпадений, что означает, что такой паттерн не является характерной чертой выбранного домена.

Мотив, специфичный для одной клады филогенетического дерева

Я выбрала кладу из 15 последовательностей. В ней я нашла консервативный паттерн KHY.I, который был у 13 последовательностей. При этом при поиске в белках, не входящих в выбранную кладу совпадений не нашлось, что означает, что этот паттерн характерен только для этих 15 последовательностей.

af
Рис.2 Seed PF00017, выбранная клада отмечена желтым.

PSI-BLAST

Выбрала индентификатор P39450, это S-(гидроксиметил)глутатиондегидрогеназа Pasteurella piscicida, которая катализирует синтез S-формилглутатиона.

Номер итерации Число находок выше порога (0,005) Идентификатор худшей находки выше порога E-value этой находки Идентификатор лучшей находки ниже порога E-value этой находки
1 467 Q9ZGI4.1 0,005 D2S1F7.1 0,006
2 836 Q5KWK4.1 0,005 Q2RKY6.1 0,006
3 949 P55100.2 0,005 D1ZA70.1 0,006
4 1613 B2AH07.1 0,005 O01592.1 0,006
5 2897 B5YEM1.1 0,005 B5BL07.1 0,006

Поиск de novo мотивов в выборке поледовательностей с доменом из SwissProt

Я провела поиск своего домена в Swiss-Prot. Я решила использовать только белки человека, поэтому последовательностей осталось 100. После remove redundancy на 30% осталось 89. Далее я запустила MEME и FIMO с помощью команд:

meme def.fasta -o meme_results -mod anr -minw 4 -maxw 8 -nmotifs 4

HTML отчет

fimo meme_results/meme.txt uniprotkb_PF00017_AND_organism_id_9606_2024_05_16.fasta

HTML отчет

Представленность сайта GATC в геноме

Взяла в качетсве бактерии Escherichia coli. Далее с помощью скрипта Каримовой Каримы я подсчитала контрасты obs/exp по методу Карлина для сайта всех сайтов длиной 4 нуклеотида.

af
Рис.3 Представленность всех сайтов длины 4.