Я выбрала домен PF00580 (UvrD/REP helicase N-terminal domain)

В seed выравнивании 36 последовательностей. В SwissProt 205 белков.

Польностью одинаковых последовательностей не нашлось, но при Above identity threshold= 85 осталось 32 штуки

Нашла мотив очень похожий на Walker A

Walker A мотив, также известный как P-loop, является консервативным структурным элементом белков, который отвечает за связывание фосфатных групп молекулы ATP

Walker A

Паттерн в Jalaview G.G.GKT

Нашлось 22 совпадения. Дважды в одной поседовательности не нашлось

Паттерн для Prosite: G-x-G-x-G-K-T

Я провела поиск в SwissProt PROSITE и обнаружила 1000 находок в 1000 последовательностях

Поставила Above identity threshold 90 и из 1000 осталось 395, сделала выравнивание

С помощью поиска в jalview нашла 390 совпадений

Задание 2

С помощью NJ в Jalview я построила дерево

Дерево, построенное в Jalview

Я решила выбрать кладу состаящую из Q9ZCJ7_RICPR, RECB_CHLTR, RECB_MYCTU, RECB_ECOLI, RECB_HAEIN, RECB_BORBU, ADDA_BACSU, ADDA_LACLM

Нашла 2 мотива, но выбрала наиболее точный: ASAG[TS]GKT

В результате поиска по всему выравниванию данный мотив нашелся только в 8 случаях. Вероятно данный мотив специфичен для этой клады

Задание 3

Я выбрала P19954 (Ribosome-binding factor PSRP1)

Организм: Spinacia oleracea

Фактор связывания рибосом участвует в свето- и температурно-зависимой регуляции синтеза белка. Взаимодействует с нуклеотидами 16S мРНК в А- и Р-сайтах, где защищает центр декодирования и ингибирует трансляцию, предотвращая связывание тРНК

Таблица с результатами PSI BLAST

Все найденные белки относятся к белкам, взаимодействующим с рибосомой или участвующим в регулировании трансляции. Большая разница для E-value лучшей и худшей находки

Значит PSI BLAST хорошо нашел гомологи

Задание 4

Скачала 75 последовательностей из SwissProt

Использовала команду

meme idk1.fasta -o res -mod anr -minw 4 -maxw 8 -nmotifs 4

Результаты:

  • HTML
  • txt
  • Результаты

    Нашлось 4 мотива

    Далее была использована команда: fimo --oc fimo_do -motif TNKAAREL -thresh 0.001 res/meme.txt idk1.fasta

  • Результат
  • Мотив встречается 198 раз в 43 последовательностях

    Задание 5

    Моя бактерия - это Pseudoalteromonas piscicida

    В файле sites.txt содержатся все возможные перестановки букв G, A, T, C

    Я использовала следующую команду:

    cbcalc -s sites.txt -M -o res.tsv GCF.fna

    GATC меньше, чем ожидалось. Возможно из-за того, что GATC метилируется