СИГНАЛЫ И МОТИВЫ III

1. PSI-BLAST

O05886 - Ribosome hibernation promotion factor из Mycobacterium tuberculosis (strain ATCC 25618 / H37Rv). Нужен для димеризации активных 70S рибосом в неактивные 100S.
Таблица итераций
На 5-ой итерации не изменилось число находок выше порога, и e-value между худшей "правильной" и лучшей "неправильной" находками различается на 18(!) порядков, => считаю семейство довольно "хорошим", хотя нашла 3 "лишних" белка в выдаче 5-ой итерации (всего их там 30).

2. Эндонуклеазы рестрикции

В данном практикуме мне предстояло изучить специфичность эндонуклеаз рестрикции моей ненаглядной Geobacter metallireducens GS-15 (CP000148.1).
Для этого с сайта NCBI был скачан её геном в .fasta-формате, а из указанной в задании директории был скопирован файл со всеми известными ЭР второго типа из базы данных REBASE.
Далее с помощью команды cut -f 5 TypeII_REs.tsv | sort | uniq > sites_list.txt был создан список с последовательностями сайтов узнавания для рестриктаз, из которого я руками убрала "-" и "С", потому что ни то, ни другое, разумеется, не является нормальной последовательностью сайта узнавания. Остальные последовательности были длиной 4+.
После оценивалась представленность этих сайтов в геноме бактерии. Для этого командой cbcalc -s sites_list.txt -o sitesGM.tsv -K GeoMet_8_4.fasta были посчитаны контрасты сайтов; потом я, как истинный мокрый биолог, открыла Excel и со спокойной душой отфильтровала по O/E ratio. Увидела 9 последовательностей до 0,8, поэтому решила взять по 0,7 включительно. Это были три сайта: CTAG, CTCGAG, CGATCG.
Наконец, нужно было выяснить, какие рестриктазы из тех, которые ученые "видели в пробирке" (я имею в виду "no" в колонке "Putative"), режут по этим трём сайтам. Поэтому я отфильтровала изначальный список в Ecxel, а потом просто делала Ctrl+F.
Итак, предполагаемые эндонуклеазы рестрикции, которые (гомологи которых) могут встретиться в моей бактерии:

  1. CTAG:
    • BfaIA
    • BfaIB
    • CchI
    • MjaI
    • MthZI
  2. CTCGAG:
    • AbrI
    • BstVI
    • BsuMIA
    • BsuMIB
    • BsuMIC
    • PaeR7I
    • R1.BsuMI
    • R2.BsuMI
    • R3.BsuMI
    • TliI
    • XhoI
  3. CGATCG:
    • Afa22MI
    • PvuI
    • RshI
    • XorKI

Для интереса заглянула на сайт REBASE, посмотрела, что есть по данной бактерии. Увидела только три предсказанные ЭР 2 типа, у двух из них был прописан сайт GGATC. Посередине третьего обнаруженного мной сайта тоже есть GATC, так что, может быть, какие-то из этих предсказанных рестриктаз в той или иной мере гомологичны рестриктазам из третьей группы списка выше... Но всё это лишь догадки, а BLAST'а с меня хватит, простите...