СИГНАЛЫ И МОТИВЫ III
1. PSI-BLAST
O05886 - Ribosome hibernation promotion factor из Mycobacterium tuberculosis (strain ATCC 25618 / H37Rv). Нужен для димеризации активных 70S рибосом в неактивные 100S.
Таблица итераций
На 5-ой итерации не изменилось число находок выше порога, и e-value между худшей "правильной" и лучшей "неправильной" находками различается на 18(!) порядков, => считаю семейство довольно "хорошим", хотя нашла 3 "лишних" белка в выдаче 5-ой итерации (всего их там 30).
2. Эндонуклеазы рестрикции
В данном практикуме мне предстояло изучить специфичность эндонуклеаз рестрикции моей ненаглядной Geobacter metallireducens GS-15 (CP000148.1).
Для этого с сайта NCBI был скачан её геном в .fasta-формате, а из указанной в задании директории был скопирован файл со всеми известными ЭР второго типа из базы данных REBASE.
Далее с помощью команды cut -f 5 TypeII_REs.tsv | sort | uniq > sites_list.txt был создан список с последовательностями сайтов узнавания для рестриктаз, из которого я руками убрала "-" и "С", потому что ни то, ни другое, разумеется, не является нормальной последовательностью сайта узнавания. Остальные последовательности были длиной 4+.
После оценивалась представленность этих сайтов в геноме бактерии. Для этого командой cbcalc -s sites_list.txt -o sitesGM.tsv -K GeoMet_8_4.fasta были посчитаны контрасты сайтов; потом я, как истинный мокрый биолог, открыла Excel и со спокойной душой отфильтровала по O/E ratio. Увидела 9 последовательностей до 0,8, поэтому решила взять по 0,7 включительно. Это были три сайта: CTAG, CTCGAG, CGATCG.
Наконец, нужно было выяснить, какие рестриктазы из тех, которые ученые "видели в пробирке" (я имею в виду "no" в колонке "Putative"), режут по этим трём сайтам. Поэтому я отфильтровала изначальный список в Ecxel, а потом просто делала Ctrl+F.
Итак, предполагаемые эндонуклеазы рестрикции, которые (гомологи которых) могут встретиться в моей бактерии:
- CTAG:
- BfaIA
- BfaIB
- CchI
- MjaI
- MthZI
- CTCGAG:
- AbrI
- BstVI
- BsuMIA
- BsuMIB
- BsuMIC
- PaeR7I
- R1.BsuMI
- R2.BsuMI
- R3.BsuMI
- TliI
- XhoI
- CGATCG:
- Afa22MI
- PvuI
- RshI
- XorKI
Для интереса заглянула на сайт REBASE, посмотрела, что есть по данной бактерии. Увидела только три предсказанные ЭР 2 типа, у двух из них был прописан сайт GGATC. Посередине третьего обнаруженного мной сайта тоже есть GATC, так что, может быть, какие-то из этих предсказанных рестриктаз в той или иной мере гомологичны рестриктазам из третьей группы списка выше... Но всё это лишь догадки, а BLAST'а с меня хватит, простите...