Практикум №10

1. Консервативные мотивы в выравнивании

Я выбрал домен PF00017. В выравнивании seed ссылка я обнаружил мотив G.FL.R.S (Паттерн JalView), GXFLXRXS (Паттерн Prosite). При выравнивании осталось 52 последовательности, как и было изначально. Также я проверил паттерн по всему выравниванию: ссылка

Исходя из результатов поиска через Prosite, можно сказать, что выравнивание получилось плохим, так как в 730 последовательностях 741 находка, это означает, что мотив не всегда находился друг под другом. Также нельзя говорить и о консервативности мотива.

2. Специфичный мотив

В выбранной и выделенной мной кладе я нашел мотив MKSSGPVER на позициях 88-96 ссылка, для поиска клады было построено дерево методом UPGMA. Этот мотив был обнаружен только в выбранной кладе и это указывает на его специфичность.

3. PSI-BLAST

В данной работе был выбран белок с идентификатором Q7VDL2, который известен как ингибитор клеточного деления у цианобактерии Prochlorococcus marinus (штамм SARG / CCMP1375 / SS120). Этот белок выполняет свою функцию путем подавления формирования полярных Z-кольцевых перегородок, что достигается за счет предотвращения полимеризации белка FtsZ, играющего ключевую роль в формировании нитей, необходимых для образования этих колец. Поскольку Z-кольцо является основным структурным элементом при делении прокариотической клетки, ингибирование полимеризации FtsZ значительно затрудняет процесс клеточного деления. Для структурно-функционального анализа данного белка был осуществлен поиск гомологичных последовательностей с использованием программы PSI-BLAST, что позволяет выявить родственные белки и оценить их консервативные домены

Из таблицы видно, что программа смогла обнаружить гомологов (семейство) за 3 итерации.

Рис 1. Таблица итераций для белка Q7VDL2

4. MEME

С помощью программы было найдено 4 мотива, при этом тот, который был обнаружен изначально, также присутсвует и имеет самый низкий E-value: 7.1e-706. Предварительно были скачаны белки из домена из базы данных Swiss-prot.

Рис 2. Мотив из выбранного домен PF00017

5. Представленность сайта GATC

При помощи команды cbcalc -s sites.txt -M -o result_pr10.tsv genomic.fasta был проведена оценка представленности различных сайтов, результаты в файле, после чего они были представлены в виде гистограммы.

Рис 3. Гистограмма сайтов

Из гистограммы видно, что сайт GATC недопредставлен, хоть и имеет O/E ratio на уровне 0.8. У моего организма более распространены другие сайты, это может быть связано с тем, что изучаемый организм использует другие сайты метилирования. Или же это своеобразная защита от бактериофагов, которые могут использовать сайты метилирования для репликации или регуляции своих генов. В целом все сайты кроме CTAG достаточно хорошо представлены в данном организме.