Для работы был выбран домен фибронектина 3 типа (Fibronectin type III domain). Домен имеет следующие характеристики:
Для этого домена была выбрана двухдоменная архитектура, состоящая из FN3_7 и fn3 (Fibronectin type III domain, PF00041), расположенных последовательно. Данной архитектурой обладают 102 белка из 220.
Сначала был скачан файл с последовательностями белков, содержащие домен FN3_7. При помощи скрипта получили файл с AC этих последовательностей. Со страницы доменной архитектуры в файл были скопированы AC белков, имеющих двухдоменную архитектуру. Скриптом получили последовательности белков с двумя доменами. Они были выровнены в Jalview, некоторые белки были удалены в ходе ревизии. Итого, для построения выравнивания было использовано 39 последовательности.
Затем все файлы с последовательностями скопировали на сервер кодомо, где запустили следующие команды:
hmm2build profile forAli.fasta
hmm2calibrate profile
hmmsearch --cpu=1 profile full.fasta &> log.txt
hmm2search --cpu=1 profile full.fasta &> log2.txt
В результате были получены файл с HMM-профилем и файлы с результатом поиска двудоменной архитектуры в последовательностях, содержащих FN3_7 ( для hmmsearch и hmm2search ). Длина составленного профиля равна 98 (из данных файла profile). На основании первого файла поиска скриптом была построена таблица содержащая столбцы: 1) AC белков с доменом; (2) отметка о выбранной архитектурой белка; (3) отметка о включении белка в выравнивание для построения HMM Профиля (4-5) для последовательностей, найденных профилем вес находки и E-value.
Алгоритм на основании построенного профиля нашел 164 последовательностей, имеющих двудоменную архитектуру, из 220 с заданным доменом. Дальнейший анализ проводился по таблице, составленной скриптом из второго файла с результатами. Таблица была импортирована в Excel, где затем данные обсчитывались и строились на их основе графики. Ссылка на excel файл.
Для данных было построено 3 графика:
Все файлы для работы были сделаны благодаря скриптам, предоставленных Беляевым Геннадием, студентом ФББ 2 курса.