В Uniprot был найден AC для тиаминового транспортера 1 (THTR1; AC:O60779), с помощью которого был осуществлён поиск в Pfam. Результатом стало семейство доменов восстановленного переносчика фолата. Его функция заключается в транспортировке фолата в клетку. Поступление фолата из окружающей среды особенно важно для животных, в организме которых он не синтезируется. Параметры семейства можно увидеть в таблице (Табл.1).
Если распределять белки с доменом по таксонам, то абсолютное большинство принадлежит к царству Metazoa (1754 последовательности), только 16 — к царству Viridiplantae. 33 последовательности относятся к представителям без царства, и 195 — к несистематизированным эукариотам.
В HMM профиле указана дата создания — 16 октября 2021 года, а также число позиций — 412.
Было выбрано два белка с разной доменной архитектурой: Folate_carrier (1685 белков) и Folate_carrier x 6 (1 белок). Первый из них содержит домен белка целиком, а второй — преобразованный. С помощью Blast была получена карта локального сходства этих белков (Рис.1).
Первый белок отложен по горизонтальной оси, второй — по вертикальной. Попробую предположить, что произшла дупликация всего участка, потом дупликация начального фрагмента, далее прозошла делеция, так как удвоенные фрагменты не до конца соответствуют Folate_carrier (сходство не по всей длине). Скорее всего, концевая часть Folate_carrier x 6 сохранила функцию переносчика фолата, а новые фрагменты начали специализироваться на чём-то похожем, так как видны участки делеций.
Выравнивание было проведено с помощью Jalview. Из общего числа последовательностей (full) были убраны те, которые сходны более, чем на 90%. В итоге из 2314 последовательностей осталось 139. Также были удалены участки до первой и после последней выровненных букв. С результатами можно ознакомиться по ссылке.
Было замечено, что практически во всех последовательностях в 112 колонке находится пролин, а в 116 — тирозин. Поэтому три колонки между ними были выбраны для разделения по группам. Результаты оказались интересны, поэтому в рассмотрение взято 5 групп. Каждая полученная группа имеет в 115 колонке треонин, но четвёртая и пятая группы в 114 колонке имеют глицин, в то время как у остальных групп там находится триптофан. Однако группы 4 и 5 различаются тем, что в 113 колонке у четвёртой группы находится изолейцин, а у пятой — валин. Первые три группы также различаются по 113 колонке: у первой группы там изолейцин, у второй — тирозин, у третьей — фенилаланин.
С помощью запроса:
database:(type:pfam pf01770)
из Uniprot были получены белки, принадлежащие рассматриваемому семейству. В итоге, составлена таблица, доступная по ссылке (колонки в таблице разделены табуляцией).