Локальный BLAST
Так как необходимо найти среди генов в сборке гомологи для белков, нам поможет TblastN и поиск по SwissProt белков из близких организмов
К сожалению, какие-либо аннотированные записи в UniProtKB отсутствуют вплоть до таксона Aphelida, поэтому пришлось брать записи из грибов. Запрос в UniProt:
taxonomy:"Fungi [4751]" existence:"Evidence at protein level [1]"
UniProt практически не оставил мне выбора: среди аннотированных записей оказались только белки из дрожжей
Я выбрал следующие белки:
- компонент TIM-переносчика (Q08749), осуществляет перенос через внутреннюю мембрану митохондрий;
- мевалонаткиназа (P07277), нужна для синтеза изопреноидов, в том числе стеролов;
- субъединица монополина (O13684), поддерживает сегрегацию хромосом в анафазе I мейоза.
Все обсуждаемые белки принадлежат дрожжам. Последовательности были получены через записи в UniProt > Format > FASTA (canonical) > Download
Для TblastN я использовал следующие параметры:
- db из X5.fasta
- query из последовательности белка
- db_gencode 6 (судя по странице таксона в NCBI генетический код слегка отличается)
- outfmt 7 (таблица)
Получились следующие выходные файлы для TIM-переносчика, мевалонаткиназы и монополина
Как видно из поля с e-value, у Amoeboaphelidium protococcarum присутствует хотя бы один гомолог TIM-переносчика (находки в скэффолдах 105 и 277) и мевалонаткиназы (находки в скэффолдах 359 и 463), однако отсутствуют гомологи монополина