Выбранный в прошлом практикуме организм – Жаба обыкновенная (Bufo Bufo). В файле protein.faa по ключевой фразе ATP synthase subunit delta. Идентификатор белка: XP_040273498.1. Фрагмент с ним был скопирован из protein.faa и сохранен в формате FASTA в файле ATPase-delta.fasta
Идентификатор нуклеотидной записи был найден в файле последовательности генома с аннотацией (GBFF) путем последовательного использования поиска по идентификатору белка, а затем по поиску вверх строчки LOCUS. Идентификатор нуклеотидной записи: NC_053390
Последовательность ДНК, содержащая кодирующую белок часть, была получена в геномном браузере.
Информация:
| Идентификатор белка | XP_040273498.1 |
|---|---|
| Идентификатор нуклеотидной записи | NC_053390.1 |
| Начало CDS | 451785718 |
| Конец CDS | 451807593 |
| Цепь | обратная |
| Файл с CDS | NC_053390.1_451786718-451807593.fasta |
Поскольку Bufo Bufo относится к вторичноротым, для поиска BLAST было выбрано семесйство Пчёлы (Apoidea; первичноротые). BLAST проводился по базе данных RefSeq Genome Database (refseq_genomes). На вход подавалась нуклеотидная последовательность экзома, который был найден через запись о белке XP_040273498.1.
При параметрах по умолчанию (word size 11, expect treshhold 0.05) результатов не было, как и при снижении размера слова до 7. При повышении expect treshold до 10 выдается 11 результатов, однако у всех e-value превышает 1.1. Вывод: использовать blastn (а тем более и megablast) для поиска гомологов между удаленными группами организмов нецелесообразно.
Было получено 38 результатов с e-value достаточно малых порядков (1e-18 и ниже). Дописать описание. Текстовый дескрипшин уже в папке прака