EMBOSS, Entrez Direct, NCBI Datasets
Выбор протеома Citrobacter tructae
ID: UP000001889
Причина выбора: Протеом содержит полный набор белковых последовательностей организма Citrobacter tructae, что позволяет проводить комплексный биоинформатический анализ.
Подробнее о выборе протеомаПолучение AC геномной сборки и TaxID организма
Proteom ID: UP000001889
NCBI RefSeq assembly: GCF_000027085.1
GenBank assembly: GCA_000027085.1
Taxon ID: 637910
Proteom ID: UP000001889NCBI RefSeq assembly: GCF_000027085.1
GenBank assembly: GCA_000027085.1
Taxon ID: 637910
Скачивание последовательности генома и таблицы локальных особенностей
Для получения последовательности генома в формате FASTA и таблицы локальных особенностей в формате GFF3 использована команда:
Файл распакован командой:
Получены файлы:
GCF_000027085.1_ASM2708v1_genomic.fna
Поиск и трансляция открытых рамок считывания
Для получения информации о генетическом коде организма использована команда:
Просмотр файла:
В поле GeneticCode указано, что используется 11 вариант генетического кода.
Получение открытых рамок считывания:
Создание белковой базы данных:
Проверка минимальной длины последовательностей:
Получение последовательностей гомологичных метилтрансфераз
Для получения последовательностей ДНК-метилтрансфераз с кодами P0AED9, P0AEE8, и P23941 использован конвейер:
Поиск по сходству последовательностей
Локальный поиск BLASTP по базе proteome:
Результаты поиска: blast.txt
Выбрана лучшая находка: m6A DMA_ECOLI P0AEE8 DNA adenine methylase
Название рамки: NC_013716.1_21821
Координаты: 4691263 - 4692156
Вес: 498 бит, E-value: 0
Сомнений в гомологичности нет, т.к. E-value составило 0, а идентичность составила 86%.(очень большая вероятность гомолога)
Поиск соседних CDS в таблице локальных особенностей:
Найдено 6 CDS на + цепи, одна из которых пересекается с найденной ORF и кодирует adenine-specific DNA-methyltransferase. (ORF в файле имеет координаты 4691263-4692156, а пересекающий CDS 4691323-4692159, координаты практически совпадают)
Поиск по аннотациям кодирующих участков
Поиск CDS по EC-коду фермента ДНК-метилтрансферазы (2.1.1.72):
Найдено 4 белка, включая WP_012908365.1, который соответствует найденной открытой рамке считывания.