EMBOSS
Программа getorf
Просмотреть файл d89965.entret
(получен в программе entret командой entret embl:d89965 -auto
)
Просмотреть файл d89965.orf
(получен в программе getorf командой getorf d89965.entret -minsize 90 -find 1
)
Просмотреть файл BAA14040.fasta
(ATP-dependent protease subunit HslV из Escherichia coli (strain K12))
В файле d89965.orf приведены пять открытых рамок считывания, найденных программой getorf в файле d89965.entret и удовлетворяющих условиям: длина белка не менее 30 аминокислот, начинаются старт-кодоном и заканчиваются стоп-кодоном. Третья найденная открытая рамка считывания соответствует рамке, приведённой в записи EMBL. Продукт: RSS-белок Rattus norvegicus.
Однако по Accession, на который ссылается запись EMBL, в UniProt находится ATP-dependent protease subunit HslV из Escherichia coli (strain K12). Для прояснения ситуации был проведён парный blastp для ATP-dependent protease subunit HslV из Escherichia coli (strain K12) и продукта пятой (самой длинной) открытой рамки считывания, найденной программой getorf. Результатом работы blastp оказалось парное выравнивание с идентичностью 100%, только продукт пятой открытой рамки считывания покрывает ATP-dependent protease subunit HslV из Escherichia coli (strain K12) на 55%. Вероятно, при выделении RSS-белка из Rattus norvegicus, ошибочно был выделен фрагмент ATP-dependent protease subunit HslV из Escherichia coli (strain K12) и аннотирован как новый белок Rattus norvegicus.
Файлы-списки
Просмотреть файл adh.fasta
(получен в программе seqret командой seqret sw:adh*_* adh.fasta
)
Просмотреть файл adh.infoseq
(получен в программе infoseq командой infoseq adh.fasta -only -usa -out adh.infoseq
)
Просмотреть файл organisms.txt
Просмотреть файл adh_organisms.infoseq
(получен командой grep -f organisms.txt adh.infoseq > adh_organisms.infoseq
)
Просмотреть файл adh_organisms.fasta
(получен командой seqret @adh_organisms.infoseq adh_organisms.fasta
)