Для изучаемой мной бактрении Salmonella typhimurium (strain LT2 / SGSC1412 / ATCC 700720) нашелся только 1 протеом, референсный и 100% чистый по BUSCO.
Proteomes · Salmonella typhimurium (strain LT2 / SGSC1412 / ATCC 700720).
Статус: Reference proteome.
Поиск: (organism_id:99287).
Протеом ID: UP000001014.
Количество протеомов: 4,533.
Изученность по Swiss-Prot: 1,818.
CPD: Standard.
BUSCO: C:100% (S:99.8% D:0.2%) F:0% M:0%.
Для контрольной группы я хотела взять родственный огранизм (относится к роду Salmonella), но они все оказались потагенными, и только у одного родственного организма (organism_id:59203) я нашла референсный белок, но его чистота по BUSKO C:76.6% (S:76.4% D:0.2%) F:14.1% M:9.3% оставляет желать лучшего, поэтому я решила взять протеом из Escherichia coli (strain K12)
Proteomes · Escherichia coli (strain K12).
Статус: Reference proteome.
Поиск: NOT (organism_id:99287).
Протеом ID: UP000000625.
Количество протеомов: 4,403.
Изученность по Swiss-Prot: 4,401.
CPD: Standard.
BUSCO: C:100% (S:99.3% D:0.7%) F:0% M:0%.
Для скачивание протеома в формате .gz я использовала в bash следующие команды:
1) Трансмембранные белки.
Поиск (E.coli): (proteome:UP000000625) AND (ft_transmem:*).
Итог: 955 ( Проверенные по Swiss-Prot: 955).
Поиск (Sallmonella): (proteome:UP000001014) AND (ft_transmem:*)
Итог: 969 ( Проверенные по Swiss-Prot: 310, не проверенные по TrEMBL: 659).
2) Фермент.
Поиск (E.coli): (proteome:UP000000625) AND (ec:*).
Итог: 1,699.
Поиск (Sallmonella): (proteome:UP000001014) AND (ec:*).
Итог: 1,395.
3) О-антигены ( Антигенная структура положена в основу современной серологической классификации бактерий рода Salmonella.Соматические О-антигены термоустойчивы и представляют собой липо-полисахариднополипептидные комплексы. О - Антиген используется для серотипирования E. coli.).
Поиск (E.coli): (proteome:UP000000625) AND (protein_name:O-antigen).
Итог: 3.
Поиск (Sallmonella): (proteome:UP000001014) AND (protein_name:O-antigen).
Итог: 6.
Мне стало истересно посмтореть, какие еще аминокислоты кроме метионина выполняют роль старт-кодонов ( задание было выполнено с помощью Python ). Фаста для E.Coli и Sallmonella была взята из Uniprot (Proteomas). Ссылка на фасту. Ссылка на фасту2.
Итог для Salmonella:
M 4533
Итог для E.coli:
M 4403
Ссылка на скрипт: здесь