Протеомы и EMBOSS

Поиск протеома

Для того, чтобы найти протеом в базе данных UniProt, нам нужен идентификатор геномной сборки INSDC из таблицы локальных особенностей.

Скачивание референсного протеома

Для скачивания протеома был сформирован URL:

https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000061839)

При помощи этого URL и команды wget, мы получаем файл UP000061839.swiss.gz

Оценка количества белков, содержащих альфа-спирали, и ферментов

script
Рис.1 Скрипт для подсчета количества записей с упоминание трансмембранного участка и выдача скрипта
script
Рис.2 Скрипт для подсчета количества записей с упоминанием альфа спиралей и выдача скрипта
Было получено 600 записей с трансмембранными участками и 0 с альфа-сприалями. Скорее всего альфа-спирали в рассматриваемых белках являются трансмембранными и записаны как трансмембранные участки. Скрипты в Colab

Для того, чтобы оценить количество ферментов в протеоме можно воспользоваться продвинутым поиском в UniProtKB.

В первом запросе ищутся записи с упоминанием какого-либо ферментативного класса в поле Keyword, а во втором упомянание enzyme в поле CC. Результат по первому запросу точнее, так как указывается определенный тип ферментативной активности.