В качестве исследуемого я выбрал протеом собственно Acidithiobacillus ferrooxidans с ID UP000001362 так как он принадлежит наиболее близкому организму к выбранной мной бактерии и является референсным. Контрольным я выбрал протеом Acidithiobacillus caldus с ID UP000006135 по той причине, что организм из которого он получен относится к одному роду с исследуемой бактерией, однако живет в другом температурном диапазоне(40-45°C в отличие от 30°C характерного для Acidithiobacillus ferrooxidans) - он ближе к термофилам, нежели к мезофилам. У исследуемого протеома 212 из 3120 белков аннотированы в Swiss-prot, однако у референсного, как и у протеомов других родственных организмов нет аннотированых белков из Swiss-prot. Оценки BUSCO и CPD у обоих протеомов не вызывают опасений. Для скачивания файлов я воспользовался командами wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000001362)' -O UP000001362.swiss.gz и wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000006135)' -O UP000006135.swiss.gz
Для начала я сравнил протеомы(исследуемый/контрольный) по количеству трансмембранных белков(593/531), ферментов(521/539) и шаперонов(0/10) с помощью скрипта на python. Большее число шаперонов в контрольном протеоме может быть связано как раз с разным температурным оптимумом двух бактерий, так как именно шапероны занимаются "исправлением" денатурировавших белков, большее число которых образуется при более высокой температуре. Возможно, большую роль также играет неполная аннотированность протеома исследуемой бактерии, так как совсем шаперонов не может не быть, они нужны для нормальной укладки многих белков даже без теплового шока.
С помощью того же скрипта было посчитано количество дисульфидных связей и белков с ними в обоих протеомах. У референсного протеома оказалось меньше как белков с дисульфидными связями (8 против 9), так и самих дисульфидных связей (8 против 11)
Я предположил, что разница в количестве дисульфидных связей может быть связвна с разным количеством экскретируемых белков, так как в них чаще находятся дисульфидные связи из-за того, что внутри клетки восстановительная среда. Сравнив количество таких белков с помощью ещё одного скрипта, я убедился в том что для исследуемого протеома больше белков помечены как секретируемые(3 против 0). Далее, пользуясь другим скриптом, я проверил, имеют ли какие-то белки из секретируемых дисульфидные связи. Так и оказалось: все три белка, обнаруженных у исследуемого протеома содержат дисульфидные связи.