Базы данных


STRING


Для анализа был выдан следующий список белков. Проанализировать этот список было решено в базе данных STRING. На вход были поданы ID белков, а также, что это Homo sapiens. Сервис выдал следующий результат (на рисуночке 1).

Результат - карта "взаимоотношений" белков. На карте можно нажать на любую связь между белками и увидеть сведения о каждом из них, а также каким образом они друг с другом связаны. Можно заметить, что 3D-структура существует для всех белков (молекулы в шариках...). Также есть возможность повысить минимальный interaction score, чтобы наблюдать самые явные связи белков. Можно выделить каждый вид связи и рассмотреть его на карте отдельно.

Попытка поиграться с interaction score и разными связями закончилась неудачно (как показалось, нет ничего достойного для упоминания в отчете). Однако есть раздел Analysis, в котором действительно много полезной информации: он указывает на какие-либо молекулярные пути / функции / компоненты - всего, что имеет какой-то определенный набор белков, и он указывает, сколько поданных на вход белков входит в этот сет. Например, белки APOC1, APOC2, APOC3 входят в путь негативной регуляции липопротеинов очень низкой плотности. Как можно заметить, самые верхние позиции по биологическим процессам занимают пути, связанные с мембранами (хиломикроны, липопротеины, перемещение фосфолипидов...). Также стабильно несколько белков являются частицами липопротеинов (APO*).


Рисунок 1. Карта взаимодействий белков из списка

Рисунок 2. Верхние позиции в таблице биологических процессов, в которые могут быть включены белки. Сотрировка по силе (log10(obs/exp))

Рисунок 3. Распространенность белков. Чем темнее, тем более схожа последовательность
Рисунок 5. Коэкспрессия белков

Также есть возможность посмотреть "совместное появление" белков в разных организмах (первичное дерево - рисунок 3). Видно, что особенно часто встречаются все белки у опистоконт, но часть белков, например, тиоредоксин, встречается во всех кладах. При более детальном рассмотрении клады Opisthokonta заметно, что больше всего эта группа встречается у приматов и грызунов...интересно......... Высокая встречаемость уже наблюдается у клады Mammalia. У архей очень редко встречаются эти белки, реже, чем у бактерий.

Рисунок 4. Распространенность белков (опистоконты)

Далее была рассмотрена коэкспрессия белков (рисунок 5). Из графика видна связь между F2, APOB, ALB, APOA1, FGA, APOC3 в организме человека, чего не скажешь про другие организмы. Самой яркой коэкспрессией в них является APOA1, APOC1. И все...

Красивая база данных. Даже можно покопаться в ней...


GO


Тот же список белков был подан на вход на сервисе GO. Результат выдает биологические процессы, в которых могут участвовать эти белки (рисунок 6). Вторая колонка показывает общее число белков, которые задействованы в этой процессе, третья колонка показывает, сколько поданных белков в ней участвует. Четвертая колонка - ожидаемое число белков в нашем списке из этого процесса (вероятность считается как общее число белков, разделенное на число белков, участвующее в этом процессе). Следующая колонка - Fold Enrichment, наблюдаемое число, деленное на ожидаемое. Далее идет колонка, отображающая, overrepresented или underrepresented наш процесс. Последняя - P-Value.

Из данных можно сделать вывод (который уже был сделан по STRING), что часть белков участвует в регуляции липопротеинов. В частности, в плазме крови. Также они участвуют в регуляции транспорта липидов через ГЭБ (это все APOE). Можно нажать на любой из процессов, будет выдана более детальная информация о том, что там вообще происходит, какие белки в этом участвуют, есть ссылочки на другие базы данных.

Рисунок 6. Таблица результатов работы GO (верхняя часть)

The Human Protein Altas


Рисунок 7. Страница об APOE на THPA

После предыдущих исследований стало интересно узнать побольше о белке APOE. The Human Protein Altas содержит очень много красивых картинок, поэтому закончить исследование баз данных стоит на нем (на красивом).

Эта база данных дает нам следующую информацию об APOE (рисунок 7). Белок участвует в транспорте липидов через плазму и интерстициальную жидкость. В целом он является регулятором уровня липопротеинов различных плотностей (в печени в большинстве случаев). Он крут. По каждому разделу можно более подробно рассмотреть его экспрессию, патологии и т.п....