С помощью SRS
из UniProt получили 11 последовательностей рибосомального белка S10 из митохондрий разных
эукариот. Для этого осуществили запрос: [uniprot-AllText:S10*] & [uniprot-Description:28S*].
Определили доменную структуру найденных белков на примере последовательности RT10_HUMAN из митохондрий человека:
Таблица. Описание доменной структуры.
Построили выравнивание полных последовательностей найденных белков с помощью программы muscle на kodomo-count и
сравнили с выравниванием из PFAM в GeneDoc:
Исходя из полученных данных (файл Genedoc) и с учетом того, что при извлечении выравнивания
необходимых доменов не были обнаружены 4ре из них, можно сделать вывод, что выравнивание muscle вполне удачно и не требует последующей работы с
программой mafft.
2. Краткое описание и сравнение простого и нормированного профилей.
При помощи команды pfw -m out.ali > out.weighted.ali в выравнивание полных последовательностей добавили веса.
Построили профиль (pfmake -m out.weighted.ali /usr/share/pftools23/blosum45.cmp > myprofile.prf ) с последующей его нормировкой относительно случайной базы
(autoscale -m myprofile.prf > myprofile.scaled.prf).
Оказалось, простой и нормированный профили отличаются значениями SCORE в поле MA (CUT_OFF) и R1/R2 в поле MA (NORMALIZATION), где R1 и R2 - коэффиценты функции нормирования.
3. Обоснование выбора порога.
С помощью программы pfsearch пакета PFTOOLS провели поиск гомологичных белков в альфа-
и гаммапротеобактерий с использованием нормированного варианта профиля.
Таблица. Результаты поиска по двум группам бактерий с разными значениями порога. Исходя из данных таблицы, видно, что пороговое значение 8,0 обеспечивает нахождение гомологичных последовательностей, все из которых имеют пометку GO в описании, а значит,
может быть оптимально для поиска по профилю.
4. Распределение нормированных весов находок в протеомах 2-х групп бактерий.
Результат поиска по нормированному профилю с порогом 8,0 в протеоме альфапротеобактерий - alpha8.search, гаммапротебактерий - gamma8.search.
Гистограмма. Распределение весов находок в альфа- и гаммапротеобактериях (Excel-файл).
5. Тест Вилкоксона.
С помощью пакета STADIA провели тест Вилкоксона на сравнение распределений весов находок в двух группах бактерий.
Результаты теста говорят о различии между медианами выборок. Для получения дополнительной информации воспользовались функцией "Описательная статистика".
Получили, что медиана альфапротеобактерий правее гаммапротеобактерий. Это свидетельствует о том, что альфапротеобактерии ближе к рибосомальным белкам из митохондрий эукариот.
Создали внешнюю группу из 7-ти последовательностей рибосомальных белков из Firmicutes, имеющих то же название, что и заданнй белок.
Также получили файлы с последовательностями из альфа- и гаммапротеобактерий, отобранными ранее с выбранным порогом.
Таблица. Описание выборки.
После посторили объединенное выравнивание митохондриальных белков и белков из рибосом альфапротеобактерий, гаммапротеобактерий и фирмикут.
Методом максимального правдоподобия (phylip proml) было построено филогенетическое дерево:
Увеличенный фрагмент для большей ясности:
По данному филогенетическому дереву сложно сделать вывод о происхождении рибосомальных белков эукариот.
С помощью команды phylip protdist определелили попарные эволюционные расстояния по JTT и
построили гистограмму распределения попарных расстояний между митохондриальными белками и белками из альфа- и гаммапротеобактерий (Excel-файл):
Из гистограммы видно, что медиана распределения в случае альфапротеобактерий меньше, чем гаммапротеобактерий. Это свидетельствует о том, что
попарное эволюционное расстояние наименьшее в случае митохондрий и альфапротеобактерий.
В результате исследования распределения весов находок в протеоме 2-х групп бактерий и определения попарных эволюционных расстояний с учетом того, что реконструкция филогенетического дерева не дала результатов, можно сделать вывод о том, что рибосомальные белки из альфапротеобактерий ближе к белкам эукариот
.
Находок среди гаммапротеобактерий вдвое больше, чем среди гаммапротеобактерий. По этой причине имеет смысл не учитывать абсолютное количество найденных
гомологов, а рассмотреть формы полученных графиков распределения.
Из гистограммы видно, распределение для альфапротеобактерий ближе к нормальному, кроме того, его медиана визуально больше, чем у распределения для гаммапротеобактерий.
Это позволяет сделать промежуточный вывод о том, что последовательности из протеома альфапротеобактерий несколько ближе к исследуемому профилю.
II. Филогенетический анализ рибосомальных белков S10 из эукариотических митохондрий и 3-х групп бактерий
III. Резюме