Учебный сайт Птицыной Елены

Cтудентки первого курса факультета биоинженерии и биоинформатики Московского государственного университета имени М.В. Ломоносова

Семестр 2, практикум 11

Назад на учебную страницу Птицыной Елены

Выравнивание

На этом практикуме мы продолжили знакомство с выравниваниванием последовательностей. Различают эволюционное (правильное) и оптимальное выравнивание. Эволюционное выравнивание - запись, отражающая ход эволюции (то есть для гомологичных последовательностей в 1 столбце выравнивания стоят потомки 1 нуклеотида/аминокислоты общего предка). Оптимальное выравнивание - выравнивание, имеющее наибольший вес (score, это количественный критерий) и имеющее биологический смысл. Третье понимание правильного выравнивания - функциональное выравнивание, при котором сопоставляются функционально идентичные части белков.

Задание 1

С помощью команд needle и water мы провели выравнивание пар гомологичных и негомологичных белков. Оказалось, что веса выравниваний выше у выравниваний гомологичных белков. Процентное содержание одинаковых аминокислот у гомологичных белков приближается к 70-80%, тогда как у негомологичных это значение намного меньше. То же можно сказать о процентном содержании сходных по свойствам аминокислот.

Скачать: таблица

Команды, нужные для получения информации в таблице

infoseq 'sw:*_PINSI' -only -name -length -out PINSI.txt

infoseq 'sw:*_PINTH' -only -name -length -out PINTH.txt

needle sw:matk_pinsi sw:matk_pinth matk.needle -auto

water sw:matk_pinsi sw:matk_pinth matk.water -auto

entret sw:matk_pinsi stdout -auto | grep ^DE

entret sw:matk_pinth stdout -auto | grep ^DE

entret sw:matk_pinsi stdout -auto | grep ^ID

entret sw:matk_pinth stdout -auto | grep ^ID

Задание 2

Сначала мы построили множественное выравнивание 5 последовательностей белка матуратазы K. Последовательности относились к растениям:

Название Размер Организм
MATK_CANOD 507 Cananga odorata (Ylang-ylang tree) (Uvaria odorata) Кананга семейства Анноновые (Annonaceae).
MATK_EMPNI 506 Empetrum nigrum (Black crowberry) Водяника черная семейства Вересковые (Ericaceae)
MATK_ULMPA 505 Ulmus parvifolia (Chinese elm) (Ulmus sieboldii) Вяз мелколистный семейства Вязовые (Ulmaceae).
MATK_BARVU 504 Barbarea vulgaris (Yellow rocket) (Erysimum barbarea) Сурепка обыкновенная семейства Капустные (Brassicaceae)
MATK_LIQFO 503 Liquidambar formosana (Formosan gum) Ликвидамбар семейства Алтингиевые
Скачать: множественное выравнивание 5 гомологичных белков

Некоторые найденные отличия между тремя способами выравнивания 2 последовательностей (множественное с помощью TCoffee в Jalview, дополнительно проведенные для выбранной пары последовательностей парное глобальное и парное локальное) представлены на иллюстрациях. В целом, больше похожи множественное и глобальное парное выравнивания. Различные программы, выполняющие множественное выравнивание, могут использовать алгоритмы парного выравнивания как глобальные, так и локальные. Чаще всего используют все-таки эвристические алгоритмы, так как глобальное выравнивание может занимать слишком много времени. Использованная программа Tcoffee пользуется так называемым прогрессивным выравниванием, разработанным Paulien Hogeweg and Ben Hesper в 1984 году. К сожалению, прогрессивное выравнивание все-таки не гарантирует получение глобального оптимального выравнивания. Иллюстрация 1
Иллюстрация 2
Иллюстрация 3
Скачать: сравнение выравниваний