Выравнивания. Часть2.

Задание 1. Карта локального сходства двух полипротеинов.

Карта построена для последовательностей двух полипротеинов: вируса полиомиелита (P03301) и вируса ящура (P03311)

Лучшее выравнивание на карте - длинная полоса в правом верхнем углу, второе выравнивание - предыдущая полоса. Остальные "полосы" имеют меньший вес, хотя некоторые из них и более длинные.

Identities Positives Length Gaps Score(bits)
29% 48% P03301: 615(27.6%); P03311: 644(27.8%) 59(8%) 252 bits(643)
37% 52% P03301: 277(12.5%); P03311: 263(11.3%) 26(9%) 159 bits(402)

Зная координаты хорошо выравнившихся участков (в первых двух выравниваниях на обоих белках), можно узнать (на сайте UniProt в разделе Molecule processing для данных белков), в какие вирусные белки транслируются данные участки. В моем случае это Protein 3CD(P03301), RNA-directed RNA polymerase 3D-POL (P03311) для первого выравнивания и Protein 2C(P03301), Protein 2C(P03311) для второго.

Задание 2. Сравнение веса выравнивания со случайным.

В этом задании белок MotA_EColi выравнивается локально с одним гомологичным ему белком (MotA_Bacsu) и одним негомологичным (KAD_Bacsu), затем строятся "случайные выравнивания" - выравнивания тех же пар, где последовательность второго белка перемешана. Такое случайное выравнивание строится 100 раз, рассчитывается медианный score, score верхнего квартиля, битовый вес и p-value.

Так как у негомологичных белков битовый вес получился отрицательным, р-значение было посчитано не по формуле, а как доля выравниваний с весом больше данного среди 100 случайных выравниваний.

пара белков ID1, ID2 вес выравнивания (S) медиана весов случайных выравниваний (M) верхний квартиль весов случайных выравниваний (Q1) вес в битах (B) p-value
гомологичные MOTA_ECOLI, MOTA_BACSU 240.5 47.0 52.5 36.2 1.2e-11
негомологичные MOTA_ECOLI, KAD_BACSU 28.0 35.75 39.0 -1.4 0.97

Задание 3. BLAST: поиск гомологов в банке.

Первые два гомолога (две лучшие находки) белка AAN68968.1, найденные в Swiss-Prot:

ID AC Organism Identities Positives gaps score score(bits) Expect Coverage
PHYB_NOSS1 Q9R6X3.1 Nostoc sp. PCC 7120 35% 54% 18(3%) 309 bits(792) 309 bits(792) 3e-92 61%
BPHY_PSEAE Q9HWR3.1 Pseudomonas aeruginosa PAO1 36% 52% 27(4%) 289 bits(739) 289 bits(739) 8e-85 61%

Вернуться на главную

Вернуться на страницу семестра


© potapenko 2017-2018