На главную второго семестра    На главную

Создание паттернов для поиска и распознавания аминокислотных последовательностей

Вравнивание предполагаемых ортологов белка BioA_ECOLI

                                 
                      *              
BIOA_ECOLI : CVFLADSGSVAVEVAMKMA : 19
BIOA_AQUAE : KVFYSEDGAEAVEIAIKMA : 19
BIOA_METJA : KVFYSEDGAEAVEIAIKMA : 19
BIOA_BACSH : KVFFADNGSSAIEVALKMS : 19
BIOA_HELPY : KCFYADNGSSCVEIALKMS : 19
BIOA_HELPJ : KCFYADNGSSCIEIALKMS : 19
             k F    G   6E6A6KM      

Поиск выбранных предполагаемых ортологов по различным паттернам

Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из Вашего выравнивания найдены?
Фрагмент последовательности
CVFLADSGSVAVEVAMKMA
1 Не найдены 5 последовательностей (всё кроме исходной последовательности белка BioA_ECOLI)
Сильный
[KC]-[VC]-F-[FYL]-[SA]-[DE]-[NDS]-G-[SA]-[SEV]-[AC]-[VI]-E-[IV]-A-[ILM]-K-M-[SA]
6 Найдены все белки и только они
Слабый
F-X-[SA]-[DE]-X-G-[SA]-X-[AC]-[VI]-E-[IV]-A-X-K-M-[SA]
8 Найдены все 5 "ортологов" и сам белок BioA_ECOLI. Помимо этого найдены еще белки BIOA_HAEIN и BIOA_YEAST
Слабый
F-X(4)-G-[SA]-X-{FY}-[VI]-E
199 Найдены все 5 "ортологов" и сам белок BioA_ECOLI. Помимо этого найдено множество других белков

"Сильный" паттерн составлялся описанием каждой позиции множественного выравнивыния. Первый "слабый" паттерн был составлен путём упрощения "сильного". Первый "слабый" оказался не достаточно "слабым" (найдено было всего 8 белков). После чего был составлен второй "слабый" паттерн, который претерпел еще большее упрощение. Он уже оказался достаточно "слабым", найдено было 199 белков.


©Dzhanibekova Anastasia