Второй семестр

Поиск по паттерну в банке Swiss-Prot.

  1. С помощью программы blastp нашла в банке Swiss-Prot предпологаемые гомологи монго белка. Из них выбрала 4–5 наиболее вероятных ортологов (в первом приближении считала признаком ортологичности cовпадение названий белков из разных организмов), с процентом идентичности в диапазоне 40-80% , с E-value находки не хуже 0,001).
  2. Получила файл с последовательностями моего белка и всех отобранных ортологов в формате FASTA.
  3. С помощью программы muscle построила множественное выравнивание моего белка и его "ортологов". Импортировала его в GeneDoc. Выберала консервативный фрагмент выравнивания длиной 19 а.о. для дальнейшего исследования.
    Фрагмент, по которому создавались паттерны:
                                                                               
                                                *                              
    D P O 3 X _ H A E I   :   V S G R K D L S N A P N R R I G A E M   :     1 9
    D P O 3 X _ B U C B   :   L L G K K E L H I A P D Q K I S I E M   :     1 9
    D P O 3 X _ E C O L   :   L I G R K E L P Y A P D R R M G V E M   :     1 9
    D P O 3 X _ B U C A   :   L N G R K E L K F A P S Q K I G V E M   :     1 9
    D P O 3 X _ B U C A   :   L K G R K E L F F S P N H K M G V E M   :     1 9
                                  G   K   L       P             E M            
  4. Создала паттерны.
    Первый паттерн в точности является фрагментом последовательности моего белка.
    Второй ("сильный") паттерн построен так, чтобы он распознавал только все белки моей выборки.
    Третий ("слабый") паттерн создан на основе второго, сделав требования к последовательности более мягкими.
  5. Провела поиск последовательностей банка Swiss-Prot, включающих мотивы, соответствующие каждому из полученных паттернов.

    Сравнение результатов поиска последовательностей по разным паттернам.

    Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из Вашего выравнивания найдены?
    Фрагмент последовательности   LIGRKELPYAPDRRMGVEM  1  Найдена только последовательность моего белка (DPO3X_ECOLI)
    Сильный  [LV]-[ISLNK]-G-[RK]-K-[ED]-L-[PSKFH]-[YINF]-[AS]-P-[NSD]-[RQH]-[RK]-[MI]-[GS]-[VAI]-E-M  5  Найдены все последовательности из моего выравнивания
    Слабый  {IAKRM}-[ISLNK]-G-X-K-{NQ}-L-[PSKFH]-X-[AS]-P-[NSD]-X-[RK]-[MI]-[GS]-[VAI]-E-M  6  Найдены все последовательности из моего выравнивания

    ©Лавыш Дарья