Учебный сайт Полины Байкузиной

Главная Семестры О себе Ссылки

PSI-BLAST

Задание 1.

Для последовательности белка NAD-dependent epimerase/dehydratase из организма археи Desulfurococcus kamchatkensis 1221n было составлено семейтсво гомологов при помощи PSI-BLAST. Поиск был произведен по банку SwissProt. При стандартном параметре порога E-value, равного 0.005, не удалось стабилизировать результат. Семейство данного белка, по-видимому, очень большое. Значение порога E-value было взято 1e-20. Всего было выполнено 8 итераций.

  • 1 итерация: 75 находок.
    • Лучшая находка: Sequence ID: sp|Q57664.1|GALE_METJA; Score: 190 bits; E-value: 6e-56.
    • Худшая находка: Sequence ID: sp|B0M3E8.2|UGE1_PEA; Score: 94.4 bits; E-value: 9e-21.
  • 2 итерация: 398 находок (323 новых).
    • Лучшая находка: Sequence ID: sp|Q9SN58.3|UGE5_ARATH; Score: 362 bits; E-value: 2e-122.
    • Худшая находка: Sequence ID: sp|Q5IFP1.3|3BHS_CANFA; Score: 94.6 bits; E-value: 8e-21.
  • 3 итерация: 465 находок (67 новых).
    • Лучшая находка: Sequence ID: sp|Q9T0A7.1|UGE2_ARATH; Score: 330 bits; E-value: 6e-110.
    • Худшая находка: Sequence ID: sp|P65685.1|Y2073_MYCBO; Score 97.6 bits; E-value: 7e-21.
  • 4 итерация: 485 находок (20 новых).
    • Лучшая находка: Sequence ID: sp|Q8VDR7.2|TGDS_MOUSE; Score: 335 bits; E-value: 7e-112.
    • Худшая находка: Sequence ID: sp|Q75BB3.2|LYS2_ASHGO; Score: 97.5 bits; E-value: 9e-21.
  • 5 итерация: 501 находка (16 новых).
    • Лучшая находка: Sequence ID: sp|Q8VDR7.2|TGDS_MOUSE; Score: 334 bits; E-value: 4e-111.
    • Худшая находка: Sequence ID: sp|P40976.3|LYS2_SCHPO; Score: 98.3 bits; E-value: 5e-21.
  • 6 итерация: 514 находок (13 новых).
    • Лучшая находка: Sequence ID: sp|Q8VDR7.2|TGDS_MOUSE; Score: 327 bits; E-value: 2e-108.
    • Худшая находка: Sequence ID: sp|A1ZAI3.2|FACR2_DROME; Score: 96.4 bits; E-value: 9e-21.
  • 7 итерация: 529 находок (15 новых).
    • Лучшая находка: Sequence ID: sp|Q8VDR7.2|TGDS_MOUSE; Score: 326 bits; E-value: 4e-108.
    • Худшая находка: Sequence ID: sp|Q8H124.1|Y2446_ARATH; Score: 93.7 bits; E-value: 9e-21.
  • 8 итерация: 533 находки (4 новых).
    • Лучшая находка: Sequence ID: sp|Q8VDR7.2|TGDS_MOUSE; Score: 326 bits; E-value: 4e-108.
    • Худшая находка: Sequence ID: sp|Q960W6.1|FACR3_DROME; Score: 98.3 bits; E-value: 2e-21.

Полученные последовательности в fasta-формате.

Задание 3.

Было построено множественное выравнивание полученных 533 находок на сервере кодомо с помощью программы muscle (команда: muscle -in seqdump.fasta -out pr12.fasta). Полученное выравнивание представлено здесь.

Задание 4.

При помощи опции Remove redundancy были выбраны 12 последовательностей, гомологичные по всей длине (query cover больше 80%). E-value значительно меньше 1e-3. Список данных последовательностей представлен здесь. По данным последовательностям было построено множественное выравнивание в JalView. Выравнивание в fasta-формате.

Задание 5.

При помощи программы mafft было построено множественное выравнивание тех же последовательностей. Была использована команда: mafft seq.fasta > seq1.fasta. Полученное выравнивание в fasta-формате.

Задание 6.

Было проведено сравнение выравниваний. Для этого при помощи программы muscle было построено выравнивание двух выравниваний (команда: muscle -profile -in1 new.fasta -in2 seq1.fasta -out both.fasta). Полученное выравнивание в fasta-формате.

Точных участков совпадения найдено не было. Но есть довольно схожие участки, отмеченные знаком "+".

Ссылка на проект в формате .jvp.


© Полина Байкузина, 2014