Учебная страница курса биоинформатики,
год поступления 2018
Подсказки по заданиям. Практикума 12. BLAST
Все задания выполняйте на сайте NCBI с помощью программы BLAST, точнее, её разновидности BLASTp - поиск последовательности белка в БД белковых последовательностей.
Сайт найдете указав в поисковике NCBI BLAST
Подсказки к Заданию 1 - Найти гомологов вашего белка в БД Swissprot
- Обязательно измените ограничение на число находок со 100 на 20000
Выбор того, с какими другими параметрами запустить BLAST первый раз - за вами
- В описании параметров назовите параметр и опишите его смысл. И так для каждого, даже если вы не меняли значение параметра.
Автоматический зачет темы BLAST на коллоквиуме может быть получен, если ответы демонстрируют понимание. Формально правильные заимствования откуда-то или переводы не прокатят
- Сохранение таблицы с результатами
Вверху списка находок Download > Hit table (text). Откройте и сохраните в Excel.
- Вставьте названия колонок таблицы, они приведены в файле
- Выбор последовательностей из списка
- Выберите в основном гомологичные белки, судя по показателям, с хорошим покрытием (coverage %), но РАЗНООБРАЗНЫЕ по E-value и названиям белков. Для сравнения добавьте один
- два белка с высоким E-value, предположительно негомологичные вашему.
- Учитывайте E-value, названия белков - интересно брать белки с разными названиями, - покрытие , чем больше, тем интереснее
- Построение выравнивания выбранных (и отмеченных галочками) последовательностей
Download > Fasta (complete sequences) Файл XXXXXXX_hits.fasta
- Открыть файл в Jalview
Выровнять Web Services > Alignment, выберите программу, параметры по умолчанию (default)
- Удаление вероятно негомологичных последовательностей
- Покрасьте выравнивание ClustalX или BLOSUM62
Выберите Color > Above identity
threshold; варьируйте от 100% до 90%
Подтверждением гомологичности ВСЕХ последовательностей считаем участок выравнивания
- начинающийся и заканчивающийся абсолютно (100%) консервативной позицией
- длиной более 6 колонок
- без колонок с гэпами
в котором высокая плотность консервативных позиций
Я отредактирую подсказки по этому заданию. Сегодня (1 мая) не успел.
Подсказки к Заданию 2. Опишите крупные перестановки в полипротеинах двух пикорнавирусов вируса --- полиомиелита и вируса ящура
- Построение карты сходства
- На странице BLASTp найдите и отметьте опцию Align two or more sequences
- На странице c результатом карта называется Dot Matrix.
Подсказки к Заданию 3.Игры с BLAST
- Что интересного в игре с не-белковой последовательностью.
- Есть ли "хорошие" находки в Swissprot, какие минимальные значения E-value, при каких значениях параметров.
- Берите достаточно длинные последовательности
- Не используйте "Automatically adjust parameters for short input sequence"
- Есть ли "хорошие" находки в Swissprot, какие минимальные значения E-value, при каких значениях параметров.
- Игра со своей последовательностью. Посмотрите и напишите как сказываются изменения параметров на результате - числе находок и значениях E-value
Результаты могут приняты для автомата по теме BLAST на коллоквиуме, наряду с результатами задания 1