Учебная страница курса биоинформатики,
год поступления 2019
Указания к заданиям занятия 4
Для поиска BLAST'ом нужно сначала проиндексировать последовательности. Программа makeblastdb принимает на вход файл в fasta-формате и создаёт индексные файлы. Наберите makeblastdb -help, чтобы посмотреть список опций. Не забудьте про опцию -dbtype prot. Совет: чтобы не запускать BLAST много раз, разумно создать объединённый файл с протеомами нужных бактерий. Для создания такого файла можно воспользоваться командой вида:
cat file1 >> file2
которая добавляет содержимое файла file1 в конец файла file2.
Поиск программой blastp с опцией -evalue 0.001 (другие нужные опции: -query, -db, -out, читайте выдачу blastp -help).
Чтобы добыть последовательности найденных белков, создайте в редакторе list-файл (например, myprots.list) со строками вида:
... proteomes.fasta:P12345 ...
где proteomes.fasta — файл с протеомами ваших бактерий, а P12345 — AC (или ID) найденных белков. После этого команда
seqret @myprots.list myprots.fasta
достанет нужные белки и поместит их в файл myprots.fasta. Альтернативный способ: зайти на сайт Uniprot, выбрать Retrieve и внести в окошко список AC или ID, затем скачать найденные последовательности.
- Перед тем, как импортировать последовательности в MEGA, нужно отредактировать их аннотации, оставив в именах только ID и убрав описания. Если этого не сделать, на дереве будут полные описания, что некрасиво и неудобно.
Можно импортировать последовательности в MEGA методом Align и затем вызвать программу выравнивания, а можно сначала выровнять (на kodomo имеется четыре программы множественного выравнивания: muscle, mafft, prank и edialign), а потом импортировать выравнивание методом Analyze. В первом случае нужно будет после получения выравнивания ещё вызвать "Phylogenetic analysis" из меню "Data" окошка с выравниванием. Вместо MEGA можно использовать NGPhylogeny (рекомендую "a la carte", там FastME и без "Alignment curation")
Для визуализации дерева можно использовать MEGA или FigTree (установлены в компьютерных классах) или онлайн-сервис iTOL (на заглавной странице ищите кнопку "Upload a tree"). Обратите внимание, что MEGA показывает реконструированное ею дерево укоренённым в среднюю точку, но выдаёт формулу в формате Newick без укоренения, с трихотомией в узле, выбранном для условного корня. Поэтому если вы экспортировали дерево из MEGA и импортировали в FigTree или iTOL, сначала переукорените его каким-нибудь разумным образом (в FigTree для этого нужно выделить ветвь и нажать кнопку Reroot, в iTOL — ткнуть мышью в узел ниже ветви и найти нужный пункт в открывшемся меню).