Учебная страница курса биоинформатики,
год поступления 2018
Подсказки к заданию 4
Для поиска BLAST'ом нужно сначала проиндексировать последовательности. Программа makeblastdb принмает на вход файл в fasta-формате и создаёт индексные файлы. Наберите makeblastdb -help, чтобы посмотреть список опций. Не забудьте про опцию -dbtype prot. Совет: чтобы не запускать BLAST много раз, разумно создать объединённый файл с протеомами нужных бактерий. Для создания такого файла можно воспользоваться командой вида:
cat file1 >> file2
которая добавляет содержимое файла file1 в конец файла file2.
Поиск программой blastp с опцией -evalue 0.001 (другие нужные опции: -query, -db, -out, читайте выдачу blastp -help).
- Чтобы добыть последовательности найденных белков, создайте list-файл со строками вида:
proteomes.fasta:P12345
где proteomes.fasta — файл с протеомами ваших бактерий, а P12345 — AC (или ID) найденных белков. Альтернативный способ: зайти на сайт Uniprot, выбрать Retrieve и внести в окошко список AC или ID, затем скачать найденные последовательности.
- Перед тем, как импортировать последовательности в MEGA, нужно отредактировать их аннотации, оставив в именах только ID и убрав описания. Если этого не сделать, на дереве будут полные описания, что некрасиво и неудобно.
Можно импортировать последовательности в MEGA методом Align и затем вызвать программу выравнивания, а можно сначала выровнять (на kodomo имеется четыре программы множественного выравнивания: muscle, mafft, prank и edialign), а потом импортировать выравнивание методом Analyze. В первом случае нужно будет после получения выравнивания ещё вызвать "Phylogenetic analysis" из меню "Data" окошка с выравниванием.
Для визуализации дерева можно использовать MEGA или FigTree (установлены в компьютерных классах) или онлайн-сервис iTOL (на заглавной странице ищите кнопку "Upload a tree"). Обратите внимение, что MEGA показывает реконструированное ею дерево укоренённым в среднюю точку, но выдаёт формулу в формате Newick без укоренения, с трихотомией в узле, выбранном для условного корня. Поэтому если вы экспортировали дерево из MEGA и импортировали в FigTree или iTOL, сначала переукорените его каким-нибудь разумным образом (в FigTree для этого нужно выделить ветвь и нажать кнопку Reroot, в iTOL — ткнуть мышью в узел ниже ветви и найти нужный пункт в открывшемся меню).