Учебная страница курса биоинформатики,
год поступления 2012
Практикум 4. Задания
Для протоколирования результатов создайте поддиректорию в правильном месте диска H: и с правильным именем и в ней - файл с правильным именем. Для того, чтобы результаты были проверены, в конце работы файл должен быть скопирован в директорию credits. Проверяются файлы: XXXXXXX_pr4.docx (или doc) и XXXXXXX.jpg.
Узнайте IP адрес компьютера kodomo.fbb.msu.ru (и сохраните в протоколе, разумеется!)
Команда ping <имя компьютера> сообщает IP адрес а также как быстро отвечает этот компьютер.Чей сервер отвечает быстрее: европейского биоинформатического института (www.ebi.ac.uk) или новозеландского (www.bioinformatics.org.nz)?
- В протокол внесите типичное время ответа каждого из серверов.
Скачайте из директории /tmp/y12 сервера kodomo.fbb.msu.ru файл bird_N.jpg где N – ваш номер в списке студентов.
Вариант 1.
Зайдите на сервер kodomo с помощью Putty . Перейдите в свою директорию pr4 с помощью команды cd. Выполните команду копирования файла с компьютера на компьютер: scp xxxxx@kodomo.fbb.msu.ru:/tmp/y12/bird_N.jpg XXXXXXX.jpg
Здесь xxxxx – ваше пользовательское имя на kodomo, N – номер, XXXXXXX – ваша фамилия латинскими буквами.
Вариант 2.
В FAR Alt+F2, выберите Winscp. Shift+F4 – откроется меню, впишите имя компьютера (host), ваше пользовательское имя, password можно вписать, а можно и не вписывать; нажмите OK и укажите имя для сохраняемой настройки (напр. kodomo).
После этого опять FAR Alt+F2, выберите Winscp, и став курсором на нужную строчку – Enter. Далее – копирование как обычно в FAR.
Проверьте что файл скачался, открыв его. Скопируйте в Credits для проверки.Найдите с помощью google расшифровки аббревиатур ORF и CDS употребляемых в молекулярной биологии.
Напишите в протоколе, что такое ORF и CDS
Подсказка: Добавьте в запрос другие слова: .По какому из запросов (1), (2) в БД PubMed будет получено больше находок?
(1) (CRISPR AND bacteria) OR immunity
(2) (CRISPR OR bacteria) AND immunity
Ответ объясните. Проверьте запросы и приведите число находок в PubMed
Соберите информацию о данной вам бактерии или архее и сохраните ее (информацию, а не бактерию ) в протоколе.
Нужная информация включает:- описание бактерии, ее особенностей
- таксономию
- ответ на вопрос почему секвенировали ее геном
авторов, название и аннотацию одной из статей о бактерии/архее, найденной в БД PubMed; идентификатор статьи в PubMed
- микрофотографию бактерии/археи со ссылкой на автора или источник (фотографии сохраните как графические файлы; форматы .jpg, .gif, .bmp .png и др.)
другие интересные данные о бактерии
Источники информации см. ниже, п.п. a) – d)Поищите презентацию о вашей бактерии (если не находится – статью) и сохраните интересную информацию и микрофотографию (если есть) в протоколе.
Включите в протокол адрес источника информации (URL) и, желательно, имя автора.
Подсказки.
В google используйте ограничитель filetype:, если в запросе стоит filetype:ppt, то google найдет только презентации (расширение файла ppt). Статьи обычно хранятся в формате pdf (filetype:pdf). Используйте “+” при задании родового имени одной буквой, например, +E.coli. На первой странице находок внимательно прочитайте названия и выберите б.м. подходящие для проверки содержания. Не увлекайтесь разглядыванием презентации, если она не о том, – время дорого. Если не знаете, как копировать картинки – спросите!Поищите и сохраните фотографию вашей бактерии с помощью Google => Картинки. Сохраните также подпись к фотографии или иное обоснование того, что изображена именно ваша бактерия.
Составьте запрос для поиска статей в БД PubMed о вашей бактерии/архее, вышедших после 2000 года, и описывающих полный геном.
Сохраните запрос, число находок, аннотацию одной из статей – наиболее интересную для вашего отчета. Если находок мало, то откажитесь от ограничения по годам. В запросе используйте операторы AND, OR и ограничители полей [TI] – title – заголовок, [DP] – date of publication – дата публикации. Примеры:
2006[dp] –публикации 2006 года
2000/01:2009/04[dp] – публикации в период между январем 2000 г. и апрелем 2009 г.(*) Найдите информацию о геноме и протеоме вашей бактерии/археи.
Сайт Genome_reviews ( http://www.ebi.ac.uk/genomes/bacteria.html или http://www.ebi.ac.uk/genomes/archaea.html ). Там же найдете ссылку на таксономию бактерии.
Пояснение. Щелчок по названию бактерии приводит на страницу таксономии; щелчки по кодам записей – столбец “Sequence”, - к получению записи банка Embl с последовательностью генома, сейчас нам она не нужна; нас интересует ссылка “proteom” и далее – Genome statistic. Там найдете данные о числе хромосом и плазмид в геноме; числе пар нуклеотидов в каждой из ДНК; числе генов, закодированных на каждой ДНК; проценте ДНК, занятой генами – остальные ДНК – это межгенные промежутки. Такая информация украсит ваш отчет (и даст премиальные баллы).Оформите описание бактерии/археи в виде связного текста на русском языке. При переводе с английского будьте бдительны: перевода без понимания смысла не бывает. Поэтому лучше меньше, да лучше.