Учебная страница курса биоинформатики,
год поступления 2013
Практикум 8. Задания
Итоговые результаты нужно оформить на вашей html странице до следующего занятия.
Задания выполняются с помощью поисковой системы Uniprot.
Вводные упражнения
- Найти все белки человека (Human)
- Найти все белки homeobox человека
- Сколько из них вошли в Swissprot?
- Найти все белки homeobox человека и мыши
- Найти все белки homeobox человека (Homo sapiens)
- Составить запрос для выяснения разницы между human и homo sapiens. Объяснить проблему.
- Сколько записей ссылаются на публикации Месянжинова?
- Тот же вопрос про Атабекова; Атабекову; вместе
Есть ли в Uniprot белки людей (род Homo), кроме Homo sapiens?
- Есть ли в Uniprot белки людей разумных, кроме людей современных?
1. Найдите все белки - компоненты АТФ синтазы, закодированные в геноме ваше бактерии
Результат: таблица из нескольких промежуточных запросов (образец); скриншот результата последнего (правильного) запроса, должы быть поля Entry name, Protein names, Gene names, Organism, Organism id, Protein evidence; файл с последовательностями в формате fasta и ссылка на него с html страницы; ответы на вопросы:
- Сколько компонент АТФ синтазы удалось найти
- Сколько из них вошли в раздел Uniprot/Swissprot белков, проверенных экспертом?
- Сколько белков относятся к каждому из кодов "protein evidence"? Ваше заключение.
Опишите ко-локализованность (от слова "локус", а не "колокол" ) генов найденных белков
2. Выполните аналогичный поиск в полном геноме другого вида того же рода бактерии или археи (можно взять геном другого штамма того же рода)
Результат: последний (правильный) запрос добавьте в таблицу; скриншот результата; описание различий в соответствии с вопросами задания 1; файл с последовательностями в формате fasta
3. Для одной из субъединиц АТФ-синтазы найдите гомолога в 10 других геномах
Результат: запрос и число находок; fasta файл с 10-ю выбранными последовательностями и ссылка на него; скриншот страницы Uniprot с выбранными находками.
Файл с последовательностями гомологов нужен будет для заданий из следующего блока.
Рекомендации
- Будьте внимательны, добейтесь, чтобы запрос выдавал гомологичные последовательности
- Выбирайте последовательности из разных таксонов
- Предпочтительно брать белки с известной структурой, если таковые найдутся. Для этого в выходную таблицу добавьте колонку ""Cross-references" "PDB"
Дополнительные задания
4. Выполните какие-либо упражнения и задания (из 1-3 выше) на сайте NCBI в базе данных Proteins
Результат: таблица запросов; обсуждение: (i) особенностей запросов NCBI, в том числе,кнопки index в Advanced search; (ii) того, совпадают ли ответы в Uniprot и Proteins.
- Начните с упражнений
- Используйте кнопку Advanced search чтобы научиться писать запросы
5. Составьте сводную таблицу протеома вашей бактерии или археи
Протеом - здесь: совокупность всех белков, закодированных в геноме.
Для каждого из разделов (Swissprot, TrEMBL) приведите число белков с каждым значением protein evidence. Сделайте вывод об изученности ваше бактерии на молекулярном уровне.
6. Есть ли и сколько белков в протеоме вашей бактерии, сходных на 90%? на 50%?
Два белка сходны на 90% если в процессе расхождения от общего предка у них сохранилось 90% или более одинаковых аминокислотных остатков.
Используйте кнопки Redundancy 90% и 50%.