Третий семестр
Зачетное задание
Задание: получить заданную последовательность (начало фрагмента:4105583, длина фрагмента: 7000) из файла kpn_genome.fasta. Определите, закодированы ли в нем белки, похожие на белки из Salmonella typhimurium.
Для решения поставленной задачи была выбрана программа BLASTX, так как она часто используется на первом этапе анализа новых нуклеотидных последовательностей для предсказания кодирующих участков. Параметры программы: последовательность - нуклеиновая кислота, поиск ведется среди белков - соответствуют параметрам поиска для выполнения задания.
Мини-банк данных для поиска составляют 3 индексных файла, полученных для аминокислотной последовательности полного протеома S. Typhimurium.
Из полученых находок я выбрала 4 с наилучшим Е-Value и с неперекрыващимися координатами генов.
Гипотетические гены в исследуемом фрагменте:
3'--[<=ген Q8ZMC1, 3-224]----[<=ген Q8ZMC0, 315-1409]----------------------------------------------------------------------------------------- 5' 5'---------------------------------------------------------------------------------[=>ген Q93IS1, 3424-4740]-------[ =>ген P02936, 6701-7000]--3'
С помощью одного запроса к SRS были найдены соответствующие белки в UniProt. С помощью кнопки "Link" была установлена связь с документами EMBL. Записи EMBL были найдены только для трех белков из четырех.
AC находки в SwissProt | Имя гена | Локализация гена | EMBL |
Q8ZMC0 | mltA | complement(2038..3135) | AE008837 |
Q8ZMC1 | ygdL | complement(1122..1928) | AE008837 |
P02936 | ompA | 201..1253 | X02006 |
Взаимное расположение генов в геноме организма-прототипа:
3'--------[<=ген ygdL,1122..1928]------[ <=ген mltA, 2038-3135]----5'
5'--------------------------[=>ген ompA,201..1253 ]-------------------3'
Взаимное расположение генов в геноме организма-прототипа отличается от их расположения в исследуемом фрагменте. Изменилcя порядок генов на комплементарной цепи. О прямой цепи ничего определенного сказать нельзя. Следовательно, в исследуемом фрагменете последовательности не закодированы белки, похожие на белки из Salmonella typhimurium.
Использованные команды:
1. seqret kpn_genome.fasta -sask
ответив на поставленные программой вопросы, была получена заданная последовательность.
2. formatdb -i salty_proteome.fasta -p T -n sal -s -t sal -e
были получены три индексных файла по данной аминокислотной последовательности, по которым ведется поиск.
3. blastall -p blastx -I kpn_credit.fasta -F F -e 0.001 -d sal -o result получено 8 находок.