Третий семестр

Зачетное задание

Задание: получить заданную последовательность (начало фрагмента:4105583, длина фрагмента: 7000) из файла kpn_genome.fasta. Определите, закодированы ли в нем белки, похожие на белки из Salmonella typhimurium.


Для решения поставленной задачи была выбрана программа BLASTX, так как она часто используется на первом этапе анализа новых нуклеотидных последовательностей для предсказания кодирующих участков. Параметры программы: последовательность - нуклеиновая кислота, поиск ведется среди белков - соответствуют параметрам поиска для выполнения задания.

Мини-банк данных для поиска составляют 3 индексных файла, полученных для аминокислотной последовательности полного протеома S. Typhimurium.

Из полученых находок я выбрала 4 с наилучшим Е-Value и с неперекрыващимися координатами генов.

Гипотетические гены в исследуемом фрагменте:

 

3'--[<=ген Q8ZMC1, 3-224]----[<=ген Q8ZMC0, 315-1409]----------------------------------------------------------------------------------------- 5'

5'---------------------------------------------------------------------------------[=>ген Q93IS1, 3424-4740]-------[ =>ген P02936, 6701-7000]--3' 

С помощью одного запроса к SRS были найдены соответствующие белки в UniProt. С помощью кнопки "Link" была установлена связь с документами EMBL. Записи EMBL были найдены только для трех белков из четырех.

  • Результат просмотра документа EMBL:

    AC находки в SwissProt Имя гена Локализация гена EMBL
    Q8ZMC0 mltA complement(2038..3135) AE008837
    Q8ZMC1 ygdL complement(1122..1928) AE008837
    P02936 ompA 201..1253 X02006

    Взаимное расположение генов в геноме организма-прототипа:

    3'--------[<=ген ygdL,1122..1928]------[ <=ген mltA, 2038-3135]----5'

    5'--------------------------[=>ген ompA,201..1253 ]-------------------3'

    Взаимное расположение генов в геноме организма-прототипа отличается от их расположения в исследуемом фрагменте. Изменилcя порядок генов на комплементарной цепи. О прямой цепи ничего определенного сказать нельзя. Следовательно, в исследуемом фрагменете последовательности не закодированы белки, похожие на белки из Salmonella typhimurium.

    Использованные команды:

    1. seqret kpn_genome.fasta -sask

    ответив на поставленные программой вопросы, была получена заданная последовательность.

    2. formatdb -i salty_proteome.fasta -p T -n sal -s -t sal -e

    были получены три индексных файла по данной аминокислотной последовательности, по которым ведется поиск.

    3. blastall -p blastx -I kpn_credit.fasta -F F -e 0.001 -d sal -o result получено 8 находок.