BLAST


Задание 1


При помощи BLASTP были найдены последовательности, сходные с последовательностью "моего белка" - аденозилметионин-8-амино-7-оксононаноат аминотрансферазы из организма Denitrovibrio acetiphilus DSM 12809, (идентификатор в базе данных RefSeq NC_013943). В дополнительных параметрах поиска в качестве максимального числа находок установлено 20000, чтобы точно найти все последовательности.Условия поиска доступны по ссылке.
Всего найдено 914 последовательностей, из них 57 последовательностей принадлежат геномам архей, 42 из геномов эукариот (например, из мыши Mus musculus отряда Rodentia или из мухи Drosophila ananassae отряда flies), остальные из геномов бактерий. Лучшая находка - белок из бактерии Lysinibacillus sphaericus из отдела Фирмикуты. Также я выбрала одну находку из середины списка - последовательность из генома кишечной палочки Escherichia coli K-12. Ее выравнивание с последовательностью моего белка, которое построил BLAST, показано на рисунке 1. Худшая находка - белок ацетил КоА карбоксилаза 1 из организма человека (Homo sapiens). Выравнивание с последовательностью этого белка можно увидеть на рисунке 3. В таблице 1 представлена информация о выбранных находках и о полученных выравниваниях.
  • Ссылка на условия поиска
  • Таблица 1. Информация о последовательностях белков, найденных с помощью BLASTP по белку adenosylmethionine-8-amino-7-oxononanoate aminotransferasa в базе данных SwissProt.
    Организм Длина выравнивания Bit score % идентичных % сходных E-value
    Lysinibacillus sphaericus 455 517 52 73 1e-179
    Escherichia coli K-12 426 94 25 42 1e-19
    Homo sapiens 2346 33,5 31 50 4.9


    Рисунок 1. Выравнивание белка аденозилметионин-8-амино-7-оксононаноат аминотрансферазы из бактерии Denitrovibrio acetiphilus DSM 12809 с белком из Lysinibacillus sphaericus, построенное BLASTP


    Рисунок 2. Выравнивание белка аденозилметионин-8-амино-7-оксононаноат аминотрансферазы из бактерии Denitrovibrio acetiphilus DSM 12809 с белком из Escherichia coli K-12, построенное BLASTP


    Рисунок 3. Выравнивание белка аденозилметионин-8-амино-7-оксононаноат аминотрансферазы из бактерии Denitrovibrio acetiphilus DSM 12809 с белком из Homo sapiens, построенное BLASTP
    Гомологами исходной последовательности можно считать 705 найденных последовательностей, придерживаясь критерия, что гомологичными являются находки с E-value < 1e-03 и query cover не менее 70%, то есть в построенное выравнивание вошло не менее 70% исходной последовательности. На рисунке 4 представлено графическое изображение результатов поиска.

    Рисунок 4.Графическое отображение результатов поиска

    Задание 2

    Также я провела поиск (при неизменных условиях) в рамках отряда Rodentia. Всего найдено 19 последовательностей.
    Для сравнения результатов двух поисков я выбрала одну из находок, которая встречается в обоих случаях - белок из организма Mus Musculus фосфогидрокси -L-лизин фосфолиазу.
    В двух находках совпадают все параметры,кроме E-value (в находке при поиске по всем таксонам он составляет 7e-26 , а при поиске по отряду - 6e-27 ).
    Во втором случае банк меньше, значит, вероятность найти в нем подходящую последовательность будет меньше.

    Рисунок 5. Поиск по всем таксонам


    Рисунок 6. Поиск по отряду Rodentia
  • Ссылка на условия поиска

  • Задание 3


    Выполнено выравнивание моего белка и белка ацетил КоА карбоксилазы 1 (фигурировала ранее как худшая находка)
    При этом BLASTP построил два парных выравнивания, которые имеют длину 48 и 53 остатка соответственно.

    Рисунок 7. Выравнивание двух последовательностей

    И представлена карта локального сходства
    По оси Ox откладываются номера остатков моего белка, по Oy – остатки выбранной последовательности.
    Сплошными линиями показаны гомологичные участки двух данных последовательностей. Разрывы соответствуют гэпам.

    Рисунок 8. Карта локального сходства

    Задание 4

    Для создания своей базы данных я удалила все гэпы из множественного выравнивания align_07.fasta,с которым работала в пр8, и далее проиндексировала его. Полученная база состоит из 9 последовательностей белков. Среди них был осуществлен поиск последовательности белка аденозилметионин-8-амино-7-оксононаноат аминотрансферазы из бактерии Denitrovibrio acetiphilus DSM 12809 Всего было найдено 4 выравнивания. Результаты представлены в таблице 2.
    Таблица 2. Результаты поиска последовательностей, похожих на последовательность моего белка.
    Последовательность Длина выравнивания Bit score Количество идентичных колонок,% Количество сходных колонок,% E-value
    MOOTA/1-148 32 19,6 9,(28%) 16,50% 0,50
    DESOD/1-148 87 19,2 22,(25%) 38,44% 0,62
    LACLK/1-146 18 17,7 7,(39%) 9,50% 1,9
    ENTFO/1-146 39 16,2 11,(28%) 16,(41%) 6,2



    Таблица 3.Данные о лучшей находке
    Последовательность Длина выравнивания Bit score Количество идентичных колонок,% Количество сходных колонок,% E-value
    MOOTA/1-148 (1ая находка) 32 19,6 9,(28%) 16,50% 0,50
    MOOTA/1-148 (2ая находка) 67 19,2 17,(25%) 28,(24%) 0,50


    Рисунок 9. Выравнивание последовательности моего белка и последовательности MOOTA/1-148, построенное с помощью BLASTP

    Гомология между последовательностями отсутствует, так как длина выравнивания небольшая, проценты совпадения идентичных и сходных последовательностей низкие, а величина E-value выше, чем 10e^-3

    © Козлова Анастасия, 2014/2015