8 (926) 907 94 08 |
Всё на свете является чудом! |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Программа B L A S T |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
BLAST (англ. Basic Local
Alignment Search Tool) — семейство компьютерных программ, служащих для
поиска гомологов белков или нуклеиновых кислот, для которых известна
первичная структура (последовательность) или её фрагмент. Используя
BLAST, исследователь может сравнить имеющуюся у него последовательность
с последовательностями из базы данных и найти последовательности
предполагаемых гомологов. Является важнейшим инструментом для
молекулярных биологов, биоинформатиков, систематиков. Для выполнения упражнений воспользуемся web-интерфейсом к программе BLASTP на сервере NCBI. Заходим на страницу с программой BLASTP, после чего в разделе "Basic BLAST" переходим по гиперссылке "protein blast". Программа BLASTP относится к белковой группе программ серии BLAST, предназначенной для сравнения изучаемой аминокислотной последовательности белка с имеющейся базой данных белков и их участков. Конкретно BLASTP позволяет найти все сходные последовательности (подробнее о программе BLAST). 1. Поиск гипотетических гомологов белка THIS_BACSU в разных банках - заходим на веб-страницу, где реализована программа BLASTP, и в поле "Enter Query Sequence" вписываем код доступа - AC O31617 - белка THIS_BACSU - затем проводим поиск гомологов в банках Swiss-Prot, PDB (Protein Data Bank proteins) и nr (Non-redundant protein sequences) - для этого изменяем значение параметра "database" - закончив поиски, заполняем таблицу
- исходный белок THIS_BACSU удалось найти в Swiss-Prot и nr, а в банке PDB нашли структуру белка - при поиске явных гомологов (E-value < 1e-10) в базе данных Swiss-Prot их должно быть меньше, чем в nr, но больше, чем в PDB. Это обусловлено тем, что банки сильно отличаются числом имеющихся последовательностей. В банке nr более 17 млн последовательностей, а у Swiss-Prot и PDB около 450000 и 57000 соответственно. Увы, в нашем случае мы вообще не нашли явных гомологов, ни в Swissprot, ни в nr. - всего находок мы получаем: 26-Swiss_Prot, 8-PDB, 734-nr. Для Swiss-Prot и PDB мы ограничиваем количество находок значением E-value (выбрав значение 100, число находок оказывается меньше, чем 100), а для банка nr лимитирующим фактором является предельный размер выдачи, который мы повысили до 1000, и тем самым смогли узнать конечное число находок. 2. Поиск гипотетических гомологов белка THIS_BACSU с фильтром по таксонам Необходимо найти лучшего гомолога белка THIS_BACSU в организмах таксона, филогенетически как можно более далекого.
- для поиска гомолога белка THIS_BACSU в банке Swiss-Prot вводим название таксона в окошко "Organism" - проверяем на наличие гипотетического гомолога (критерий: E-value < 0,001) в порядке приближения к "Bacillus subtilis" - во время первого же поиска в царстве Eukaryota натыкаемся на интересующий нас гомолог
3. Сравнение выравниваний, выданных программой BLASTP, с оптимальными глобальным и локальным выравниваниями 1) Для сравнения воспользуемся выравниванием последовательностей белков THIS_BACSU (AC O31617) и YCF40_ODOSI (AC P49535), которое было получено с помощью программы BLASTP при выполнении предыдущего задания. >sp|P49535.1|YCF40_ODOSI RecName: Full=Uncharacterized protein ycf40 Length=73 GENE ID: 801820 ycf40 | ORF73 [Odontella sinensis] Score = 39.3 bits (90), Expect = 1e-07, Method: Compositional matrix adjust. Identities = 19/63 (30%), Positives = 37/63 (59%), Gaps = 1/63 (2%) Query 4 LNGKDVKWKKDTGTIQDLLASYQLENKIVIVERNKEIIGKERYHEVELCDRDVIEIVHFV 63 +NG++ + +T + DLL + + ++++E N I K+ + ++ + + D IEIV V Sbjct 12 INGQEY-YTTNTINLHDLLNYFDFNSSLLVLEYNNFICNKKNWEKIMISNNDKIEIVTIV 70 Query 64 GGG 66 GGG Sbjct 71 GGG 73Параметры, использованные в программе BLASTP, применяем и для оптимальных полного и частичного выравниваний. # Matrix: EBLOSUM62 -> матрица весов замен # Gap_penalty: 11.0 -> штраф за открытие гэпа # Extend_penalty: 1.0 -> штраф за удлинение гэпа 2) С помощью программы needle из пакета EMBOSS, построим полное выравнивание для тех же белков THIS_BACSU и YCF40_ODOSI. Для этого написали команду (needle sw:O31617 sw:P49535 O31617_P49535.needle -gapopen 11 -gapextend 1) THIS_BACSU 1 --------MLQLNGKDVKWKKDTGTIQDLLASYQLENKIVIVERNKEIIG 42 ...:||::. :..:|..:.|||..:...:.::::|.|..|.. YCF40_ODOSI 1 MTKISTAKTFFINGQEY-YTTNTINLHDLLNYFDFNSSLLVLEYNNFICN 49 THIS_BACSU 43 KERYHEVELCDRDVIEIVHFVGGG 66 |:.:.::.:.:.|.||||..|||| YCF40_ODOSI 50 KKNWEKIMISNNDKIEIVTIVGGG 73 3) Теперь при помощи программы water из пакета EMBOSS, строим частичное выравнивание этих белков. Для этого написали команду (water sw:O31617 sw:P49535 O31717_P49535.water -gapopen 11 -gapextend 1) THIS_BACSU 4 LNGKDVKWKKDTGTIQDLLASYQLENKIVIVERNKEIIGKERYHEVELCD 53 :||::. :..:|..:.|||..:...:.::::|.|..|..|:.:.::.:.: YCF40_ODOSI 12 INGQEY-YTTNTINLHDLLNYFDFNSSLLVLEYNNFICNKKNWEKIMISN 60 THIS_BACSU 54 RDVIEIVHFVGGG 66 .|.||||..|||| YCF40_ODOSI 61 NDKIEIVTIVGGG 73 Получив все три выравнивания, сравним их по определённым параметрам
Мерой совпадения двух выравниваний является процент согласованных колонок 1-ого выравнивания относительно общего числа колонок (аналогично и для 2-ого выравнивания). При расчетах ограничиваемся участками: в запросе 4-66, в находке 12-73. Рассчитаем меру совпадения локального выравнивания, полученного программой BLASTP, c оптимальными глобальным и частичным выравниваниями:
Выбранный фрагмент оптимального глобального выравнивания составляет 86,5% от общей длины этого глобального выравнивания. А выравнивание, построенное с помощью программы BLASTP, и оптимальное частичное выравнивание абсолютно одинаковые. 1*. Дополнение страницы "Описание программ" (раздел "пакет EMBOSS") В разделе "EMBOSS" практикума "Описание программ" добавили описания недавно используемых программ: - seqret -- matcher --- stretcher ---- needle ----- water 2*. Поиск с другими параметрами программы BLAST 3*. Гомология находки с E-value>1 4*. Дополнительные интерфейсы к программе BLAST |
Главная | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Об авторе | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Учебные семестры | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Проекты автора | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Друзья | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ссылки партнеров | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Extra | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Контакты | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Mneff © 2011-2012 |