Программа BLASTP
1.Поиск белка по его гомологу
I.Я подала при входе в программу BLASTP последовательность гомолога моего белка TRMD_ECOLI - белок TRMD_HAEDU с AC Q7U331. В банке swissprot
был проведён поиск, в результате чего в выдаче программы мной были найдены:
1)поданный на вход белок TRMD_HAEDU, в виде:
sp|Q7U331|TRMD_HAEDU tRNA (guanine-N(1)-)-methyltransferase (...
2)белок TRMD_ECOLI: sp|P0A873.1|TRMD_ECOLI tRNA (guanine-N(1)-)-methyltransferase...
ID белка TRMD_HAEDU TRMD_ECOLI
номер в выдаче 1 26
Score 516 384
E-value 3e-146 3e-106
Последним в выдаче программы является белок с ID A8MHC4.1 и AC TRMD_ALKOO,
с порядковым
номером 100, Score 248, и E-value 1e-65.
Праграммой не было выдано больше результатов, так как автоматически были
установлены ограничительные параметры. Для увеличения числа находок следует
изменить максимальное число выводимых последовательностей на большее
(поле Max target sequences).
II.Был осуществлён поиск белка trmd_haedu по его AC Q7U331 в банке
pdb. Всего было найдено 6 записей, которым соответствует 33 последовательности. Первой в списке находок
оказались последовательности с pdb кодом 1UAJ:
pdb|1UAJ|A Chain A, Crystal Structure Of Trna(M1g37)methyltra... 409
3e-115
При анализе данной записи было обнаружено, что ей соответствует 4 последовательности, имеющие следующие параметры:
PDB-код: 1UAJ; 1UAK; 1UAL; 1UAM
идентификаторы цепей: A
Score: 409
E-value: 3e-115
начало выравнивания во входной последовательности (Query): 1
конец выравнивания во входной последовательности (Query): 249
начало выравнивания в находке (Subject): 21
конец выравнивания в находке (Subject): 265
процент совпадений (Identity): 198/249 (79%)
Программой была найдена PDB-запись 1P9P
(pdb|1P9P|A Chain A, The Crystal Structure Of A M1g37 Trna Met... 384 2e-107),
с которой проводилась работа в первом семестре. В списке находок она на втором
месте.
Из записи была получена следующая информация:
Score: 384
E-value: 3e-115
2.Поиск белка по части его последовательности
Мной был произведён поиск части указанной ранее последовательности(1/3)
в банке Swiss-Prot. Исходная последовательность по-прежнему является первой в
списке. Её Score= 194, E-value= 1e-49. Значения Score и E-value значительно уменьшились, из чего можно сделать вывод, что этот результат является
более точным по сравнению с первоначальным.
3.Сравнение выравниваний, выданных программой BLASTP,
с оптимальными глобальным и локальным выравниваниями
Из списка выравниваний, выданных BLASTP, мной было выбрано выравнивание белка
TRMD_HAEDU (AC Q7U331) с белком TRMD_PHOLL (AC Q7MB64)(Identities = 187/248 (75%);
Score = 407 bits (1046)).
После этого через Putty было осуществлено:
1.Полное парное выравнивание (алгоритм Нидельмана - Вунша):
seqret sw:q7u331 -auto
seqret sw:q7mb64 -auto
needle trmd_haedu.fasta trmd_pholl.fasta haedu_pholl.needle
В результате выполненных команд в директории Practice6 появился файл
haedu_pholl.needle
2.Частичное парное выравнивание (алгоритм Смита - Уотерманна):
water trmd_haedu.fasta trmd_pholl.fasta haedu_pholl.water
В итоге в директории Practice6 появился ещё один файл -
haedu_pholl.water
Так как в BLASTP даны следующие штрафы за гэпы:
Gap Penalties: Existence: 11, Extension: 1, то такие же значения были взяты
для полного и частичного выравнивания.
Сравнение выравниваний:
Способ выравнивания Score Длина Процент Процент
выравнивания совпадения сходства
BLASTP 1046 250 75% 88%
алгоритм Нидельмана - Вунша 1025 254 73.6% 86.6%
алгоритм Смита - Уотерманна 1028 248 75.4% 88.7%
В результате сравнения частичного и полного выравниваний было обнаружено, что они очень похожи, разве что только в полном выравнивании
больше аминокислотных остатков: TRMD_HAEDU(248) - TRMD_PHOLL(244) в локальном против TRMD_HAEDU(251)- TRMD_PHOLL(250) в полном.
В свою очередь выравнивание, выданное программой BLASTP почти идентично частичному выравниванию.
1.Мной были просмотрены релультаты, выдаваемые программой Blastp при смене различных параметров, таких как смена штрафов за гэпы
и смена матрицы.
При анализе результатов, получаемых при смене матриц, таких как Blossum45, 62, 80 и Pam 70 было обнаружено, что рост Score в них осуществляется
в следующем порядке: Blossum62&rarrPam70&rarrBlossum80&rarrBlossum45. В то же время рост E-value наблюдается в другом порядке: Blossum45&rarr
Blossum62→Pam70&rarrBlossum80.
Были также проанализированы результаты, полученные при смене штрафов за гэпы, в результате чего было обнаружено, что как значения Score, так и E-value
последовательно возрастают при смене штрафов с 7 за открытие и 2 за продолжение, на 8 и 2 и далее до 11 и 1.
2. Было осуществлено ознакомление с интерфейсом к BLAST на сайте EBI.
С одной стороны он произвёл на меня благоприятное впечатление, так как устанавливаемые параметры программы выводятся в окно компактно,
что делает работу с Blast более удобной и понятной. Кроме этого мне понравилось и оформление программы. Единственным, но, пожалуй, очень существенным
недостатком данного интерфейса является возможность ввода исключительно последовательности, с невозможностью её замены на AC, что весьма затрудняет и
замедляет работу.
Второй семестр
©Черниогло Елена