ФББ 2013-2014
Выравнивание двух последовательностей белка дисульфидного обмена Chlorobium tepidum TLS: из базы данных RefSeq и PDB
Последовательность, полученная в первом семестре (база данных RefSeq) - NP_661963.1.fasta .
Последовательность того же самого белка из базы данных PDB - 3GL3.fasta
Выравнивать будем с помощью вот этого ресурса. Результаты:
170 aa vs. 152 aa scoring matrix: , gap penalties: -12/-2 80.3% identity; Global alignment score: 893 10 20 30 40 50 60 778106 MKRSTLSTCRVALFALVLSVGLSANAHALDKGDKAPDFALPGKTGVVKLSDKTGSVVYLD : .:::::::::::::::::::::::::::::::: _ M--------------------------SLDKGDKAPDFALPGKTGVVKLSDKTGSVVYLD 10 20 30 70 80 90 100 110 120 778106 FWASWCGPCRQSFPWMNQMQAKYKAKGFQVVAVNLDAKTGDAMKFLAQVPAEFTVAFDPK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: _ FWASWCGPCRQSFPWMNQMQAKYKAKGFQVVAVNLDAKTGDAMKFLAQVPAEFTVAFDPK 40 50 60 70 80 90 130 140 150 160 170 778106 GQTPRLYGVKGMPTSFLIDRNGKVLLQHVGFRPADKEALEQQILAALGGN-------- :::::::::::::::::::::::::::::::::::::::::::::::::: _ GQTPRLYGVKGMPTSFLIDRNGKVLLQHVGFRPADKEALEQQILAALGGNEGHHHHHH 100 110 120 130 140 150
Верхняя строчка - файл fasta-последовательности из базы данных RefSeq (ncbi). Нижняя строчка - файла fasta-последовательности из базы данных PDB.
В моём белке 4 одинаковых цепи, поэтому выравнивания по всем цепям давали одинаковый результат. Выше приведено выравнивание для цепи А и fasta-файла RefSeq. Совпадение 80.3%, на мой взгляд, довольно большое. Отличия, как мы видим, только в начале и конце. Я думаю, эти отличия связаны с разными методами секвенирования. Последовательность из базы данных Refseq учёные узнали с помощью метода "conceptual translation", то есть полипептидную цепь восстанавливали по мРНК. А последовательность №2 секвенировали методом рентгеноструктурного анализа.