|
|
Поиск далеких гомологов с помощью PsiBlast.
Для начала из предложенного списка я случайным образом выбрала последовательность, выпала c AC Q1AHR3.
Далее я ввела этот АС в поиск базы Uniprot и выяснила, что он пренадлежит организму Pan troglodytes
(Chimpanzee), ген расшифрован и полон, последние изменения по этому белку в базу вносились летом
этого года, поэтому он пока имеет статус непроверенного.
Дальнейшая работа с последовательностью в PsiBlast представлена в Таблице 1.
Таблица 1.
| Номер итерации |
Число находок выше порога (0,005) |
Идентификатор худшей находки выше порога |
E-value этой находки |
Идентификатор лучшей находки ниже порога |
E-value этой находки |
| 1 |
38 |
XP_006764663.1 |
0.0001 |
WP_028385632.1 |
1.8 |
| 2 |
40 |
XP_006089598.1 |
0.000002 |
XP_002460517.1 |
0.070 |
| 3 |
40 |
XP_006089598.1 |
0.000001 |
XP_007525814.1 |
0.012 |
Итерация 1.
Нашлось 38 белков, прошедших порог, и 4 белка непрошедших. Самый худший из прошедших принадлежит
ночнице (Myotis davidii), а самый лучший из непрошедших - бактерия (legionella geestiana). Разница
между значениями их E-value 4 порядка.
Итерация 2.
Так как я про функции белков ничего не поняла (почти все никак не характеризованы), для второй
итерации я выбрала всех, прошедших порог первой итерации. В результате порог прошло 40 белков:
38 старых (немного в другом порядке) и 2 из тех, что после первой итерации порог не прошли (оказались во
втором блоке), второго блока на этот раз 15 белков. Самый худший из прошедших принадлежит
другой ночнице (Myotis lucifugus), а самый лучший
из непрошедших - Cорго зерновое (Sorqhum bicolor). Разница между значениями их E-value 4 порядка.
Итерация 3.
Для третьей итерации я взяла все белки, кроме последнего (из-за скочка E-value на 7 порядков), однако
в результате в блоке прошедших порог оказались те, что были в этом блоке после второй итерации.
В блоке непрошедший границу на этот раз оказалось 22 белка. Самый худший из прошедших принадлежит
другой ночнице (Myotis lucifugus), а самый лучший
из непрошедших - Ёж обыкновенный (Erinaceus europaeus). Разница между значениями их E-value 4 порядка.
Я решила, что на этом моменте дальнейшиие итерации бессмысленны и мое семейство гомологов сформировано.
Следующим шагом мне нужно было построить их выравнивание (рис. 1).
Рис.1. Множественное выравнивание семейства гомологов.
Ссылка на проект.
(См открытые окна)
|