BLAST+

На данной странице представлен практикум по использованию алгоритмов blast для нуклеотидных последовательностей по ограниченной базе данных для аннотации генов в неаннотированном геноме афелиды

Поиск гомологов белков в неаннотированном геноме:

Белки, аннотация которых производилась с помощью алгоритмов blast, были выбранны в базе данных Uniprot, ограниченной подбазой Swiss-prot(т.е. проаннотированные и отрецензированные). Для выбора белков поиск также было введено ограничение по таксону, была взята родственная к афелидам группа грибоподобных организмов Microsporidia - облигатных внутриклеточных организмов с очень маленьким геномом. Конкретные белки выбирались исходя из представления об их возможной консервативности для лучшей аннотации. В итоге были выбраны 2 белка из Encephalitozoon cuniculi и один из Antonospora locustae. Fasta-последовательность белка получена с помощью команды seqret:

seqret sw:*AC* *AC*.fasta

Для анализа был выбран алгоритм tblastn, т.к. позволяет искать в нуклеиновой базе данных (как и требуется), транслируя изучаемый белок в различных рамках считывания. Результат аннотации:

1) DNA-directed RNA polymerase II subunit RPB1 Субъединица RPB1 ДНК-зависимой РНК полимеразы II из Encephalitozoon cuniculi (strain GB-M1)
Fasta-файл последовательности белка: Ссылка
Для поиска гомолога была выполнена следующая команда: tblastn -task tblastn -query Q8SSC4.fasta -db X5.fasta -out blast1.out
Результат доступен по ссылке
Характеристика находки: Expect = 0.0, Identities = 714/1519 (47%), Positives = 964/1519 (63%), Gaps = 150/1519 (10%), Frame = +1
Исходя из длины последовательности, E-value, процента Identities и Positives можно предположить гомологию данных последовательностей.

2) General transcription and DNA repair factor IIH helicase subunit XPB Субъединица XPB хеликазы из Antonospora locustae
Fasta-файл последовательности белка: Ссылка
Для поиска гомолога была выполнена следующая команда: tblastn -task tblastn -query Q6E6J3.fasta -db X5.fasta -out blast2.out
Результат доступен по ссылке
Характеристика находки: Expect = 0.0, Identities = 288/429 (67%), Positives = 346/429 (81%), Gaps = 0/429 (0%), Frame = -1
Длина последовательности, E-value, процент Identities и Positives, отсутствие гэпов говорит о вероятной гомологии данных последовательностей.

2) Actin Актин из Encephalitozoon cuniculi
Fasta-файл последовательности белка: Ссылка
Для поиска гомолога была выполнена следующая команда: tblastn -task tblastn -query Q8SWN8.fasta -db X5.fasta -out blast3.out
Результат доступен по ссылке
Характеристика находки: Expect = 0.0, Identities = 297/375 (79%), Positives = 333/375 (89%), Gaps = 0/375 (0%) Frame = -3
Исходя из длины последовательности, отсутствия гэпов, E-value, процента Identities и Positives можно предположить гомологию данных последовательностей.

© Беляев Геннадий, 2020 ‐ 2026