Поскольку я первый по списку, я искал по данной последовательности:
Ссылка на fasta-файл, с последовательностью.
Используя программу megablast, определил организм, которому принадлежит данный фрагмент. В качестве Database, я выбрал refseq_genomic:
✧ Организм - Nanoarchaeum equitans Kin4-M
✧ ACCESSION - NC_005213
✧ Координаты фрагмента - 1145-1444
✧ Не является кодирующим ("hypothetical protein")
Рис.1. Данные полученные после работы с megablast.
При помощи 2-ух команд (рис. 2) была создана выборка человеческих белков на букву А, из которых я получил последовательность белка ALKB6_human
Ссылка на fasta-файл, с последовательностью.
Для этой части работы я использовал бактетию Pseudoalteromonas_atlantica из резерва, т.к. у меня были сложности с поиском своей бактерии Paenibacillus_sp. Для Pseudoalteromonas_atlantica
я узнал порядок (order) - Alteromonadales. Нашел полный её геном c помощью команды: entret embl: CP000388 -auto. Затем нашел (ctrl+F) и вырезал аланиновую тРНК, с координатами (37720..37795) на прямой цепи с
помощью команды: seqret -sask и сделал fasta-файл, который прикреплен ниже.
Ссылка на fasta-файл, с последовательностью.
Далее был проведен поиск гомологов данной последовательности по всем бактериям, относящимся к тому же порядку - Alteromonadaceae, с разными параметрами поиска. Результаты (необходимо указать количество находок с e-value <0,001):
a. алгоритмом megablast: 24 находки
b. алгоритмом blastn с параметрами по умолчанию: 32 находки
c. алгоритмом blastn с длиной слова = 7, match/mismatch = 1/-1: 43 находки
Вывод: поиск алгоритмом megablast давал находки с очень высокими Identity последовательностей, их соответсвенно и получилось меньше всего. Число находок увеличивается, так как условия поиска расположены по уменьшению чувствительности. Алгоритм megablast ищет только сильно схожие последовательности, а blastn включает в выдачу и хиты, с меньшей схожестью