Вернуться на страницу семестров

Онлайн BLAST


     Задание 1. Поиск организма по фрагменту нуклеотидной последовательности.

   Поскольку я первый по списку, я искал по данной последовательности: Ссылка на fasta-файл, с последовательностью.
Используя программу megablast, определил организм, которому принадлежит данный фрагмент. В качестве Database, я выбрал refseq_genomic:
✧ Организм - Nanoarchaeum equitans Kin4-M
✧ ACCESSION - NC_005213
✧ Координаты фрагмента - 1145-1444
✧ Не является кодирующим ("hypothetical protein")

Рис.1. Данные полученные после работы с megablast.


     Задание 2. Поиск гомолога белка человека в слоне.

При помощи 2-ух команд (рис. 2) была создана выборка человеческих белков на букву А, из которых я получил последовательность белка ALKB6_human
Ссылка на fasta-файл, с последовательностью.

На сайте ENA был проведен поиск гомолога данного человеческого белка в геноме африканского слона (loxodonta_africana). Всего нашлось 6 результатов. При поиске был выбран чекбокс "spliced translated nucleotide search", позволяющий искать не отдельные экзоны, а белок полностью. Информация о лучшей находке предоставлена ниже:
✧ E-value лучшей находки - 2E-28
✧ Длина выравнивания (Alignment Length) - 65
✧ Identity полученного выравнивания - 95%
✧ Координаты найденного гена в геноме слона - 1285366->1287269 (стрелочка обозначает прямую цепь)
✧ Количество интронов в данном гене слона - 2.


     Задание 3. Поиск некодирующих последовательностей программой BLAST.

   Для этой части работы я использовал бактетию Pseudoalteromonas_atlantica из резерва, т.к. у меня были сложности с поиском своей бактерии Paenibacillus_sp. Для Pseudoalteromonas_atlantica я узнал порядок (order) - Alteromonadales. Нашел полный её геном c помощью команды: entret embl: CP000388 -auto. Затем нашел (ctrl+F) и вырезал аланиновую тРНК, с координатами (37720..37795) на прямой цепи с помощью команды: seqret -sask и сделал fasta-файл, который прикреплен ниже.
Ссылка на fasta-файл, с последовательностью.
   Далее был проведен поиск гомологов данной последовательности по всем бактериям, относящимся к тому же порядку - Alteromonadaceae, с разными параметрами поиска. Результаты (необходимо указать количество находок с e-value <0,001):
a. алгоритмом megablast: 24 находки
b. алгоритмом blastn с параметрами по умолчанию: 32 находки
c. алгоритмом blastn с длиной слова = 7, match/mismatch = 1/-1: 43 находки
   Вывод: поиск алгоритмом megablast давал находки с очень высокими Identity последовательностей, их соответсвенно и получилось меньше всего. Число находок увеличивается, так как условия поиска расположены по уменьшению чувствительности. Алгоритм megablast ищет только сильно схожие последовательности, а blastn включает в выдачу и хиты, с меньшей схожестью