BLAST

Задание 1.Таксономия и функции прочтенной нуклеотидной последовательности


С blastn был произведен поисков гомологов консенсусной последовательности:
>EMBOSS_001
gnacngctttaagtatattaattcgaattgaattaagacaaccaggagctttgttaggag
atgatcaactatatnacgtaattgtaacggctcanGCTTTTGTTATAATTTTTTTTTTAG
TTATACCTGTTTTAATTGGAGGATTTGGTAATTGattATTAGTACCTTTAATATTAGGGG
CTCCCGATATAGCTTTCCCCCGAATAAATAACATAAGTTTTTGGTTATTACCACCTTCTT
TAACTCTTCTGTTAARAAKTTCTTTAGTGGAAATAGGGGCAGGAACKGGGTGAACAGTAT
ACCCTCCACTATCTAGTAATTTAGCCCATTCAGGAGGGTCTGTAGATTTAGCTATTTTTT
CATTACATTTAGCTGGKGTTTCTTCTATTTTAGGKGCTATTAATTTTATTACTACTACAA
TTAATATGCGGTGATATGGATATCAATTTGAANATATCCCATTATTTGNGNGGNCNGTAA
AATTAACAGCTANTTTATTATTGCTATCTCTACCTGTTTTAGCTGGGGCTATTACAATAT
TATTAACARATCKTAATTTTAAWACGTCATTTTTTGATccttg
Ниже приводится 6 лучших находок blastn
Graph
Заметим, что во всех лучших находках указан фрагмент, кодирующий 1 субъединицу
цитохромоксидазы.
В пяти лучших выдачах указан таксон Loxosomella, более того, % идентичности
и E-value первой находки позволяет предположить, что исходная нуклеотидная последовательность
принадлежит организму Loxosomella varians

Задание 2. Сравнение списка находок, полученных разными видами blast


Пункт 1.


В данном задании производился поиск с использованием megablast, blastn с длиной слова 11 и длиной слова 7
Поиск был ограничен родом Loxosomella
АлгоритмПараметры алгоритмаЧисло находок
megablastСтандартные1
blastnСтандартные16
balstnДлина слова =7; M/M 1;-417
Ниже приводятся примеры выдачи разных видов BLAST:

megablast


Graph

Graph

blastn с длиной слова 11

Graph

Graph

blastn с более чувствительными параметрами

Graph

Graph
Blastn с длиной слова 11 выдал по 16 находок, в то время как megablast
выдал тольок одну находку. Это можно объяснить тем, что megablast использует длину слова 28, что
позволяет обнаруживать находки сильно похожие друг на друга. Так что выдача megablast ожидаемо наименее разнообразна,
в то время как выдача blastn более разнообразна, поскольку данный алгоритм использует слова меньшей длины(11).
Выдача blastn с чувствительными параметрами содержит 17 находок и подходит для нахождения консервативных участков
в последовательностях, которые пропускает megablast

Пункт 2.


В данном пункте таки же запуски были проведены для последовательности некодирующей тРНК(3898..3969) с ограничением по роду Laminaria
Последовательность
>AJ344328.1 AJ344328 Laminaria digitata complete mitochondrial genome 
GTTTGGGTAGCTCAGTTGGTAGAGTGAAGGACTGAAAATCCTTAGGTCGTCGGTTCAAGC
CCGATCCCAAAC

АлгоритмПараметры алгоритмаЧисло находок
megablastСтандартные1
blastnСтандартные4
balstnДлина слова =7;M/M 1;-44

megablast


Graph

Graph

blastn с длиной слова 11

Graph

Graph

blastn с более чувствительными параметрами

Graph

Graph

Задание 3. Наличие гомолгов трех белков в неаннотированноим геномеAmoeboaphelidium protococcarum


Нуклеотидный банк был создан комндой
makeblastdb -in X5.fasta -dbtype nucl

Далее в нем с помощью BLAST+ производился поиск гомологов белоков HSP71_YEAST; TERT_SCHPO; PRPC_EMENI
Пример команды запуска:
tblastn -query tert_schpo.fasta -db X5.fasta -outfmt 7 > tert_schpo.out

Пример выдачи:
Graph

HSP71_YEASTTERT_SCHPOPRPC_EMENI
Лучшее совпадение"scaffold-199 Score:920, E-value 0.0"scaffold-17 Score;108, E-value 1e-23"scaffold-693 Score:393 E-value: 6e-121
Вывод о гомологииМного участков(22) с высокими процентами идентичности и E-value.
Находка положительная
Есть один скэффолд и один контиг с невысоким уровнем идентичности,
но достаточно хороший E-value позволяет предположить гомологичность отдельных доменов белка.
Найдено всего 6 совпадений, причем только в двух из
них довольно хороший E-value.
В данном случае можно говорить о том, что находка условно положительная
и можно предположить родственность данных белков

Задание 4. Ген белка в одном из контигов Amoeboaphelidium protococcarum


Для поиска белка был выбран контиг unplaced-1034, длиной в 25619
Поиск производился с помощью blastx по банку Reference proteins, ограничение таксономии Fungi
Был найден ген, кодирующий белок WNK протеин киназу.
Graph

Задание 5. Карта локального сходства геномов двух бактерий


Для выравнивания были использованы геномы Chlamydia muridarum и Chlamydia gallinacea (NZ_CP027213.1 и NZ_CP015840.1), был использован алгоритм blastn
Graph

Прослеживается наличие инверсий нескольких участков генома.

© Simon Konnov 2017