Практикум 8

Задание 1

Я выбрал контиг(scaffold_78) с идентификатором NW_023637778.1 и длиной 30536 п.н.
На картинке ниже представлен контиг и содержащийся на нем единственный ген Y-linked testis-specific protein 1-like.Ген занимает положение 9 - 2399 относительно начала контига.



В megablast (wordsize = 28) без Хордовых ничего не нашлось, также для млекопитающих и мышиных.
С помощью blastn (wordsize = 11) без семейства мышиных нашлось 100 находок из 100 возможных.
Blastx с wordsize = 3 долго грузил и в итоге выдал ошибку.
От tblasx вообще ни при каких параметрах не получилось увидеть результат.

Задание 2

Индексация генома была сделана с помощью makeblastdb:
makeblastdb -in GCA_015227675.2_mRatBN7.2_genomic.fna -dbtype nucl
Поиск последовательностей, кодирующих рРНК - конкретно 16s и 23s субъединицы - был сделан через следующие команды:
blastn -task blastn -query ecoli-16s.fasta -db GCA_015227675.2_mRatBN7.2_genomic.fna -out blast16.out
blastn -task blastn -query ecoli-23S.fasta -db GCA_015227675.2_mRatBN7.2_genomic.fna -out blast23.out
1. 16s и 23s рРНК это характерные рибосомальные РНК прокариот. Это малая и большая субъединицы соответственно. Поскольку мы смотрим геном эукариота, логично ожидать, что основные рибосомы у него будут характерными для эукариот - 18S, 5S и 28S. Есть вероятность найти интересующие нас гены в митохондриальной ДНК, так как по теории симбиогенеза митохондрии имеют бактериальное происхождение.
2. Использовался поиск через blastn, потому что мы сравниваем две нуклеотидные последовательности.
3. Для 16s р РНК было найдено 8 находок. Лучшая находка имела значение e-value 9e-05. Для 23s рРНК всего 20 находок. Лучшее значение e-value 5e-17.