Феодальный кризис сыграл на руку слонам,
Превратив Афины в безнадёжный Суринам.
Кобыла и трупоглазые жабы, "Гудзон (Вспоминая Варанов)"
legoushque@kodomo:~/public_html/term3/pr9/1$ bash script.bash 100 Rickettsia_rickettsii.fasta The average number of alignmenst with E-value less than 0.1: .08 legoushque@kodomo:~/public_html/term3/pr9/1$ bash script.bash 10000 Rickettsia_rickettsii.fasta The average number of alignmenst with E-value less than 0.1: .12Видно, что в обоих случаях число находок меньше единицы, а значит в большинстве случаев находок с E-value меньше 0.1 вообще нет.
legoushque@kodomo:~/public_html/term3/pr9/2$ seqret sw:P60010 proteins/P60010.fasta Read and write (return) sequences legoushque@kodomo:~/public_html/term3/pr9/2$ seqret sw:P02557 proteins/P02557.fasta Read and write (return) sequences legoushque@kodomo:~/public_html/term3/pr9/2$ seqret sw:P00830 proteins/P00830.fasta Read and write (return) sequencesСсылки на последовательности: Далее индексируем сборку генома, в которой будем искать гомологи:
legoushque@kodomo:~/public_html/term3/pr9/2$ makeblastdb -in X5.fasta -dbtype nucl Building a new DB, current time: 11/08/2020 22:15:12 New DB name: X5.fasta New DB title: X5.fasta Sequence type: Nucleotide Keep Linkouts: T Keep MBits: T Maximum file size: 1000000000B Adding sequences from FASTA; added 1868 sequences in 0.85028 seconds.Поскольку мы ищем по белковой последовательности в нуклеотидной базе данных, будем использовать tblastn:
legoushque@kodomo:~/public_html/term3/pr9/2$ for x in `ls proteins`; do tblastn -query $x -db X5.fasta > $x.txt; doneВыдачи можно увидеть по ссылкам ниже: Для каждого из белков есть находки с E-value < e-100 практически на всю длину, что говорит о том, что для каждого из этих белков в геноме Amoeboaphelidium protococcarum есть гомологи.