|
|||||||||||||||||||||||||
Задание 1 При помощи Standalone BLAST (SAB) я провёл поиск гомологов белка YokD_BacSu в геноме бактерии Listeria monocytogenes. Я преобразовал данный геном в нуклеотидный БД командой makeblastdb -in lm_genome.fasta -dbtype nucl
Далее я применил алгоритм tblastn для поиска нуклеотидных последовательностей, кодирующих гомологи белка YokD:
tblastn -query YokD.fasta -db lm_genome.fasta -out YokD.txt -evalue 0.001
Был получен файл YokD.fasta, содержащий обнаруженные выравнивания с e-value не более 0,001. Было найдено только одно такое выравнивание, покрывающее 261/272 аминокислот белка, с e-value 7e-71. Координаты выравнивания в геноме: 16738-17517 на рамке считывания (-2) последовательности AL591981.1 (L.monocytogenes EGD-e, complete genome, segment 9/12). Задание 2 При помощи blastn я провёл поиск последовательностей, гомологичных тРНК-кодирующей ДНК Bacillus subtilis BSn5 в геноме
L.monocytogenes:
blastn -task blastn -query trna_bacsu.fasta -db lm_genome.fasta -out tRNA.xls -evalue 0.01 -outfmt 7
В фале tRNA.xls лежат обнаруженные соответствия. Теперь посчитаем, сколько для каждой тРНК было найдено соответсвий: grep '>' -in trna_bacsu.fasta -out greptRNA.xls #список названий последовательностей, кодирующих ДНК в B.Subtilis, выведен в таблицу chmod +x script.sh ./script.sh
Здесь был применён скрипт для подсчёта упоминаний названий всех тРНК в таблице tRNA.xls. Количество обнаруженных совпадений на единицу меньше, чем количество упоминаний. В результате была составлена следующая таблица. Задание 3 Команду blast применили ещё два раза с другими параметрами:
blastn -task blastn -query trna_bacsu.fasta -db lm_genome.fasta -out tRNA.xls -evalue 0.01 -outfmt 7 -reward 5 -penalty -4 -gapopen 10 -gapextend 6
После чего опять посчитали количество совпадений с каждой тРНК для новых настроек. Результаты всех трёх бластов занесены в
таблицу.
Задание 4 Изменение весовой матрицы при втором поиске немного увеличивает количество найденных соответствий. Можно отметить, что установка минимальной длины слова (4) значительно увеличивает количество находок. При такой длине слова находятся последовательности с более низкой идентичностью тРНК из B.Subtilis. Последний запуск обнаружил сходство между участком генома 46135-209 и тРНК BSn5_t20966 tRNA-Ile, которого не увидели два других:
Вот полный список найденных бластом соответствий при третьем запуске: 3tRNA.xls. Алгоритмом needle было произведено выравнивание обозначенного участка генома с тРНК кишечной палочки:
Как видно, выравнивание недостаточно точное для таких консервативных структур, как тРНК одного типа. И верно, запись этого участка генома в GenBank заявляет, что данный участок занимает ген не изолейциновой, а аланиновой тРНК:
|