Я выбрал в качестве объекта исследования геном Trypanosoma brucei brucei TREU927, вель с его устройством я немного познакомился во время выполнения 7 и 8 практикумов и знаю, что он таит в себе много интересного, чего мегабласт может не разглядеть. Я взял для анализа 3 хромосому, так как обнаружил в ней тандемные повторы генов rRNA в 8 практикуме. Вторую трипаносому, Trypanosoma brucei equiperdum strain IVM-t1, я выбрал случайно. Обе геномные сборки нашёл на NCBI Genome по TaxID семейства - 5691. Затем из записей сборок перешёл по ссылкам на нуклеотидные базы данных (RefSeq в случае TREU927, GenBank в случае IVM-t1), где хранилась третья хромосома, и скачал в fasta формате. Все параметры как blastn, так и megablast взяты по умолчанию.
Как заметно по картам, megablast не увидел многие мобильные и повторяющиеся элементы в геноме, особенно элементы у TREU972 в нуклеотидах с 1 по 10^5. Я предположил, что среди этих элементов есть гены, которые отвечают за кодирование белков гликокаликса.
И действительно, похоже что гены гликокаликса здесь есть, а может и занимают большую часть генетической информации этого участка.
Теперь рассмотрим другие моменты на карте.
Красным - делеции IVM-t1. Синим - мобильные повторяющиеся элементы. Зелёным - повторы IVM-t1.