Поиск гомологов белков

Поскольку нужно найти в сборке гомологи для белков, то нужно будет использовать TblastN и SwissProt для поиска белков родственных организмов.

Запрос в UniProt: taxonomy:fungi existence:"Evidence at protein level [1]" annotation:(type:transmem)

Были выбраны следующие белки:

Далее был написан небольшой скрипт, который выполнял все команды автономно, скрипт можно увидеть по ссылке: файл

Ниже будут представлены ссылки на результат работы скрипта, то есть и команды tblastn:

Было решено оставлить в итоговых результатах и случай, когда не было находок, чтобы показать, что в реальности бывают и ситуации, когда получаются несколько печальные результаты. Для других же случаев хорошо видно, что находятся гомологи. Такие выводы я сделал, как минимум исходя из колонки e-value, но еще одним критерием было достаточно большое значение Score и также стоит обратить внимание на пункт идентичности найденных скэфолдов, а именно то, что он равен или больше 30, что обычно принимают как пороговое значение в определении гомологичности. Данные слова справедливы для скэфолдов 243 и 100 для VPS10 и большого колличества скэфолдов для YTA12, но я бы выбрал скэфолды 81 и 451 у YTA12, если бы нужен был дальнейший анализ этих последовательностей.