Задание 1. Поиск гена, кодирующего δ-субъединицу АТФ-синтазы
Идентификатор белка: XP_037741790.1
Ссылка на его последовательность в формате fasta.
Идентификатор нуклеотидной записи, к которой относится ген, кодирующий данный белок: NC_057858. Его последовательность с окрестностью (координаты гена: 11596695-11602876) доступна по ссылке.
Задание 2. BLAST
Целью задания была проверка на консервативность гена, кодирующего δ-субъединицу АТФ-синтазы у зелёной черепахи. Поскольку выбранный мной организм является вторичноротым, для выполнения задачи я выбрала максимально удалённую от исходного организма группу - Пауков (Araneae).
Для поиска была использована база данных refseq_genomes (нашла 4 сборки генома пауков).
Сначала для нахождения похожих нуклеотидных последовательностей был использован алгоритм blastn (megablast не подходит, его лучше использовать для работы с близкородственными организмами). Все параметры стандартные, длина слова 11. В результате работы алгоритма среди четырех референсных геномов гомологов найдено не было, что говорит о низкой консервативности гена.
Далее поиск осуществлялся при помощи программы tblastn (сравненивает белок с транслированными последовательностями из базы данных) с длиной слова 5. В результате нашлись все 4 ожидаемых гомолога.
Задание 3. Поиск генов основных рибосомальных РНК
рРНК необходимы для поддержания структуры и работы рибосом, так 16S рРНК помимо структурной функции для малой субъединицы также необходима для связывания с мРНК во время трансляции, а 23S рРНК фиксирует большую субъединицу и катализирует рост пептидной цепи в ходе трансляции.
Для поиска гомологов 16S рРНК и 23S рРНК E. coli у зелёной черепахи я использовала программу blastn (поскольку она оптимальнее других ищет похожие некодирующие белки нуклеотидных последовательностей).
Поиск осуществлялся при помощи следующих команд:
Получилось найти 2 гомологa 16S рРНК E.coli (у черепахи 18S рРНК) и 20 гомологов 23S рРНК (26S рРНК в случае эукариот).