Практикум 8: Нуклеотидный BLAST

Косатка
Рис. 1. Косатка и детёныш. Источник изображения: Pinterest

Поиск гена, кодирующего δ-субъединицу АТФ-синтазы

Поиск начался с фразы "ATP synthase subunit delta", а потом пошло поехало...

ATP5F1D - ATP synthase F1 subunit delta
Рис. 2. Окрестность гена δ-субъединицы (XP_072578132.1)

Локализация и идентификация гена:

  • Ген дельта-субъединицы АТФ-синтазы (ATP5F1D) расположен на прямой цепи хромосомы 3 (координаты ~697,689 – 700,753 н.). Для его поиска в геномном браузере использовался идентификатор белка XP_004288918.1.

Особенности структуры:

  • На схеме ген ATP5F1D показан зелёным. Интересно, что он имеет два транскрипционных варианта (фиолетовые блоки), которые дают начало двум разным кодирующим последовательностям (CDS, красные). Однако эти последовательности кодируют идентичную белковую последовательность (XP_004288918.1). Направление считывания гена указано стрелками.

Геномное окружение:

  • Слева от ATP5F1D (верх по потоку) на обратной цепи расположен ген CBARP, а справа (вниз по потоку) — ген C1QL4, также на обратной цепи.

Экспрессионное подтверждение:

  • Наличие и корректность аннотации гена ATP5F1D подтверждается представленными внизу рисунка данными RNA-seq, демонстрирующими его активную экспрессию.

Разные варианты BLAST для фрагмента ДНК

В рамках исследования проведен сравнительный поиск информации о генах и мРНК белка альбумин в двух международных базах. Результаты по NCBI (сводные данные в Таблице 2) и ENA приведены ниже.

Результаты поиска в ENA:

  • мРНК человека: 2 157 записей
  • Геномная ДНК человека: 13 записей

Так как поиск в базе ENA по альбумину человека дал значительно меньше записей (2 157 для мРНК), чем общий поиск в NCBI (9 254 для мРНК), для корректного сравнения систем пришлось ориентироваться на данные, относящиеся только к человеку (Homo sapiens).

Исходя из сравнения итоговых цифр, можно сделать вывод, что системы в равной степени пригодны для поиска основных массивов данных: для мРНК человека результаты близки (NCBI: 2 652, ENA: 2 157), однако NCBI предоставляет более детализированную и структурированную информацию за счет разделения на GenBank и курируемый RefSeq, что делает его предпочтительным для комплексного анализа. ENA эффективна для быстрого получения конкретных архивных записей.


Гены основных рибосомальных РНК по далекому гомологу

В рамках исследования проведен сравнительный поиск информации о генах и мРНК белка альбумин в двух международных базах. Результаты по NCBI (сводные данные в Таблице 2) и ENA приведены ниже.

Результаты поиска в ENA:

  • мРНК человека: 2 157 записей
  • Геномная ДНК человека: 13 записей

Так как поиск в базе ENA по альбумину человека дал значительно меньше записей (2 157 для мРНК), чем общий поиск в NCBI (9 254 для мРНК), для корректного сравнения систем пришлось ориентироваться на данные, относящиеся только к человеку (Homo sapiens).

Исходя из сравнения итоговых цифр, можно сделать вывод, что системы в равной степени пригодны для поиска основных массивов данных: для мРНК человека результаты близки (NCBI: 2 652, ENA: 2 157), однако NCBI предоставляет более детализированную и структурированную информацию за счет разделения на GenBank и курируемый RefSeq, что делает его предпочтительным для комплексного анализа. ENA эффективна для быстрого получения конкретных архивных записей.


Карты локального сходства

В рамках исследования проведен сравнительный поиск информации о генах и мРНК белка альбумин в двух международных базах. Результаты по NCBI (сводные данные в Таблице 2) и ENA приведены ниже.

Результаты поиска в ENA:

  • мРНК человека: 2 157 записей
  • Геномная ДНК человека: 13 записей

Так как поиск в базе ENA по альбумину человека дал значительно меньше записей (2 157 для мРНК), чем общий поиск в NCBI (9 254 для мРНК), для корректного сравнения систем пришлось ориентироваться на данные, относящиеся только к человеку (Homo sapiens).

Исходя из сравнения итоговых цифр, можно сделать вывод, что системы в равной степени пригодны для поиска основных массивов данных: для мРНК человека результаты близки (NCBI: 2 652, ENA: 2 157), однако NCBI предоставляет более детализированную и структурированную информацию за счет разделения на GenBank и курируемый RefSeq, что делает его предпочтительным для комплексного анализа. ENA эффективна для быстрого получения конкретных архивных записей.


Placeholder

Практикум 6

Секвенирование по Сэнгеру

Тык

Placeholder

Практикум 8

Нуклеотидный BLAST

Тык

Placeholder

Практикум 9

EMBOSS, Entrez Direct, NCBI Datasets

Тык