Лабораторный журнал. Сравнительная характеристика гомеобокссодержащего гена Pax6 и изоформ у амфибий.

Первоначальный план работы

Литературный обзор, список статей

Информация из прочтенных статей и дополнительных ресурсов будет постепенно появляться здесь.

Прочитанные статьи:

  1. "Mechanisms controlling Pax6 isoform expression in the retina have been conserved between teleosts and mammals" Jörn Lakowski, Anirban Majumder, James D. Lauderdale
  2. "A de novo assembly of the newt transcriptome combined with proteomic validation identifies new protein families expressed during tissue regeneration" Mario Looso, Jens Preussner, Konstantinos Sousounis, Marc Bruckskotten, Christian S Michel, Ettore Lignelli1, Richard Reinhardt, Sabrina Höffner, Marcus Krüger, Panagiotis A Tsonis, Thilo Borchardt and Thomas Braun
  3. "Using transcriptomics to enable a plethodontid salamander (Bolitoglossa ramosi) for limb regeneration research" Claudia M. Arenas Gómez, Ryan M. Woodcock, Jeramiah J. Smith, Randal S. Voss and Jean Paul Delgado

Ход работы, полученные данные

Первым делом были просмотрены последовательности (как белковые, так и нуклеотидные) в бд NCBI, связанные с pax6. При этом было задано несколько запросов:

  1. Gene (paired box 6) and urodela[Organism]. Выдача: 0
  2. Gene (paired box 6) and caudata[Organism]. Выдача: 0
  3. Gene (paired box 6) AND anura[Organism]. Выдача: 10, сделана таблица
  4. Protein (pax6) and urodela[Organism]. Выдача: 10, сделана fasta
  5. Protein (pax6) and anura[Organism]. Выдача: 53, сделана fasta
Как видно запросы немного отличаются. В первом и втором запросе от названия самого белка/гена ничего не изменяется. В третьем запросе количество замене pax6 на paired box 6 уменьшает количество найденных последовательностей и убирает из них ненужные (например, insulin receptor substrate 1 L homeolog), которые случайно попадаются (видимо, из-за частичного сходства с запросом). Однако, меня заинтересовал вопрос, а все ли последовательности мы выбрали, ведь в банке лежит много неопределенных белков или белков которые называют Pax-6-like, помимо этого у белка есть множество синонимов:an2; mgda; pax6; wagr; pax-6; pax6a; xpax6; XLPAX6; pax6-a; pax6-b. Поэтому я думаю надо выбрать из банка NCBI или (Swiss-Prot) нуклеотидную последовательность и прогнать ее через BLAST (хотя бы чтобы понимать сколько всего есть подобных последовательностей) (делать ли это?). Потом можно выбрать из них последовательности нужных нам организмов (после выдачи бласта там можно отфильтровать последовательности по нужным параметрам в том числе и таксономии). А дальше работать с этими последовательностями. В любом случае работать с 30 последовательностямиЮ которые есть в NCBI наверное не очень хорошо.

Помимо этого была просмотрена доменная архитектура для pax6, в базе данных Pfam. Для этого был использован поиск по ключевому слову pax6 и выбрано семейство с ID: PAX. Данное семейство содержит 47 вариантов архитектуры. Из всех архитектур я просто выделил несколько указанных, как структуры pax-6, но основной для нас структурой является pax-6 с гомеодоменом, структура которого отображена на рисунке 3.

pax6_arc_1

Рис.1 Первая архитектура Pax-6.

pax6_arc_2

Рис.2 Вторая архитектура Pax-6.

pax6_arc_3

Рис.3 Основная архитектура Pax-6.

Помимо этого для лучшего поинимания изучаемой темы, были просмотрены структуры имеющихся белков Pax-6. Структура, правда, есть только для человеческого белка. Но для общего понимания структурного устройства, вполне достаточно.

Структура Pax-6 и гомеодомена

Для того, чтобы найти как можно больше белков для дальнейшей работы с ними был разработан следующий подход. В б/д Uniprot будет создан запрос, содержащий навание таксона, парный домен и гомеодомен (taxonomy:caudata database:(type:pfam pf00292) database:(type:pfam pf00046)). Где pf00292 - номер парного домена в б/д pfam и pf00046 - гомеодомена. На выходе получили 8 вариантов белка 3 организмов: Cynops pyrrhogaster, Ambystoma mexicanum и Pleurodeles waltl. Файл Аналогичный запрос был сделан и для anura. Файл После этого был отдельно взята последовательность одного из белков, а именно Xenopus laevis (т.к. он единственный из всех находок являлся Reviewed). После этого был запущен белковый BLAST с максимальным количеством находок 5000. Искал по последовательности pax6 Xenopus laevis. Порог E-value решил сделать 7e-87, т.к. после него шли последовательности не нужных белков (или они были unpredicted). Таким образом всего находок стало 1952. Далее из всех этих находок были взяты находки относящиеся к организмам, которые нам интересны.

Так же для анализа было важно узнать какие из отобранных нами организмы имееют/не имеют и в каком виде представлены их транскриптомы (геномы).