EnsEMBL и другие геномные браузеры.


задание №1. EnsEMBL.


Портал EnsEMBL (читается "ансамбль", от французского слова "ensemble" отличается написанием, намекающим на банк EMBL) расположен по адресу http://www.ensembl.org и предназначен для визуализации известной информации о геномах человека и животных.


В задании по банку EMBL я описывал ген NG23. Он же в геноме человека имеет название ENSG00000228727, а, скажем, в геноме мыши (ген встречается у нескольких организмов) - ENSMUSG00000036185, что я нашел примечательным, так как впервые работаю с данным типом идентификаторов.

Браузер сразу же отыскал данный ген, который располагается на 6 хромосоме: Chromosome 6: 31,730,576-31,732,628
gene
Следуя рекоммендации с сodomo, я зашел на страницу поиска "BLAST/BLAT" и загрузил белковую последовательность Q6MG63 для того же гена (ген имеет реальный продукт), затем с помощью TBLASTN нашел схожие участки в геноме человека. ЕслиЕсли точнее, было предложено искать соответствие в различных организмах (выбираем человека). В результате получаем выдачу из 8 участков, 6 из которых располагаются на 6 хромосоме, причем все они с p-value 1.4е-44:
расположение в геноме длина последователности название гена
  • 6:31730832-31730945(1)
  • 6:31731192-31731332(1)
  • 6:31731841-31731936(1)
  • 6:31732043-31732048(1)
  • 6:31732127-31732132(1)
  • 6:31732213-31732305(1)
  • 7:57484886-57485083(1)
  • 7:57485257-57485379(1)
  • 114
  • 141
  • 96
  • 6
  • 6
  • 93
  • 198
  • 123
  • Q6MG63.1 (1-38)
  • Q6MG63.1 (39-85)
  • Q6MG63.1 (86-117)
  • Q6MG63.1 (118-119)
  • Q6MG63.1 (115-116)
  • Q6MG63.1 (117-147)
  • Q6MG63.1 (39-106)
  • Q6MG63.1 (107-146)

Места расположения генов отмечены на картинке.
regiones

Заметим, что все 6 участков генома из 6 хромосомы, выданные браузером попали в реальное место расположения гена, поэтому можно сказать, что ген найден правильно, а разбивка стала следствием наличия интронов.

Это предположение укрепилось после нажатия на одну из ссылок выравнивания, так как браузер перешел на знакомую картинку расположения генов в хромосоме 6, но с более узкими границами:


Из интереса я рассмотрел, что показал TBLASTN на 7 хромосоме, приблизив, наибольший участок из двух.
В данном участке генома не оказалось кодирующих генов, но находился довольно большой псевдоген PR11-114G11.2-001, причем, транскрибируемый.

В любом случае, по результатам поиска можно было однозначно отсеять ненужные результаты и быстро перейти к интересующему нас гену целиком. На картинки выше (рис.1) можно рассмотреть, какую информацию предоставляет сервер уже на картинке (можно отличить транскрибируемые участки, псевдогены, кодирующие белки, некодирующие участки... В белках различить интроны и экзоны, также можно узнать об описанных промоторах и неассоциированных с генами участках и даже содержание гуанина и цитозина).

С помощью ссылки слева вверху "Alignments (text)" можно перейти к тексту выделенного участка, например, участка гена, где будут выделены интроны и (красным) экзоны см. ссылку.
На странице "Region Comparison" можно более наглядно сравнить информативные участки на выделенном куске хромосомы.
На странице "Synteny" можно отыскать похожие участки хромосом в других организмах, например в мыши.

К сожалению, при поиске возникают проблемы, скажем, браузер выдает сравнение с хромосомой 6, но называет ее первой хромосомой.
Зато я все же выяснил, что родственный участок хромосомы 6, где закодирован ген, лежит у мыши в 17 хромосоме, что приятно, так как было заранее известно, что мышь несет такой же описываемый ген, что и человек.

В разделе "Genetic Variation" на странице "Resequencing" можно сравнить 3 генома человека на предмет различий.
В частности, на описываемом участке Chromosome 6: 31,730,576-31,732,628 в экзоне , как и все разы в классе, у Уотсона была зафиксирована делеция...

Все, что было описано ранее находилось в разделе "Location" (сверху страницы).
Теперь, если перейти в раздел "Gene", можно, например узнать, что данный ген имеет 3 рамки считывания, что довольно удивительно. Все они различаются лишь небольшим начальным фрагментом, который явно не имеет большого значения.
В разделе "Transcript" можно узнать краткую информацию о четырех транскриптах с данного участка (по одному на только что упомянутые варианты белка + один участок с некодирующим транскриптом).


задание №2. Другие геномные браузеры.


Ознакомьтесь ещё с каким-нибудь геномным браузером. Ссылки на три других браузера имеются в EnsEMBL'е на странице, посвящённой участку генома, в меню слева. В отчёте опишите свои впечатления. Желательно сравнение с EnsEMBL (например, сравните визуализацию информации о каком-либо участке хромосомы или информацию о каком-либо конкретном гене).





На страницу 3 семестра


© Aleshin Vasily