Главная | Семестры | Проекты | Обo мне | Ссылки | Заметки | Назад к оглавлению |
Геномные браузеры
1. UCSC
Найдем белок TM50B_HUMAN и некоторую информацию о нем:
- короткое и полное имя гена: TMEM50B и Homo sapiens transmembrane protein 50B
- на какой цепи он закодирован: -
- в какой хромосоме находится: 21
- к каким плечу и полосе принадлежит участок: chr21:q22.11
- координаты гена в последовательности хромосомы: 34,804,793-34,852,316
- сколько альтернативных продуктов закодировано в гене: 1
- для каждого продукта число экзонов и длину аминокислотной последовательности:
продукт число экзонов длина аминокислотной последовательности transmembrane protein 50B 8 158
2. Ensembl
Построим выравнивание выбранного гена TMEM50B человека с гомологичным геном шимпанзе и определим число различий.
Для этого на сайте Ensembl найдем ген (в человеке). В меню слева выберем Comparative Genomics - Genomic alignments. И в выпадающем списке выберем выравнивание с шимпанзе (chimpanzee). Сохраним полученное выравнивание с помощью export data - слева (в формате CLUSTAL удобный вид для прочтения). Полученный файл tm50_h-c.txt.
Число различий определяем с помощью команды distmat пакета EMBOSS (определяем в файле формата fasta для опять же удобства): distmat tm50_h-c.fasta
Итого 1.25 (среднее на 100) отличий.
Сравним его с числом часто встречающихся полиморфизмов (различий в геномах разных людей) в этом же гене: ((34,852,316-34,804,793) * 1.25)/100=594 => это число вообще-то говоря не имеет никакого отношения к количеству часто встречающихся полиморфизмов с человеком и сравнение не очень то корректно: