Genome Browsers

~mashkovskayaav

UCSC

Для выполнения задания был взят человеческий белок эластин (ELN); этот белок является частью эластичных волокн, входящих в состав экстрацеллюлярного матрикса и придающих эластичность органам и тканям организма (сердце, кожа, легкие, сосуды и др.);

Запись в UCSC;

○ Полное название: Homo sapiens elastin

○ Короткое название: ELN

○ Цепь: прямая (+)

○ Хромосома: №7

○ Плечо и полоса: chr7:q11.23

○ Положение на хромосоме:

- Транскрипт: chr7:74,027,789-74,069,907

- Кодирующий регион: chr7:74,028,188-74,068,700

15 альтернативных продуктов (ссылка);

- Первый вариант: 33 экзона; длина белка: 724 аминокислоты;

- Второй вариант: 34 экзона; длина белка: 786 аминокислот;

- Третий вариант: 32 экзона; длина белка: 706 аминокислот;

Полное изображение

Ensembl

- Для построения выравнивания в Ensembl был взят ген ITIH3 ENSG00000162267, кодирующий третью цепь интер-альфа-трипсин ингибитора, который сравнивался с гомологичным белком шимпанзе;

Выравнивание в формате fasta

○ Для оценки различий между последовательностями в выравнивании использовалась команда distmat пакета Emboss;

○ Результат:

                            Distance Matrix                                          
                            ---------------                                          
                                                                                     
                            Uncorrected for Multiple Substitutions                   
                            Using base positions 123 in the codon                    
                            Gap weighting is 0.000000                                
                                                                                     
                            	    1	    2                                    
                            	  0.00	  0.91		homo_sapiens_1-14277 1   
                            		  0.00		pan_troglodytes_1-14277 2

○ Показатель 0.91 означает, что на 100 оснований в выравнивании последовательностей приходится в среднем 0.91 замен нуклеотидов;

○ Длина выравневания: 14277, соответственно всего присутствует:

(14277·0.91)/100 ≈ 130 нуклеотидных замен;


- Кроме того, для белка была составлена таблица полиморфизмов (экспортированная таблица Excel);

○ В таблице отражены лишь нуклеотидные замены и не учитываются вставки и делеции; это необходимо для более правдивого сравнения, поскольку команта distmat, исходя из ее описания, рассматривает лишь нуклеотидиные замены;

○ Из числа строчек в таблице видно, что обнаружено 12680 вариантов полиморфизмов;


©Машковская Анна, 2018