Предсказание генов у эукариот
GENSCAN
Для фрагмента ДНК из генома человека необходимо определить экзон-интронную структуру гена и описать его альтернативный сплайсинг, используя программу GENSCAN. Программа выявила экзоны только одного гена. Результаты работы программы GENSCAN представлены в таблице 1.
Таблица 1. GENSCAN
Начало | Конец | Цепь | Тип |
1199 | 1280 | + | начальный |
1545 | 1589 | + | внутренний |
14462 | 14581 | + | внутренний |
18868 | 18990 | + | внутренний |
20386 | 20508 | + | внутренний |
22169 | 22540 | + | внутренний |
22637 | 22759 | + | внутренний |
22846 | 22968 | + | внутренний |
23743 | 23862 | + | внутренний |
23966 | 24091 | + | внутренний |
24583 | 24754 | + | внутренний |
25343 | 25561 | + | внутренний |
26483 | 26601 | + | внутренний |
27217 | 27356 | + | внутренний |
27678 | 27819 | + | внутренний |
29379 | 29525 | + | внутренний |
30883 | 30963 | + | внутренний |
31789 | 31958 | + | внутренний |
32842 | 32877 | + | конечный |
Genome Browser
Программа BLAT, аналогично BLAST, позволяет искать последовательности в геноме с учетом возможной фрагментированности генома. Был получен список найденных фрагментов генома. Для дальнейшей работы была выбрана запись 9 хромосомы, имеющая наибольшее сходство с исследуемой последовательнотей: со 100% identity и весом выравнивания 33500. В полученном выравнивании можно увидеть примеры альтернативного сплайсинга: кассетные экзоны и альтернативные акцепторные сайты (см. рисунок 1).
Рис. 1. Предсказание экзон-интронной структуры с помощью Genome Browser. Зеленой рамочкой выделены кассетные экзоны, красной - альтернативный акцепторный сайт.
BLASTX
В этом задании рассматривался фрагмент ДНК из генома киви Actinidia chinensis. Геном киви, в отличии от генома человека, не является хорошо аннотированным, поэтому для предсказания генов этого фрагмента использовалась программа BLASTX. Поиск проводился со следующими параметрами: исключение поиска по моделям и пробам среды, ограничение поиска по белкам растений (Viridiplantae), исключение поиска по геному винограда Vitis vinifera, использование стандартного генетического кода. Информация о предсказанных генах представлена в таблицах 2-10.
Таблица 2. Ген, кодирующий белок SEC3A - компонент EXOC
Номер экзона | Начало | Конец | Цепь |
1 | 19519 | 19361 | - |
2 | 18447 | 18368 | - |
3 | 17579 | 17499 | - |
4 | 17302 | 17203 | - |
5 | 17114 | 16995 | - |
6 | 16261 | 16109 | - |
7 | 14264 | 14147 | - |
8 | 13521 | 13403 | - |
9 | 12872 | 12774 | - |
10 | 12686 | 12544 | - |
12 | 11795 | 11668 | - |
13 | 11591 | 11501 | - |
14 | 11412 | 11362 | - |
15 | 10040 | 9784 | - |
16 | 9715 | 9635 | - |
17 | 9492 | 9400 | - |
18 | 8860 | 8697 | - |
19 | 8655 | 8472 | - |
20 | 8269 | 8174 | - |
22 | 7502 | 7388 | - |
23 | 7201 | 7091 | - |
24 | 7047 | 6922 | - |
25 | 6071 | 6031 | - |
26 | 5930 | 5860 | - |
27 | 5688 | 5580 | - |
Таблица 3. Ген, кодирующий рибосомальный 30S белок S9, из хлоропласта
Номер экзона | Начало | Конец | Цепь |
1 | 24570 | 24286 | - |
Таблица 4. Ген, кодирующий F-box/FBD/LRR-repeat protein At1g13570
Номер экзона | Начало | Конец | Цепь |
1 | 29633 | 28836 | - |
2 | 28557 | 28368 | - |
2 | 27815 | 27558 | - |
Таблица 5. Ген, кодирующий E3 убиквитин лигазу RMA1H1
Номер экзона | Начало | Конец | Цепь |
1 | 36537 | 36292 | - |
Таблица 6. Ген, кодирующий калициевый унипортер 4, из митохондрии
Номер экзона | Начало | Конец | Цепь |
1 | 45808 | 45212 | - |
2 | 44628 | 44203 | - |
Таблица 7. Ген, кодирующий предположительно белок, содержащий PPR, At5g52630
Номер экзона | Начало | Конец | Цепь |
1 | 79084 | 78776 | - |
2 | 79084 | 78800 | - |
Таблица 8. Ген, кодирующий белок метилтрансферазы 2
Номер экзона | Начало | Конец | Цепь |
1 | 82110 | 82175 | + |
2 | 83433 | 83546 | + |
3 | 84417 | 84500 | + |
4 | 85598 | 85660 | + |
5 | 85659 | 85952 | + |
6 | 86280 | 86351 | + |
7 | 86622 | 86780 | + |
Таблица 9. Ген, кодирующий фермент Ubc12
Номер экзона | Начало | Конец | Цепь |
1 | 93293 | 93400 | + |
2 | 94412 | 94519 | + |
3 | 94763 | 94834 | + |
4 | 94930 | 95034 | + |
5 | 95513 | 95656 | + |
Таблица 10. Ген, кодирующий белок репрессор транскрипции (BRASSINAZOLE-RESISTANT 1)
Номер экзона | Начало | Конец | Цепь |
1 | 101069 | 101272 | + |
2 | 102162 | 102836 | + |