Занятие 10. Распознавание геновЦель данной работы — ознакомится с некоторыми методами распознования генов и их программными реализациями. Поиск влся в следующих предоставленных последовательностях: фрагмент генома фитоплазмы Acholeplasma laidlawii(прокариот) и фрагмент генома мармозетки Callithrix jacchus(эукариот). #1 Прокариоты ORF Finder
мы обнаруживаем ,что первый в списке ген возможно начинается раньше чем начало предоставллого ман куска генома Acholeplasma laidlawii. И действительно, если посмотреть выборку BLAST мы увидем что у всех выравниваний Sbjct начинается с ~70 позиции, а Qwery с ~3. Тоесть Альфа субединица ДНК направленной РНК полимеразы в среднем на 65 нуклеотидов длиннее предсказаного ORF Finderом гена.
В результате получилось что настоящим генном можно считать только второй, а границы первого надо уточнять, предварительно найдя более длинный фрагмент генома Acholeplasma laidlawii. #2 Эукариоты Файл CALJA_Lapshin.txt содержит в заголовке " strand='–' ". Тоесть это изначально комплиментарная цепь гена мормозетки. К сожалению метод с использованием GENSCAN и BlastX не дал удовлетворительных результатов — ниодин экзон не перекрылся. Я склонен винить в этом сложность работы с BLASTX. По результатам поиска сложно выбрать "экзон", поскольку они зачастую выравниваются с очень высоких процентом сходести. И постоянно пересекаются по белку. Сдругой стороны, GENSCAN должен был бы облегчить "муки выбора" предсказав положения "эзонов". Но в экзоны GENSCAN существенно не перекрывались ни с какими экзонами BLASTX.
BlastX Экзоны альтернативны. С genescan не пересекаются.
Human Genome Browser (HGB)
На представленной иллюстрации — пример кассетного альтернативного сплайсинга. |