Главная | Семестры | Проекты | Обo мне | Ссылки | Заметки | Назад к оглавлению |
Онлайн BLAST
1. Поиск организма по фрагменту нуклеотидной последовательности
Заданный 300-нуклеотидный фрагмент:
>18 gtatgcgaagcctgcgtaccatgtataacatatggaacgtagacaaaaactccgtggtca acgtatgctgcctactacaacaggcgcagagagaagctgttgcaattgcaagtcatatca gcgaatacgacgcaaacacttttcgaaaaacgcctcattataacttgctcaagtaccagg ttgctgacagtcaaggcaagaacaaggaatacctcgtgcatagtaaaataaaagcgatgg ctggtgaaatagaaaaagttctgccaagtatatcaagcataatagcgaagaagagcgggc
По нему с используя программу megablast, определяем к какому организму принадлежит данный фрагмент и некоторую другую информацию:
- Организм: Anaplasma marginale
- AC записи RefSeq: YP_153445.1
- Координаты фрагмента в этой записи: 1145-1444
- Фрагмент предположительно кодирует белок (Hypothetical protein), а в заметках написано, что название у него Glimmer 2
2. Поиск гомолога белка человека в слоне
С помощью команды infoseq sw:t*_human -only -name -desc -out t_protein.txt получила файл с названиями и краткой информацией о белках, которые начинаются на первую букву моей фамилии. Выбрала белок TM50B_HUMAN. И с помощью команды seqret sw:TM50B_HUMAN -auto получила файлс последовательностью трансмембранного белка:
>TM50B_HUMAN P56557 Transmembrane protein 50B (HCV p7-trans-regulated protein 3) MAGFLDNFRWPECECIDWSERRNAVASVVAGILFFTGWWIMIDAAVVYPKPEQLNHAFHT CGVFSTLAFFMINAVSNAQVRGDSYESGCLGRTGARVWLFIGFMLMFGSLIASMWILFGA YVTQNTDVYPGLAVFFQNALIFFSTLIYKFGRTEELWT
На сайте ENA проведем поиск гомолога этого белка в геноме африканского слона (Loxodonta africana):
- e-value лучшей находки: 1E-69
- длина полученного выравнивания: 125
- identity полученного выравнивания: 99 (это очень хорошо)
- координаты найденного гена в геноме слона: 22505754-22514989
- количество интронов в данном гене слона: 3
3. Поиск некодирующих последовательностей программой BLAST
Найдем и вырежем в отдельный файл последовательность тРНК из генома Beijerinckia_indica.
Затем проведем поиск гомологов данной последовательности по всем бактериям, относящимся к тому же порядку (Rhizobiales) разными способами(через двоеточие указано число находок с e-value < 0,001):
- алгоритмом megablast:
- алгоритмом blastn с параметрами по умолчанию:
- алгоритмом blastn с длиной слова = 7, match/mismatch = 1/-1:
4*. Сравнение программ BLASTN и MegaBLAST.