Третий семестр

Главная
Обо мне
Проекты
Заметки

Важные сайты:

Сервер kodomo

Официальный сайт МГУ

Официальный сайт ФББ

Онлайн BLAST

Поиск организма по фрагменту нуклеотидной последовательности

По заданному фагменту:

	
	ctgctgcgcaaggtatattggcaggtattaatgcagctagatatgttcaaaataaaccag
	ggtggtatccaagacgagatcaggcgtatttaggggttttggtagatgatttatgtacat
	atggaacaaaagaaccgtatcgtatgtttacttctagatcagaatatcgtttatctttaa
	gggaggataatgctgatttaagattaactactgttgctagagagtttggtttaattgatg
	ataatagatggagaattttttgtttaaaacaggaaaatattgagaaagaacgtcagagat

с помощью сайта NCBI BLAST был проведен поиск этого 300-нуклеотидного фрагмента, для уставки организма к которому он пренодлежит.

В результате было установленно, что фрагмент принадлежи организму Candidatus Blochmannia floridanus. Ген имеет AC RefSeq: NC_005061. Координаты: 1145...1444. Этот участок водит в стотав gene="gidA" имеющего кооординаты 1..1905. Ген gidA кодирует UniProtKB/Swiss-Prot: Q7VQW3 tRNA uridine 5-carboxymethylaminomethyl modification enzyme MnmG.

Поиск гомолога белка человека в слоне

Для получения списка белков, идентификаторы которых начинаются со слова "MED", была использованна команда: infoseq sw:med*_human -only -name -desc -out m_protein.txt

Файл с последовательностью белка с идентификатором MED13_HUMAN был получен командой seqret sw:med13_human -auto.

При поиске гомолого белка MED13_HUMAN, был использован сайт ENA Sequence Search. Поиск производился с параметрами "spliced translated nucleotide search", для поиска "цельного" белка, а не отдельных экзонов. В ходе поиска была полученна следеющая таблица на сайте. Из нее видно, что было полученно 7 гомологов белка MED13_HUMAN, из них есть одно имеющее лучшее e-value - это "0". Подробности о находке представлены на Таблице 1.

Таблица 1. Лучшая находка, среди гомологов белка MED13_HUMAN в африкансом слоне Loxodonta Africana.

Поиск некодирующих последовательностей программой BLAST

Определеными операцияия был получен фрагмент одной из тРНК бактерии Thermodesulfovibrio yellowstonii, относящаяся к порядку Nitrospirales. Был произведен поиск гомологов данной последовательности по всем бактериям, относящимся к тому же порядку Nitrospirales.

запускал несколько раз blast и он выдавал не те результаты поиска. поскольку поиск по всем параметрам всегда сохранял то что последоватльеность принадлежит Bacteria и Nitrospirales, blast 5 раз подрят выдал результаты без учета критерия порядка бактерии. Практика показала, что стоит использовать один праметр - Organism: Nitrospiralesю.

  • a) алгоритмом megablast: одна находка, являющаяся самой последовательностью, по которой велся поиск.
  • b) алгоритмом blastn с параметрами по умолчанию: четыри находки из котрых три имеюют e-value < 0,001.
  • c) алгоритмом blastn с длиной слова = 7, match/mismatch = 1/-1 (максимально чувствительные параметры, доступные на сайте): четыри находки из четырех, котрые имеют e-value < 0,001
  • Итог: алгоритмом blastn с параметрами по умолчанию последовательности AP012342.1(AC GenBank) ставит e-value 0.096. Этот же алгоритм с параметрами(длиной слова = 7, match/mismatch = 1/-1) ставит 7e-46. Это наверное объясняется тем, что из-за уменьшения длины слова, кусочные совпадения не считаются столь случайными. Получается все эти алгоритмы хороши, но каждый для определенного рода задачи.

    © Medvedev Dima 2012; дата последнего обновления 23.11.2013