На страницу третьего семестра

Зачетное задание

  1. Выбор программы. Для решения поставленной задачи была выбрана программа Blastx так как в данном случае в нашем распоряжении была неизвестная нуклеотидная последовательность. Если использовать другой геном для сравнения участков, можно определить кодирующие участки. Так как та последовательность аминокислотная.
  2.   Гипотетические гены во фрагменте 1-5000      
    
          3'----[Q8ZNN6,4501-3803]--[Q8ZNN7, 3677-1305]---[Q9X607,768-319]---------5'
        
         Так как на самом деле участок начинается с 4229583 остатка, то расположение генов выглядит так:  
    
    
          3'----[<=Q8ZNN6,4234084-4233386]--[<=Q8ZNN7, 4233260-4230888]---[<=Q9X607,4230351-4229902]---------5'
          Из всех записей, полученных в результате работы с Бласт, пришлось выбрать только три, так как координаты
          кодирующих участков в большинстве случаев перекрываются.
       Результаты, выданные банком EMBL:
    
       Q8ZNN7   stcC   complement(18492..20993) 
       Q9X607   bcfE   9440..10000 
       Q8ZNN6   stcB   complement(20995..21692)
    
          Схема расположения генов, по результатам, выданным банком EMBL:
    
         3'----[<=stcB,21692-20995]--[<=stcC,20993-18492]------5'
    
         5'---[bcfE,9440-10000=>]--------------------------3'
    Таким образом, можно отметить, что расположение генов stcC и stcB похоже в двух случаях, несмотря на то, что в первом случае расстояние между ними в 126 нуклеотидов, а во втором в 2, такие данные очень близки. длина их совпадает с точностью до 1 нуклеотида. Таким образом, их взаимосвязь очевидна. Таким образом, мембранные белки, кодируемые этими генами, наверное кодируются и в полном геноме. Что касается гена Q9X607 , про него сложно сделать какие-либо выводы. На этот ген существует две записи, в одной из них, он фигурирует для гена bcfE, а в другой, он упоминается как "putative fimbrial subunit A" и также ORF2; гомолог fimA. Судя по тому, что даже его расположение в двух случаях находится на комплементарной и прямой цепях, можно сделать вывод, что связи нет.
  3. Использованные команды:
       - seqret kpn_genome.fasta -sask - для того, чтобы вырезать участок из последовательности.
    
       -  formatdb -i salty_proteome.fasta -p T -n slt -s -t salty_proteome -e  - для создания индексных файлов, причем с указанием того, что последовательность аминокислотная.
    
       - blastall -p blastx -i kpn2jun2003.fasta -F F -e 0.001 -d slt -o res blastall -p blastx -i kpn2jun2003.fasta -F F -e 0.001 -d slt -o res - для того, чтобы на выходе получить файл
    с находками сходных участков исодной последовательности и генома salty. Причем с указанием e-value меньше 0.001

    ©Babskaya Evgeniya, 2005