Cкрипт

Скрипт читает файл в формате fasta, содержащий аминокислотные последовательности, и возвращает долю каждой аминокислоты в этих последовательностях (в виде таблицы). В переменную myfile запишите имя Вашего файла. Чтобы запустить скрипт, надо в командной строке Far Manager набрать "python <название скрипта>". Ссылка на сам скрипт. Работу скрипта Вы можете проверить на прилагаемом тестовом файле.

  
# MSU FBB. Bioinformatics. Term 1. Block 2. Practice 10. Task 2. 
# A script, that returns the percentage of all aminoacids in some proteome.       
# Author: Moldovan M. A.                                         
# Last modification date: 15.11.2013                             
	 
myfile = 'NC_012668.faa'
faa = open(myfile)

proteome = []
aminoacids = {}

for temp_str in faa:
    temp_str = temp_str.strip()
    if temp_str[0] != '>':
	proteome.append(temp_str)

summ = 0

for line in proteome:
    for letter in line:
	if letter in aminoacids:
	    aminoacids[letter] = aminoacids[letter] + 1
	    summ = summ + 1
	else:
	    aminoacids[letter] = 1
	    summ = summ + 1

for aacid in aminoacids.keys():
    q = float(aminoacids[aacid])/summ
    per = (float(aminoacids[aacid])/summ)*100 
    print '%s	%f	%f' % (aacid, q, per)

faa.close
	  

© Молдован Михаил, 2013 (Последнее исправление: 24.12.2013)

Valid HTML 4.01 Strict