Скрипт читает файл в формате fasta, содержащий аминокислотные последовательности,
и возвращает долю каждой аминокислоты в этих последовательностях (в виде таблицы).
В переменную myfile запишите имя Вашего файла. Чтобы запустить скрипт, надо в командной строке Far Manager набрать "python <название скрипта>".
Ссылка на сам скрипт.
Работу скрипта Вы можете проверить на прилагаемом тестовом файле.
# MSU FBB. Bioinformatics. Term 1. Block 2. Practice 10. Task 2.
# A script, that returns the percentage of all aminoacids in some proteome.
# Author: Moldovan M. A.
# Last modification date: 15.11.2013
myfile = 'NC_012668.faa'
faa = open(myfile)
proteome = []
aminoacids = {}
for temp_str in faa:
temp_str = temp_str.strip()
if temp_str[0] != '>':
proteome.append(temp_str)
summ = 0
for line in proteome:
for letter in line:
if letter in aminoacids:
aminoacids[letter] = aminoacids[letter] + 1
summ = summ + 1
else:
aminoacids[letter] = 1
summ = summ + 1
for aacid in aminoacids.keys():
q = float(aminoacids[aacid])/summ
per = (float(aminoacids[aacid])/summ)*100
print '%s %f %f' % (aacid, q, per)
faa.close
|