├── .gitignore ├── testProtein.py ├── timetest.py ├── aminoAcids.txt ├── README ├── testBinding.py ├── dotPlot.py ├── drawPopulation.py ├── chemistry.py ├── testCell.py ├── solutions.py ├── evolveCell.py ├── analysis.py ├── graphDrawer.py ├── biochemistry.py └── analyseGenomes.py /.gitignore: -------------------------------------------------------------------------------- 1 | *.pyc 2 | *~ 3 | Genomes/ 4 | Images/ 5 | -------------------------------------------------------------------------------- /testProtein.py: -------------------------------------------------------------------------------- 1 | import biochemistry 2 | 3 | p = biochemistry.Protein('QNLTTTTTTL', 'solution') 4 | p.output() 5 | -------------------------------------------------------------------------------- /timetest.py: -------------------------------------------------------------------------------- 1 | import timeit 2 | 3 | t = timeit.Timer('x = virtualCell.Solution(1000) \nx.setMetabolites("default")', 'import virtualCell') 4 | 5 | test_result = t.repeat(3, 100000) 6 | print min(test_result) -------------------------------------------------------------------------------- /aminoAcids.txt: -------------------------------------------------------------------------------- 1 | L 0, 0, 0, 0 2 | M 2,-2,-2,-4 3 | N -2, 2,-4,-2 4 | O -2,-4, 2,-2 5 | P -4,-2,-2, 2 6 | Q 2,-1, 1,-1 7 | R -1, 2,-1, 1 8 | S 1,-1, 2,-1 9 | T -1, 1,-1, 2 10 | U 2, 1, 0,-4 11 | V 1, 2,-4, 0 12 | W 0,-4, 2, 1 13 | X -4, 0, 1, 2 14 | Y 2,-3, 2,-3 15 | Z -3, 2,-3, 2 -------------------------------------------------------------------------------- /README: -------------------------------------------------------------------------------- 1 | Python simulation of a single-celled organism 2 | Peter Collingridge 2010 3 | 4 | > testCell.py 5 | This is the top-level module 6 | * Gives an example of how to create and update cells 7 | * Runs simulation for 48000 units of time 8 | 9 | > virtualCell.py 10 | * Defines Solution and Cell classes 11 | * Imports 12 | 13 | > biochemistry.py 14 | * Contains all_metabolites list and all_reactions dictionary 15 | * Defines Metabolite, Reaction and Protein classes 16 | 17 | > graphDrawer.py 18 | * Takes multiple time series and plots them as an SVG 19 | -------------------------------------------------------------------------------- /testBinding.py: -------------------------------------------------------------------------------- 1 | import virtualCell 2 | import drawSVGGraph 3 | 4 | DNA = 'AADADD' # Promoter 5 | DNA += 'BB' # Bind DNA 6 | DNA += 'AA BBBABBBA AA' # With QPQP 7 | DNA += 'BA' # Ribosome 8 | DNA += 'ACAA' # ATPase 9 | DNA += 'DDAAAA' # End 10 | 11 | DNA += 'ADDADD' # Promoter 12 | DNA += 'BB' # Bind DNA 13 | DNA += 'AA BBBBBBBA AA' # With QQQP 14 | DNA += 'DDAAAA' # End 15 | 16 | solution = virtualCell.Solution(10000.0) 17 | cell = solution.addCell(1000.0) 18 | cell.metabolites['EH'].amount += 80 # Add ATP 19 | cell.metabolites['JG'].amount += 80 # Add Amino acids 20 | 21 | cell.addDNA(DNA) 22 | cell.addProtein('QLQPQPLPNL', 2.0) 23 | 24 | #print "\n -Proteins-" 25 | #cell.output('proteins') 26 | #cell.output('metabolites') 27 | 28 | sim_time = 5001 29 | data_collection_functions = {\ 30 | #'ribosome': (lambda cell: cell.proteins['QLQPQPLPNL'].amount), 31 | #'repressor': (lambda cell: cell.proteins['QLQQQPL'].amount)}#, 32 | 'tf on tf': (lambda cell: cell.proteins['QLQPQPLPNL'].binding_domains[0].targets[cell.genes[0]][1]), 33 | 'tf on in': (lambda cell: cell.proteins['QLQPQPLPNL'].binding_domains[0].targets[cell.genes[1]][1]), 34 | 'in on tf': (lambda cell: cell.proteins['QLQQQPL'].binding_domains[0].targets[cell.genes[0]][1]), 35 | 'in on in': (lambda cell: cell.proteins['QLQQQPL'].binding_domains[0].targets[cell.genes[1]][1])} 36 | #'ribosome occupancy': (lambda cell: cell.genes[0].occupancy, []))} 37 | 38 | data_collection = dict([(key, []) for key in data_collection_functions.keys()]) 39 | 40 | for t in range(sim_time): 41 | cell.metabolites['EH'].amount = 80 42 | solution.update() 43 | for d in data_collection.keys(): 44 | data_collection[d].append(data_collection_functions[d](cell)) 45 | 46 | for k, v in data_collection.items(): 47 | print k, v[-1] 48 | 49 | print "\n -Proteins-" 50 | cell.output('proteins') 51 | cell.output('metabolites') 52 | 53 | g = drawSVGGraph.Graph() 54 | g.x_axis_label = "Time" 55 | g.data = data_collection 56 | print g.data.keys() 57 | 58 | g.outputSVG('test', width=400, height=300) -------------------------------------------------------------------------------- /dotPlot.py: -------------------------------------------------------------------------------- 1 | def initiliseSVG(filename, (width, height)): 2 | svg = open(filename + '.svg', 'w') 3 | svg.write('\n') 4 | svg.write("""""") 5 | svg.write('\n') 39 | 40 | def plot_dot_lines(DNA): 41 | for i in range(num_NTs-2): 42 | line_length = 0 43 | 44 | for j in range(1, num_NTs-i): 45 | if DNA[j] == DNA[j+i]: 46 | line_length += 1 47 | else: 48 | if line_length > 5: 49 | print i, j, line_length 50 | (x, y) = (scale * (j-line_length), scale * (j+i-line_length)) 51 | svg.write('\n' % (scale*j, scale*(j+i), x, y)) 52 | line_length = 0 53 | svg.write('') 54 | 55 | DNA = 'BACBCCDBCBCAADADDAABABDBBADDCCAAADADBACCBCADCCDDAABCABDDAABABDBCAACCACACABDCAADDAABABDBBADCBDDDAABACBCCDBCBCAADADDAABABDBBADDADDABADCABCBDDAABCABDDAABABDBCAADDCDCDDDDAABABDBBADBACDDAABACBCCDBCBCAADADDAABABDBBADDACDAADBAAAADDDAABCABDDAABABDBCAAAAACCDCABDDAABABDBCAAADDDDDABCCAACBADCDADDAABABDBBADCBCDDAABABDBBADDCDABBDDAABABDBCAAACACCDCCDCBAB' 56 | num_NTs = len(DNA) 57 | scale = 1 58 | 59 | svg = initiliseSVG('test', (scale*num_NTs+2, scale*num_NTs+2)) 60 | dot_colours = {'A': 'red', 'B': 'blue', 'C': 'green', 'D': 'black'} 61 | 62 | #plot_dot_plot(DNA) 63 | plot_dot_lines(DNA) 64 | -------------------------------------------------------------------------------- /drawPopulation.py: -------------------------------------------------------------------------------- 1 | class PopulationDiagram(): 2 | def __init__(self, genomes): 3 | self.genomes = genomes 4 | 5 | self.cols = 8 6 | self.rows = 16 7 | self.max_radius = 16 8 | 9 | def findRanges(self): 10 | fitness = [] 11 | gene_numbers = [] 12 | 13 | for g in self.genomes: 14 | fitness.append(g.fitness) 15 | gene_numbers.append(len(g.genes)) 16 | 17 | self.min_gene_number = min(gene_numbers) 18 | self.max_gene_number = max(gene_numbers) 19 | self.gene_number_range = self.max_gene_number - self.min_gene_number 20 | self.max_fitness = max(fitness) 21 | 22 | def plotPopulation(self): 23 | self.findRanges() 24 | self.circles = [] 25 | 26 | (x, y) = (self.max_radius, self.max_radius) 27 | column = 1 28 | row_height = self.max_radius 29 | 30 | for g in self.genomes: 31 | size = int(self.max_radius * g.fitness/self.max_fitness) 32 | if g.colour == None: 33 | colour = (0, 0, int(255 * (len(g.genes) - self.min_gene_number)/self.gene_number_range)) 34 | else: 35 | colour = g.colour 36 | 37 | self.circles.append((x, y, size, colour)) 38 | x += self.max_radius*2 39 | column += 1 40 | 41 | if column > self.cols: 42 | column = 1 43 | x = self.max_radius 44 | y += row_height + size 45 | row_height = size 46 | 47 | def outputPlot(self, filename): 48 | (width, height) = (10+self.max_radius*2*8, 10+self.max_radius*2*16) 49 | svg = open(filename + '.svg', 'w') 50 | svg.write('\n') 51 | svg.write("""""") 52 | svg.write('\n') 72 | 73 | -------------------------------------------------------------------------------- /chemistry.py: -------------------------------------------------------------------------------- 1 | class Chemistry: 2 | """ Container for all potential chemicals and reactions """ 3 | 4 | def __init__(self): 5 | self.chemicals = [] 6 | self.masses = {} 7 | self.charges = {} 8 | self.stabilities = {} 9 | self.reactions = [] 10 | 11 | def addElements(self, names, masses, charges): 12 | for i, name in enumerate(names): 13 | self.chemicals.append(name) 14 | self.masses[name] = masses[i] 15 | self.charges[name] = charges[i] 16 | self.stabilities[name] = 16 * masses[i] / charges[i] **2 17 | 18 | def addMolecules(self, molecules): 19 | for m in molecules: 20 | self.chemicals.append(m) 21 | self.stabilities[m] = self.masses[m[0]] * self.masses[m[1]] * self.charges[m[0]] * self.charges[m[1]] 22 | 23 | def addReaction(self, substrates, products): 24 | k1 = 2.4 / sum(self.stabilities[s] for s in substrates) 25 | k2 = 2.4 / sum(self.stabilities[p] for p in products) 26 | self.reactions.append(Reaction(substrates, products, k1, k2)) 27 | 28 | class Reaction: 29 | def __init__(self, substrates, products, k1, k2): 30 | self.substrates = substrates 31 | self.products = products 32 | self.k1 = k1 33 | self.k2 = k2 34 | 35 | def defineMetabolitesAndReactions(): 36 | c = Chemistry() 37 | 38 | # Define elements 39 | #elements = ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'] 40 | elements = ['E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', ] 41 | masses = [1.0, 2.0, 3.0, 4.0, 2.5, 5.0, 7.5, 10.0] 42 | charges = [1, 2, 2, 1, 1, 2, 3.2, 1.6] 43 | c.addElements(elements, masses, charges) 44 | 45 | # Define molecular species 46 | molecules = [elements[x*4+y] + elements[z*4-y+3] for x in (0,1) for y in (0,1) for z in (0,1)] 47 | molecules += [elements[x] + elements[y] for x in (1,5) for y in (1,5)] 48 | c.addMolecules(molecules) 49 | 50 | # Define 12 hydrolysis/synthesis reactions 51 | for m in molecules: 52 | c.addReaction([m], [m[0], m[1]]) 53 | 54 | # Define 12 transferase reactions 55 | for x, y in zip((0,2,4,6), (7,6,7,6)): 56 | c.addReaction([molecules[x], elements[y]], [molecules[x+1], elements[y-4]]) 57 | for x, y in zip((0,1,2,3), (4,4,5,5)): 58 | c.addReaction([molecules[x], elements[y]], [molecules[x+4], elements[y-4]]) 59 | for x, y in zip((9,10,11,11), (8,8,9,10)): 60 | c.addReaction([molecules[x], elements[1]], [molecules[y], elements[5]]) 61 | 62 | # Define 3 double transferase reactions 63 | for x, y in [(0,5), (2,7), (8,11)]: 64 | c.addReaction([molecules[x], molecules[y]], [molecules[x+1], molecules[y-1]]) 65 | 66 | return elements+molecules, c.reactions -------------------------------------------------------------------------------- /testCell.py: -------------------------------------------------------------------------------- 1 | import solutions 2 | import drawSVGGraph 3 | 4 | # Initilise Solution 5 | solution_metabolites = solutions.default_metabolites 6 | solution_metabolites['FK'] = 0.20 7 | solution_metabolites['IL'] = 0.08 8 | solution_metabolites['FG'] = 0.08 9 | solution_metabolites['JG'] = 0.04 10 | solution_metabolites['EL'] = 0.01 11 | solution = solutions.Solution(24000.0, solution_metabolites) 12 | #solution.output('metabolites') 13 | 14 | # Initilise Cell 15 | cell = solution.addCell(volume=1000.0, metabolites='default') 16 | cell.metabolites['EH'].amount += 40 # Add ATP 17 | cell.metabolites['F'].amount += 40 # Add ATP 18 | #cell.metabolites['JG'].amount += 40 # Add Amino acids 19 | 20 | DNA = 'AAAAAD BB AA BBBBBBBA AA BA ACAA DDAAAA' # Transcription factor 21 | DNA += 'AADAAD AA ACADAA DDAAAA' # FG pore 22 | DNA += 'AADAAD AA ACBDAA DDAAAA' # FK pore 23 | DNA += 'AADAAD AA BCADAA DDAAAA' # JG pore 24 | DNA += 'AADAAD AA ADAA AB BBAA DDAAAA' # G/I antiporter 25 | DNA += 'AADAAD AA BAAA AB BDAA DDAAAA' # H/K antiporter 26 | DNA += 'AADAAD AC AC DDAAAA' # FGase 27 | DNA += 'AADAAD AC AD DDAAAA' # FKase 28 | DNA += 'AADAAD AA ACAA AC AA DDAAAA' # F-driven EHase 29 | 30 | DNA = 'AAAAADBBAABBBBBBBAAABAACAADDAAAAAADAADAAACADAADDAAAAAADAADAAACBDAADDAAAAAADAADAABCADAADDAAAAAADAADAAADAAABBBADDDAAAAAADAADAABAAAABBDAADDAAAAAADAADACACDDAAAAAADAADACADDDAAAAAADAADAAACAAACAADDAAAAABACDAADCCCCBDBCCACDBCBBDBCCCAACADBBAABACDDCDACABCABCCBCA' 31 | 32 | cell.addDNA(DNA) 33 | 34 | for seq in cell.proteins: 35 | cell.proteins[seq].amount += 0.25 36 | cell.proteins['QLQQQPLPNL'].amount += 0.75 37 | cell.output() 38 | 39 | # Data recording options 40 | data_collection_functions = {\ 41 | '[JG]': (lambda cell: cell.metabolites['JG'].amount), 42 | '[EH]': (lambda cell: cell.metabolites['EH'].amount), 43 | '[tf]': (lambda cell: 10*cell.proteins['QLQQQPLPNL'].amount)} 44 | #'tf on tf': (lambda cell: cell.proteins['QLQPQPLPNL'].binding_domains[0].targets[cell.genes[0]][1])} 45 | data_collection = dict([(key, []) for key in data_collection_functions.keys()]) 46 | 47 | # Run Simulation 48 | run_time = 100 49 | for t in range(run_time): 50 | #cell.metabolites['EH'].amount = 80 # Keep ATP constant 51 | #cell.metabolites['JG'].amount = 40 # Keep amino acids constant 52 | solution.update() 53 | 54 | for d in data_collection.keys(): 55 | data_collection[d].append(data_collection_functions[d](cell)) 56 | 57 | # Output 58 | print "\n\t-Solution-\t-Cell-" 59 | metabolites = solution.metabolites.keys() 60 | metabolites.sort() 61 | 62 | for m in metabolites: 63 | print '%s\t%.3f%%\t\t%2.3f%%' % (m, solution.metabolites[m].concentration(), cell.metabolites[m].concentration()) 64 | 65 | cell.output('proteins') 66 | 67 | g = drawSVGGraph.Graph() 68 | g.x_axis_label = "Time" 69 | g.y_axis_label = "Concentration" 70 | g.data = data_collection 71 | 72 | #g.outputSVG('tf graph', width=400, height=250) 73 | -------------------------------------------------------------------------------- /solutions.py: -------------------------------------------------------------------------------- 1 | import biochemistry 2 | 3 | default_metabolites = dict([(m, 0.08/2 ** i) for i, m in enumerate(biochemistry.CHEMICALS[:8])]) 4 | 5 | class Solution(): 6 | def __init__(self, volume, metabolites='default'): 7 | self.volume = volume 8 | self.DNA = [] 9 | self.cells = [] 10 | self.proteins = {} 11 | 12 | self.metabolites = dict([(m, biochemistry.Metabolite(m, self.volume)) for m in biochemistry.CHEMICALS]) 13 | metabolite_dict = metabolites=='default' and default_metabolites or metabolites 14 | self._setMetabolites(metabolite_dict) 15 | 16 | for name, metabolite in self.metabolites.items(): 17 | metabolite.name = "%s(out)" % name 18 | 19 | def _setMetabolites(self, metabolites): 20 | for name, amount in metabolites.items(): 21 | self.metabolites[name].amount = amount * self.volume 22 | 23 | def addCell(self, volume, metabolites='default'): 24 | new_cell = Cell(volume, self, metabolites) 25 | self.cells.append(new_cell) 26 | return new_cell 27 | 28 | def update(self, ticks=1): 29 | for t in range(ticks): 30 | for cell in self.cells: 31 | cell.update() 32 | 33 | def output(self, output_type='all'): 34 | if output_type == 'proteins' or output_type == 'all': 35 | print "\n-Proteins-" 36 | for protein in self.proteins.values(): 37 | protein.output() 38 | 39 | elif output_type == 'metabolites' or output_type == 'all': 40 | print "\n-Metabolites-" 41 | metabolites = self.metabolites.keys() 42 | metabolites.sort() 43 | 44 | for m in metabolites: 45 | print '%s\t%.4f%%' % (m, self.metabolites[m].concentration()) 46 | 47 | elif output_type == 'cells': 48 | print "%d cells" % len(self.cells) 49 | 50 | for cell in self.cells: 51 | cell.output('proteins') 52 | 53 | class Cell(Solution): 54 | def __init__(self, volume, solution, metabolites='default'): 55 | Solution.__init__(self, volume, metabolites) 56 | self.solution = solution # Solution in which the cell exists 57 | self.genes = [] 58 | 59 | for name, metabolite in self.metabolites.items(): 60 | metabolite.name = "%s(in)" % name 61 | 62 | def addDNA(self, DNA_string): 63 | DNA = DNA_string.rstrip().replace(' ', '') 64 | self.DNA.append(DNA) 65 | 66 | for gene_seq in DNA.split('DDAAAA'): 67 | if len(gene_seq) > 6: 68 | gene = biochemistry.Gene(gene_seq) 69 | if len(gene.protein_code) > 1: 70 | self.genes.append(gene) 71 | 72 | for gene in self.genes: 73 | self.addProtein(gene.protein_code, 0.0) 74 | #print "DNA: %s -> %s" % (gene.ORF, peptide) 75 | 76 | def addProtein(self, protein, amount): 77 | if protein not in self.proteins: 78 | self.proteins[protein] = biochemistry.Protein(protein, self) 79 | self.proteins[protein].amount += amount 80 | 81 | def update(self): 82 | for p in self.proteins.values(): 83 | p.update() 84 | -------------------------------------------------------------------------------- /evolveCell.py: -------------------------------------------------------------------------------- 1 | import virtualCell 2 | import random 3 | 4 | def addRandomSequence(seq): 5 | while random.random() < 0.99: 6 | seq += random.choice(['A', 'B', 'C', 'D']) 7 | return seq 8 | 9 | def copySequenceWithErrors(template): 10 | seq = '' 11 | n = 0 12 | 13 | while n < len(template): 14 | if random.random() < 0.999: 15 | seq += template[n] 16 | else: 17 | if random.random() < 0.75: 18 | seq += random.choice(['A', 'B', 'C', 'D']) 19 | else: 20 | n = random.randint(0, len(template)-1) 21 | n += 1 22 | 23 | return seq 24 | 25 | def breedCells(cells): 26 | offspring = [12,8,8,8,4,4,4,4,1,1,1,1,1,1,1,1] 27 | daughter_DNA = [] 28 | 29 | for n in range(len(offpring)): 30 | for daughter in range(offspring[n]): 31 | daughter_DNA.append(copySequenceWithErrors(cells[n].DNA)) 32 | 33 | for n in range(4): 34 | parent = random.randint(0, NUMBER_OF_CELLS-1) 35 | daughter_DNA.append(copySequenceWithErrors(cells[parent].DNA)) 36 | 37 | return daughter_DNA 38 | 39 | def outputGeneration(generation, solution): 40 | outputFile.write('>Generation %d\n' % generation) 41 | 42 | for m in solution.metabolites.keys(): 43 | outputFile.write('%s:%f, ' % (m, solution.metabolites[m].concentration())) 44 | outputFile.write('\n') 45 | 46 | for cell in solution.cells: 47 | outputFile.write('%f\t%s\n' % (cell.metabolites['EH'].amount, cell.DNA[0])) 48 | 49 | print "Generation: %d, Genes: %d, Fitness: %.4f" % (generation, len(solution.cells[0].proteins.keys()), solution.cells[0].metabolites['EH'].amount) 50 | 51 | # Define metabolites in pool 52 | solution_metabolites = virtualCell.default_metabolites 53 | solution_metabolites['FK'] = 0.20 54 | solution_metabolites['IL'] = 0.08 55 | solution_metabolites['FG'] = 0.08 56 | solution_metabolites['JG'] = 0.04 57 | solution_metabolites['EL'] = 0.01 58 | 59 | # Create generation 0 60 | GENERATION_TIME = 48000 61 | NUM_GENERATIONS = 10 62 | NUMBER_OF_CELLS = 64 63 | SOLUTION_VOLUME = 2000000.0 64 | CELL_VOLUME = 1000.0 65 | outputFile = file('110525 genomes.txt','w') 66 | 67 | ancestral_DNA = 'AAAAAD BB AA BBBBBBBA AA BA ACAA DDAAAA' # Transcription factor 68 | ancestral_DNA += 'AADAAD AA ACADAA DDAAAA' # FG pore 69 | ancestral_DNA += 'AADAAD AA ACBDAA DDAAAA' # FK pore 70 | ancestral_DNA += 'AADAAD AA BCADAA DDAAAA' # JG pore 71 | ancestral_DNA += 'AADAAD AA ADAA AB BBAA DDAAAA' # G/I antiporter 72 | ancestral_DNA += 'AADAAD AA BAAA AB BDAA DDAAAA' # H/K antiporter 73 | ancestral_DNA += 'AADAAD AC AC DDAAAA' # FGase 74 | ancestral_DNA += 'AADAAD AC AD DDAAAA' # FKase 75 | ancestral_DNA += 'AADAAD AA ACAA AC AA DDAAAA' # F-driven EHase 76 | ancestral_metabolites = {'E':0.8, 'F':0.4, 'G':0.2, 'H':0.1, 'I':0.05, 'J':0.025, 'K':0.0125, 'L':0.00625} 77 | 78 | daughter_DNA = [addRandomSequence(copySequenceWithErrors(ancestral_DNA)) for n in range(NUMBER_OF_CELLS)] 79 | daughter_metabolites = [] 80 | 81 | for generation in range(NUM_GENERATIONS): 82 | solution = virtualCell.Solution(SOLUTION_VOLUME, solution_metabolites) 83 | 84 | # Create cells 85 | for n in range(NUMBER_OF_CELLS): 86 | cell = solution.addCell(CELL_VOLUME) 87 | cell.addDNA(daughter_DNA[n]) 88 | 89 | for p in cell.proteins.values(): 90 | p.amount = 1 91 | 92 | # Run Simulation 93 | for t in range(GENERATION_TIME): 94 | for cell in solution.cells: 95 | cell.update() 96 | 97 | solution.cells.sort(lambda x, y: cmp(y.metabolites['EH'].amount, x.metabolites['EH'].amount)) 98 | outputGeneration(generation, solution) 99 | 100 | # Takes the genomes from first half of a list of cells and mutates each twice, returning a list of those genomes 101 | # Therefore every cell in the top 50% gets to replicate 102 | daughter_DNA = [copySequenceWithErrors(solution.cells[int(n/2)].DNA) for n in range(NUMBER_OF_CELLS)] -------------------------------------------------------------------------------- /analysis.py: -------------------------------------------------------------------------------- 1 | import os 2 | import biochemistry 3 | 4 | class EvolutionaryRun: 5 | def __init__(self, filename): 6 | self.generations = 0 7 | self.metabolites = [] 8 | self.genomes = [] 9 | self.fitnesses = [] 10 | 11 | evoFile = file(os.path.join('Genomes', filename), 'r') 12 | genomes = [] 13 | fitnesses = [] 14 | 15 | for line in evoFile: 16 | if line[0] == '>': 17 | self.generations += 1 18 | self.metabolites.append(self._getMetabolites(evoFile.next())) 19 | if len(genomes) > 0: 20 | self.genomes.append(genomes) 21 | self.fitnesses.append(fitnesses) 22 | genomes = [] 23 | fitnesses = [] 24 | 25 | else: 26 | temp = line.rstrip('\r').rstrip('\n').split('\t') 27 | genomes.append(temp[1]) 28 | fitnesses.append(temp[0]) 29 | 30 | self.genomes.append(genomes) 31 | self.fitnesses.append(fitnesses) 32 | 33 | def _getMetabolites(self, metaboliteString): 34 | metaboliteDictionary = {} 35 | 36 | for metabolite in metaboliteString.split(', ')[:-1]: 37 | m = metabolite.split(':') 38 | metaboliteDictionary[m[0]] = float(m[1]) 39 | 40 | return metaboliteDictionary 41 | 42 | class Genome(): 43 | def __init__ (self, seq, fitness=None): 44 | self.seq = seq 45 | self.fitness = fitness 46 | self.genes = [] 47 | self.proteins = {} 48 | self.colour = None 49 | 50 | def findGenes(self): 51 | self.genes = self.seq.split('DDAA') 52 | 53 | def findProteins(self): 54 | if not self.genes: 55 | self.findGenes() 56 | 57 | for g in self.genes: 58 | if len(g) > 3: 59 | protein = interpretGene(g) 60 | 61 | if protein in self.proteins: 62 | self.proteins[protein] += 1 63 | else: 64 | self.proteins[protein] = 1 65 | 66 | def outputProteins(self): 67 | proteins = self.proteins.keys() 68 | proteins.sort() 69 | 70 | for p in proteins: 71 | print self.proteins[p], p 72 | 73 | def interpretGene(sequence): 74 | substrates = [] 75 | products = [] 76 | enz_func = None 77 | 78 | n = 1 79 | while n < len(sequence): 80 | codon = sequence[n-1] + sequence[n] 81 | 82 | if enz_func == None: 83 | if codon in biochemistry.codon_to_function: 84 | enz_func = biochemistry.codon_to_function[codon] 85 | 86 | if enz_func[0] == 'r': 87 | substrates.append('JG') 88 | products.append('new protein') 89 | enz_func = None 90 | 91 | elif enz_func[0] == 't': 92 | m = biochemistry.codon_to_metabolite[codon] 93 | if enz_func[1] == 'f': 94 | substrates.append('%s out' % m) 95 | products.append('%s in' % m) 96 | else: 97 | substrates.append('%s in' % m) 98 | products.append('%s out' % m) 99 | enz_func = None 100 | 101 | elif enz_func[0] == 'e': 102 | rxn = biochemistry.all_reactions.get(codon, None) 103 | 104 | if rxn: 105 | if enz_func[1] == 'f': 106 | for s in rxn.substrates: 107 | substrates.append(s) 108 | for p in rxn.products: 109 | products.append(p) 110 | else: 111 | for s in rxn.substrates: 112 | products.append(s) 113 | for p in rxn.products: 114 | substrates.append(p) 115 | enz_func = None 116 | 117 | n += 2 118 | 119 | protein = '' 120 | 121 | if len(substrates) > 0: 122 | for s in substrates[:-1]: 123 | protein += '%s + ' % s 124 | protein += '%s -> ' % substrates[-1] 125 | 126 | for p in products[:-1]: 127 | protein += '%s + ' % p 128 | protein += '%s' % products[-1] 129 | 130 | return protein 131 | 132 | ancestral_DNA = 'CABCAA-CABCAA-BACC-BACD-BADD-BAADBBBC-BAACBBBA-BCAC-BCAD-BAABBCAA-BCAABDBB'.replace('-', 'DDAA') 133 | 134 | e = EvolutionaryRun('Gen 14 genomes.txt') 135 | g = Genome(ancestral_DNA) 136 | g = Genome(e.genomes[0][0]) 137 | g.findProteins() 138 | g.outputProteins() 139 | 140 | -------------------------------------------------------------------------------- /graphDrawer.py: -------------------------------------------------------------------------------- 1 | class Graph(): 2 | def __init__ (self): 3 | self.series = {} 4 | self.variables = {} 5 | self.border = (50, 5, 60, 45) 6 | self.scaleX = 1.0 7 | self.scaleY = 1.0 8 | self.colours = ['#0060e5', '#001060', '#e52060', '#a00030', '#00c020', '#006010' ] 9 | 10 | self.X_axis = Axis(400) 11 | self.Y_axis = Axis(300) 12 | 13 | def addSeries(self, name): 14 | n = len(self.series.keys()) 15 | newSeries = DataSeries(name, n) 16 | self.series[name] = newSeries 17 | 18 | def addDataToSeries(self, name, data): 19 | self.series[name].data.append(data) 20 | 21 | def outputSeries(self, filename, series, X_range=None, Y_range=None): 22 | self.initiliseSVG('Graphs/'+filename) 23 | 24 | X_values = [] 25 | Y_values = [] 26 | 27 | for s in series: 28 | X_values.append(len(self.series[s].data)) 29 | Y_values.append(max(self.series[s].data)) 30 | 31 | if X_range == None: 32 | self.X_axis.range = (0, max(X_values)) 33 | else: 34 | self.X_axis.range = (X_range[0], X_range[1]) 35 | 36 | if Y_range == None: 37 | self.Y_axis.range = (0, max(Y_values)) 38 | else: 39 | self.Y_axis.range = (Y_range[0], Y_range[1]) 40 | 41 | self.scaleX = 1.0 * self.X_axis.length / (self.X_axis.range[1] - self.X_axis.range[0]) 42 | self.scaleY = 1.0 * self.Y_axis.length / (self.Y_axis.range[1] - self.Y_axis.range[0]) 43 | 44 | self.X_axis.drawX(self.svg, self.border[0], self.Y_axis.length + self.border[1], self.scaleX) 45 | self.Y_axis.drawY(self.svg, self.border[0], self.Y_axis.length + self.border[1], self.scaleY) 46 | 47 | for n in range(len(series)): 48 | self.drawPlot(self.series[series[n]], self.colours[n]) 49 | 50 | self.drawLabels(series) 51 | self.svg.write('') 52 | 53 | def initiliseSVG(self, name): 54 | width = self.X_axis.length + self.border[0] + self.border[2] 55 | height = self.Y_axis.length + self.border[1] + self.border[3] 56 | 57 | self.svg = open(name + '.svg', 'w') 58 | self.svg.write('\n') 59 | self.svg.write("""""") 60 | self.svg.write('\n