onepass.py
No OneTemporary
Actions

Subscribers

None

File Metadata

Created: Wed, May 1, 06:48

onepass.py
View Options

	import numpy as np
	import timeit
	import gurobipy as gp
	from gurobipy import GRB

	def addvariables(Z):
	upperbounds=[]
	I=[]
	J=[]
	for M in database_indices:
	CM=data[targetname+"_amons_ncharges"][M]
	m=len(CM)
	I=I+[(i,j,M,G) for G in range(maxduplicates) for i in range(m) for j in range(n) if CM[i] == CT[j]] # if condition excludes j; i always takes all m values
	J=J+[(M,G) for G in range(maxduplicates)]

	x=Z.addVars(I, vtype=GRB.BINARY)
	y=Z.addVars(J, vtype=GRB.BINARY)
	print("Variables added.")
	return x,I,y

	def addconstraints(Z,x,I,y):
	# bijection into [n]
	Z.addConstrs(x.sum('',j,'', '*') == 1 for j in range(n))

	for M in database_indices:
	CM=data[targetname+"_amons_ncharges"][M]
	m=len(CM)
	# each i of each group is used at most once
	Z.addConstrs(x.sum(i,'*',M,G) <= 1 for i in range(m) for G in range(maxduplicates))
	# y[M,G] = OR gate of the x[i,j,M,G] for each (M,G)
	Z.addConstrs(y[M,G] >= x[v] for G in range(maxduplicates) for v in I if v[2:]==(M,G))
	Z.addConstrs(y[M,G] <= x.sum('','',M,G) for G in range(maxduplicates))
	print("Constraints added.")
	return 0

	# objective value should then be square rooted in the end (doesn't change optimality)
	def setobjective(Z,x,I,y):
	print("Constructing objective function... ")
	key=0
	if(representation==0 or representation==5): # Coulomb case
	expr=gp.QuadExpr()
	T=targetdata['target_CMs'][target_index]
	for k in range(n):
	for l in range(n):
	expr += T[k,l]**2
	for M in database_indices:
	key=key+1
	Mol=data[targetname+"_amons_CMs"][M]
	m=len(Mol)
	for G in range(maxduplicates):
	for (i,k) in [v[:2] for v in I if v[2:]==(M,G)]:
	for (j,l) in [v[:2] for v in I if v[2:]==(M,G)]:
	expr += (Mol[i,j]*2 - 2T[k,l]Mol[i,j])x[i,k,M,G]*x[j,l,M,G]
	expr += y[M,G]mpenaltyconst
	print(key, " / ", size_database)
	expr=expr-n*penaltyconst

	else: #SLATM case
	expr=gp.LinExpr()
	T=targetdata["target_reps"][target_index]
	for M in database_indices:
	key=key+1
	Mol=data[targetname+"_amons_reps"][M]
	m=len(Mol)
	for G in range(maxduplicates):
	for (i,j) in [v[:2] for v in I if v[2:]==(M,G)]:
	C=np.linalg.norm(Mol[i]-T[j])**2
	expr += C*x[i,j,M,G]
	expr += y[M,G]mpenaltyconst
	print(key, " / ", size_database)
	expr=expr-n*penaltyconst

	Z.setObjective(expr, GRB.MINIMIZE)
	print("Objective function set.")
	return 0

	# prints mappings of positions (indices+1) of each molecule to positions inside target
	def print_sols(Z, x, I, y):
	SolCount=Z.SolCount
	print("Target has size", n)
	print("Using representation", repname)
	for solnb in range(SolCount):
	print()
	print("--------------------------------")
	Z.setParam("SolutionNumber",solnb)
	print("Solution number", solnb+1, ", objective value with size penalty", (Z.PoolObjVal))

	for M in database_indices:
	groups=[]
	for G in range(maxduplicates):
	if np.rint(y[M,G].Xn) == 1:
	groups.append(G)

	amount_picked=len(groups)
	for k in range(amount_picked):
	G=groups[k]
	m=len(data[targetname+"_amons_ncharges"][M])
	label=data[targetname+"_amons_labels"][M]
	if k==0:
	print("Molecule", label, "has been picked", amount_picked, "time(s) ( size", m, ", used", sum([x[v].Xn for v in I if v[2]==M]), ")")
	print(k+1, end=": ")
	for (i,j) in [v[:2] for v in I if v[2:]==(M,G) and np.rint(x[v].Xn)==1]:
	print(i+1, "->", j+1, end=", ")
	print()

	def main():
	# construction of the model
	start=timeit.default_timer()
	Z = gp.Model()
	Z.setParam('OutputFlag',1)
	x,I,y=addvariables(Z)
	addconstraints(Z,x,I,y)
	setobjective(Z,x,I,y)
	stop=timeit.default_timer()
	print("Model setup: ", stop-start, "s")

	# model parameters
	# PoolSearchMode 1/2 forces to fill the solution pool. 2 finds the best solutions.
	# Set to 1 because of duplicating solutions which differ by 1e-9 and are seen as different.
	Z.setParam("PoolSearchMode", 1)
	# these prevent non integral values although some solutions are still duplicating -- to fix?
	Z.setParam("IntFeasTol", 1e-9)
	Z.setParam("IntegralityFocus", 1)

	Z.setParam("TimeLimit", timelimit)
	Z.setParam("PoolSolutions", numbersolutions)

	# optimization
	print("------------")
	print("Optimization")
	print("------------")
	Z.optimize()
	print("------------")
	print()
	print("Optimization runtime: ", Z.RunTime, "s")

	if(Z.status == 3):
	print("Model was proven to be infeasible.")
	return 1

	print_sols(Z,x,I,y)
	return 0

	# modifiable global settings
	target_index=0 # 0, 1, or 2 for qm9, vitc, or vitd.
	maxduplicates=2 # number of possible copies of each molecule of the database
	timelimit=360 # in seconds (not counting setup)
	numbersolutions=5 # size of solution pool
	representation=2 # 0 for Coulomb Matrix (CM), 1 for SLATM, 2 for aCM, 3 for SOAP, 4 for FCHL
	penaltyconst=[1,1,10000,1,1][representation] # constant in front of size penalty

	# global constants
	repname=["CM", "SLATM", "aCM", "SOAP", "FCHL", "qm7"][representation]
	dataname="amons_"+repname+"_data.npz"
	data=np.load(dataname, allow_pickle=True)
	targetdataname="target_"+repname+"_data.npz"
	targetdata=np.load(targetdataname, allow_pickle=True)

	CT=targetdata['target_ncharges'][target_index]
	n=len(CT)
	targetname=["qm9", "vitc", "vitd"][target_index]
	size_database=len(data[targetname+"_amons_labels"]) # set this to a fixed number if the setup is too slow in case of qm7 database
	database_indices=range(size_database)

	main()

onepass.pyNo OneTemporaryActions

File Metadata

onepass.pyView Options

Event Timeline

onepass.py
No OneTemporary
Actions

onepass.py
View Options