File Metadata

Created: Wed, May 1, 05:35

onepass.py
View Options

	import numpy as np
	import timeit
	import gurobipy as gp
	from gurobipy import GRB

	def addvariables(Z):
	upperbounds=[]
	I=[]
	J=[]
	for M in database_indices:
	CM=data[targetname+"_amons_ncharges"][M]
	m=len(CM)
	I=I+[(i,j,M,G) for G in range(maxduplicates) for i in range(m) for j in range(n) if CM[i] == CT[j]] # if condition excludes j; i always takes all m values
	J=J+[(M,G) for G in range(maxduplicates)]

	x=Z.addVars(I, vtype=GRB.BINARY)
	y=Z.addVars(J, vtype=GRB.BINARY)
	print("Variables added.")
	return x,I,y

	def addconstraints(Z,x,I,y):
	# bijection into [n]
	Z.addConstrs(x.sum('',j,'', '*') == 1 for j in range(n))

	for M in database_indices:
	CM=data[targetname+"_amons_ncharges"][M]
	m=len(CM)
	# each i of each group is used at most once
	Z.addConstrs(x.sum(i,'*',M,G) <= 1 for i in range(m) for G in range(maxduplicates))
	# y[M,G] = OR gate of the x[i,j,M,G] for each (M,G)
	Z.addConstrs(y[M,G] >= x[v] for G in range(maxduplicates) for v in I if v[2:]==(M,G))
	Z.addConstrs(y[M,G] <= x.sum('','',M,G) for G in range(maxduplicates))
	print("Constraints added.")
	return 0

	# objective value should then be square rooted in the end (doesn't change optimality)
	def setobjective(Z,x,I,y):
	print("Constructing objective function... ")
	key=0
	if(not representation): # Coulomb case
	expr=gp.QuadExpr()
	T=targetdata['target_CMs'][target_index]
	for k in range(n):
	for l in range(n):
	expr += T[k,l]**2
	for M in database_indices:
	key=key+1
	Mol=data[targetname+"_amons_CMs"][M]
	m=len(Mol)
	for G in range(maxduplicates):
	for (i,k) in [v[:2] for v in I if v[2:]==(M,G)]:
	for (j,l) in [v[:2] for v in I if v[2:]==(M,G)]:
	expr += (Mol[i,j]*2 - 2T[k,l]Mol[i,j])x[i,k,M,G]*x[j,l,M,G]
	expr += y[M,G]*m
	print(key, " / ", size_database)
	expr=expr-n

	else: #SLATM case
	expr=gp.LinExpr()
	T=targetdata["target_reps"][target_index]
	for M in database_indices:
	key=key+1
	Mol=data[targetname+"_amons_slatms"][M]
	m=len(Mol)
	for G in range(maxduplicates):
	for (i,j) in [v[:2] for v in I if v[2:]==(M,G)]:
	C=np.linalg.norm(Mol[i]-T[j])**2
	expr += C*x[i,j,M,G]
	expr += y[M,G]*m
	print(key, " / ", size_database)

	Z.setObjective(expr, GRB.MINIMIZE)
	print("Objective function set.")
	return 0

	# prints mappings of positions (indices+1) of each molecule to positions inside target
	def print_sols(Z, x, I, y):
	SolCount=Z.SolCount
	print("Target has size", n)
	for solnb in range(SolCount):
	print()
	print("--------------------------------")
	Z.setParam("SolutionNumber",solnb)
	print("Solution number", solnb+1, ", objective value (square rooted)", np.sqrt(Z.PoolObjVal))

	for M in database_indices:
	groups=[]
	for G in range(maxduplicates):
	if y[M,G].Xn == 1:
	groups.append(G)

	amount_picked=len(groups)
	for k in range(amount_picked):
	G=groups[k]
	m=len(data[targetname+"_amons_ncharges"][M])
	label=data[targetname+"_amons_labels"][M]
	if k==0:
	print("Molecule", label, "has been picked", amount_picked, "time(s) ( size", m, ", used", sum([x[v].Xn for v in I if v[2]==M]), ")")
	print(k+1, end=": ")
	for (i,j) in [v[:2] for v in I if v[2:]==(M,G) and x[v].Xn==1]:
	print(i+1, "->", j+1, end=", ")
	print()

	def main():
	# construction of the model
	start=timeit.default_timer()
	Z = gp.Model()
	Z.setParam('OutputFlag',1)
	x,I,y=addvariables(Z)
	addconstraints(Z,x,I,y)
	setobjective(Z,x,I,y)
	stop=timeit.default_timer()
	print("Model setup: ", stop-start, "s")

	# optimization
	# trying parameters from Z.tune() and others.
	#### outdated
	Z.setParam("DegenMoves", 2)
	Z.setParam("ZeroHalfCuts", 2)
	Z.setParam("BQPCuts", 2)
	Z.setParam("RLTCuts", 2)

	# time (seconds) and gap (%) limit, (max) number of solutions kept in memory
	#Z.setParam("MIPGap", 0)
	Z.setParam("TimeLimit", timelimit)
	Z.setParam("PoolSolutions", numbersolutions)

	print("------------")
	print("Optimization")
	print("------------")
	Z.optimize()

	print("Optimization runtime: ", Z.RunTime, "s")

	if(Z.status == 3):
	print("Model was proven to be infeasible.")
	return 1

	print_sols(Z,x,I,y)
	return 0

	# modifiable global settings
	target_index=0 # 0, 1, or 2
	maxduplicates=2 # number of possible copies of each molecule of the database
	timelimit=120 # in seconds (not counting setup)
	numbersolutions=5 # size of solution pool
	representation=1 # 0 for Coulomb Matrix, 1 for SLATM

	# global constants
	dataname=["amons_data.npz", "amons_vector_data.npz"][representation]
	data=np.load(dataname, allow_pickle=True)
	targetdataname=["datafilter.npz", "target_vector_data.npz"][representation]
	targetdata=np.load(targetdataname, allow_pickle=True)

	CT=targetdata['target_ncharges'][target_index]
	n=len(CT)
	targetname=["qm9", "vitc", "vitd"][target_index]
	size_database=len(data[targetname+"_amons_labels"])
	database_indices=range(size_database)

	main()

onepass.py
No OneTemporary
Actions

File Metadata

onepass.py
View Options

Event Timeline

onepass.pyNo OneTemporaryActions

File Metadata

onepass.pyView Options

Event Timeline

onepass.py
No OneTemporary
Actions

onepass.py
View Options