File Metadata

Created: Tue, Jul 23, 12:31

fix_aveforce_cuda_kernel.cu
View Options

	/* ----------------------------------------------------------------------
	LAMMPS - Large-scale Atomic/Molecular Massively Parallel Simulator

	Original Version:
	http://lammps.sandia.gov, Sandia National Laboratories
	Steve Plimpton, sjplimp@sandia.gov

	See the README file in the top-level LAMMPS directory.

	-----------------------------------------------------------------------

	USER-CUDA Package and associated modifications:
	https://sourceforge.net/projects/lammpscuda/

	Christian Trott, christian.trott@tu-ilmenau.de
	Lars Winterfeld, lars.winterfeld@tu-ilmenau.de
	Theoretical Physics II, University of Technology Ilmenau, Germany

	See the README file in the USER-CUDA directory.

	This software is distributed under the GNU General Public License.
	------------------------------------------------------------------------- */

	extern __shared__ F_FLOAT sharedmem[];


	__global__ void Cuda_FixAveForceCuda_PostForce_FOrg_Kernel(int groupbit)
	{
	int i=(blockIdx.xgridDim.y+blockIdx.y)blockDim.x+threadIdx.x;
	sharedmem[threadIdx.x]=0;
	sharedmem[threadIdx.x+blockDim.x]=0;
	sharedmem[threadIdx.x+2*blockDim.x]=0;
	sharedmem[threadIdx.x+3*blockDim.x]=0;
	if(i < _nlocal)
	if (_mask[i] & groupbit) {
	sharedmem[threadIdx.x]=_f[i];
	sharedmem[threadIdx.x+blockDim.x]=_f[i+1*_nmax];
	sharedmem[threadIdx.x+2blockDim.x]=_f[i+2_nmax];
	sharedmem[threadIdx.x+3*blockDim.x]=1;
	}
	reduceBlock(sharedmem);
	reduceBlock(&sharedmem[blockDim.x]);
	reduceBlock(&sharedmem[2*blockDim.x]);
	reduceBlock(&sharedmem[3*blockDim.x]);
	F_FLOAT* buffer=(F_FLOAT*) _buffer;
	if(threadIdx.x==0)
	{
	buffer[blockIdx.x*gridDim.y+blockIdx.y]=sharedmem[0];
	buffer[blockIdx.xgridDim.y+blockIdx.y+gridDim.xgridDim.y]=sharedmem[blockDim.x];
	buffer[blockIdx.xgridDim.y+blockIdx.y+2gridDim.xgridDim.y]=sharedmem[2blockDim.x];
	buffer[blockIdx.xgridDim.y+blockIdx.y+3gridDim.xgridDim.y]=sharedmem[3blockDim.x];
	}
	}


	__global__ void Cuda_FixAveForceCuda_reduce_foriginal(int n,F_FLOAT* foriginal)
	{
	int i=0;
	sharedmem[threadIdx.x]=0;
	F_FLOAT myforig=0.0;
	F_FLOAT* buf=(F_FLOAT*) _buffer;
	buf=&buf[blockIdx.x*n];
	while(i<n)
	{
	sharedmem[threadIdx.x]=0;
	if(i+threadIdx.x<n)
	sharedmem[threadIdx.x]=buf[i+threadIdx.x];
	__syncthreads();
	reduceBlock(sharedmem);
	i+=blockDim.x;
	if(threadIdx.x==0)
	myforig+=sharedmem[0];
	}
	if(threadIdx.x==0)
	foriginal[blockIdx.x]=myforig;
	}

	__global__ void Cuda_FixAveForceCuda_PostForce_Set_Kernel(int groupbit,int xflag, int yflag, int zflag,F_FLOAT xvalue,F_FLOAT yvalue,F_FLOAT zvalue)
	{
	int i=(blockIdx.xgridDim.y+blockIdx.y)blockDim.x+threadIdx.x;
	if(i < _nlocal)
	if (_mask[i] & groupbit) {
	if(xflag) _f[i] = xvalue;
	if(yflag) _f[i+1*_nmax] = yvalue;
	if(zflag) _f[i+2*_nmax] = zvalue;
	}
	}

fix_aveforce_cuda_kernel.cu
No OneTemporary
Actions

File Metadata

fix_aveforce_cuda_kernel.cu
View Options

Event Timeline

fix_aveforce_cuda_kernel.cuNo OneTemporaryActions

File Metadata

fix_aveforce_cuda_kernel.cuView Options

Event Timeline

fix_aveforce_cuda_kernel.cu
No OneTemporary
Actions

fix_aveforce_cuda_kernel.cu
View Options