gradient_GPU.cuh
No OneTemporary
Actions

Subscribers

None

File Metadata

Created: Thu, Aug 8, 12:24

gradient_GPU.cuh
View Options

	/*
	* gradient_GPU.cuh
	*
	* Created on: Feb 1, 2017
	* Author: cerschae
	*/

	#ifndef GRADIENT_GPU_CUH_
	#define GRADIENT_GPU_CUH_

	//#include "cudafunctions.cuh"
	#include <fstream>
	#include <structure_hpc.hpp>

	__device__ struct point module_potentialDerivatives_totalGradient_SOA_GPU(const struct point pImage, const struct Potential_SOA lens, int nhalos);

	__device__ inline struct point rotateCoordinateSystem_GPU(struct point P, double theta);
	__device__ inline struct point rotateCoordinateSystem_GPU_2(struct point P, double cosi, double sinu);
	//
	//__device__
	__device__ point module_potentialDerivatives_totalGradient_5_SOA_GPU(const struct point pImage, const struct Potential_SOA lens, int shalos, int nhalos);
	__device__ point module_potentialDerivatives_totalGradient_8_SOA_GPU(const struct point pImage, const struct Potential_SOA lens, int shalos, int nhalos);
	__device__ point module_potentialDerivatives_totalGradient_81_SOA_GPU(const struct point pImage, const struct Potential_SOA lens, int shalos, int nhalos);

	__global__ void module_potentialDerivatives_totalGradient_SOA_GPU(double grid_grad_x, double grid_grad_y, const struct Potential_SOA lens, const struct grid_param frame, int nbgridcells, int nhalos);

	__global__
	void
	module_potentialDerivatives_totalGradient_8_SOA_GPU_cur(double grid_grad_x, double grid_grad_y, const struct Potential_SOA lens, const struct grid_param frame, int nbgridcells, int shalos, int nhalos);

	__global__
	void
	module_potentialDerivatives_totalGradient_8_SOA_GPU_SM2(double grid_grad_x, double grid_grad_y, const struct Potential_SOA lens, const struct grid_param frame, int nbgridcells, int shalos, int nhalos);

	__global__
	void
	module_potentialDerivatives_totalGradient_8_SOA_GPU_SM3(double grid_grad_x, double grid_grad_y, const struct Potential_SOA
	lens, const struct grid_param frame, int nbgridcells, int shalos, int nhalos);


	__global__
	void
	module_potentialDerivatives_totalGradient_8_SOA_GPU_SM4(double grid_grad_x, double grid_grad_y, const struct Potential_SOA
	lens, const struct grid_param frame, int nbgridcells, int shalos, int nhalos/, double* dtimer*/);

	__global__
	void
	module_potentialDerivatives_totalGradient_8_SOA_GPU_v2(double grid_grad_x, double grid_grad_y, const struct Potential_SOA lens, const struct grid_param frame, int nbgridcells, int i, int nhalos);

	void
	module_potentialDerivatives_totalGradient_SOA_CPU_GPU(double grid_grad_x, double grid_grad_y, const struct grid_param frame, const struct Potential_SOA lens_cpu, const struct Potential_SOA *lens_gpu, int nbgridcells, int nhalos);



	__global__
	void
	gradient_grid_kernel(double grid_grad_x, double grid_grad_y, const struct grid_param frame, int Nlens,int nbgridcells, const struct Potential_SOA lens);

	__global__
	void
	gradient_grid_kernel_v2(double grid_grad_x, double grid_grad_y, const struct grid_param frame, int Nlens,int nbgridcells, const struct Potential_SOA lens);

	__global__
	void
	gradient_grid_piemd_GPU(double grid_grad_x, double grid_grad_y, const struct grid_param frame, int Nlens,int nbgridcell, double lens_x, double lens_y, double lens_b0, double lens_angle, double lens_epot, double lens_rcore, double lens_rcut);

	__global__
	void
	gradient_grid_sis_GPU(double grid_grad_x, double grid_grad_y, const struct grid_param frame, int Nlens,int nbgridcell, double lens_x, double lens_y, double lens_b0, double lens_angle, double lens_epot, double lens_rcore, double lens_rcut);

	__global__
	void
	gradient_grid_piemd_GPU_multiple(double grid_grad_x, double grid_grad_y, const struct grid_param frame, int Nlens,int nbgridcell, int Ndevice, int indexactual, double lens_x, double lens_y, double lens_b0, double lens_angle, double lens_epot, double lens_rcore, double lens_rcut);

	__global__
	void
	gradient_grid_kernel_multiple(double grid_grad_x, double grid_grad_y, const struct grid_param frame, int Nlens, int nbgridcells, const struct Potential_SOA lens, int indexactual, int ncells);

	__device__
	static
	double
	atomicAdd_double(double* address, double val);


	#define KERNEL_8 \
	double x = true_coord_xcosi[i] + true_coord_ysinu[i]; \
	double y = true_coord_ycosi[i] - true_coord_xsinu[i]; \
	double rem2 = xxinv_onepeps + yyinv_onemeps; \
	double norm; \
	complex zis; \
	complex znum; \
	complex zden; \
	complex zres; \
	znum.re = cx1*x; \
	znum.im = 2.sqesqrt(rc*rc + rem2) - y/cx1; \
	zden.re = x; \
	zden.im = 2.rcsqe - y; \
	norm = (xx + zden.imzden.im); \
	zis.re = (znum.rex + znum.imzden.im)/norm; \
	zis.im = (znum.imx - znum.rezden.im)/norm; \
	norm = zis.re; \
	zis.re = log(sqrt(normnorm + zis.imzis.im)); \
	zis.im = atan2(zis.im, norm); \
	zres.re = - zci_im*zis.im; \
	zres.im = zci_im*zis.re; \
	grad_x += b0[i](zres.recosi[i] - zres.im*sinu[i]); \
	grad_y += b0[i](zres.imcosi[i] + zres.re*sinu[i]); \
	\


	#define KERNEL_8_reg(X) \
	double x = true_coord_xcosi[i] + true_coord_ysinu[i]; \
	double y = true_coord_ycosi[i] - true_coord_xsinu[i]; \
	double rem2 = xxinv_onepeps + yyinv_onemeps; \
	double norm; \
	double zis_re, zis_im; \
	double znum_re, znum_im; \
	double /zden_re,/ zden_im; \
	double zres_re, zres_im; \
	znum_re = cx1*x; \
	znum_im = 2.sqesqrt(rc*rc + rem2) - y/cx1; \
	/zden_re = x;/ \
	zden_im = 2.rcsqe - y; \
	norm = (xx + zden_imzden_im); \
	zis_re = (znum_rex + znum_imzden_im)/norm; \
	zis_im = (znum_imx - znum_rezden_im)/norm; \
	norm = zis_re; \
	zis_re = log(sqrt(normnorm + zis_imzis_im)); \
	zis_im = atan2(zis_im, norm); \
	zres_re = - zci_im*zis_im; \
	zres_im = zci_im*zis_re; \
	grad_x = b0[i](zres_recosi[i] - zres_im*sinu[i]); \
	grad_y = b0[i](zres_imcosi[i] + zres_re*sinu[i]); \
	\


	#endif /* GRADIENT_GPU_CUH_ */

gradient_GPU.cuhNo OneTemporaryActions

File Metadata

gradient_GPU.cuhView Options

Event Timeline

gradient_GPU.cuh
No OneTemporary
Actions

gradient_GPU.cuh
View Options