- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
CUDA纹理使用方法
一、例子1:fluidsGL中:
(一)host端
1)声明实际纹理数据
float2 *hvfield = NULL;
float2 *dvfield = NULL;
2) 对host数据和device数据进行初始化
hvfield = (cData*)malloc(sizeof(cData) * DS);
memset(hvfield, 0, sizeof(cData) * DS);
// Allocate and initialize device data
cudaMallocPitch((void**)dvfield, tPitch, sizeof(cData)*DIM, DIM);
cudaMemcpy(dvfield, hvfield, sizeof(cData) * DS,
cudaMemcpyHostToDevice);
调用device端函数,建立并绑定纹理数据
setupTexture(DIM, DIM);
bindTexture(); //注意,其中将array和纹理标识texref绑定
(二)device端
1)声明纹理对象标识,以及纹理实际数据数组
texturefloat2, 2 texref;
static cudaArray *array = NULL;
2)实现纹理建立、绑定函数
void setupTexture(int x, int y) {
// Wrap mode appears to be the new default
texref.filterMode = cudaFilterModeLinear;
cudaChannelFormatDesc desc = cudaCreateChannelDescfloat2();
cudaMallocArray(array, desc, y, x);
CUT_CHECK_ERROR(cudaMalloc failed);
}
void bindTexture(void) {
cudaBindTextureToArray(texref, array);
CUT_CHECK_ERROR(cudaBindTexture failed);
}
void unbindTexture(void) {
cudaUnbindTexture(texref);
CUT_CHECK_ERROR(cudaUnbindTexture failed);
}
//传入数据
void updateTexture(cData *data, size_t wib, size_t h, size_t pitch) {
cudaMemcpy2DToArray(array, 0, 0, data, pitch, wib, h, cudaMemcpyDeviceToDevice);
CUT_CHECK_ERROR(cudaMemcpy failed);
}
void deleteTexture(void) {
cudaFreeArray(array);
CUT_CHECK_ERROR(cudaFreeArray failed);
}
3)访问纹理数据
__global__ void
advectVelocity_k(cData *v, float *vx, float *vy,
int dx, int pdx, int dy, float dt, int lb)
{
int gtidx = blockIdx.x * blockDim.x + threadIdx.x;
int gtidy = blockIdx.y * (lb * blockDim.y) + threadIdx.y * lb;
int p;
cData vterm, ploc;
float vxterm, vyterm;
// gtidx is the domain location in x for this thread
if (gtidx dx) {
for (p = 0; p lb; p++) {
// fi is the domain location in y for this thread
int fi = gtidy + p;
if (fi dy) {
int fj = fi * pdx + gtidx;
原创力文档


文档评论(0)