博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
matlab中cuda编程中分配grid和block dimension的时候的注意事项
阅读量:4041 次
发布时间:2019-05-24

本文共 985 字,大约阅读时间需要 3 分钟。

这两天在MATLAB里面用CUDA, 结果老是不对, 找了半天才发现, 原来是分配的问题

所以提醒小伙伴们, 分配的时候先看下你的GPU性能

>> gpuDeviceans =   CUDADevice (具有属性):                      Name: 'Quadro K2000'                     Index: 1         ComputeCapability: '3.0'            SupportsDouble: 1             DriverVersion: 7.5000            ToolkitVersion: 7.5000        MaxThreadsPerBlock: 1024          MaxShmemPerBlock: 49152        MaxThreadBlockSize: [1024 1024 64]               MaxGridSize: [2.1475e+09 65535 65535]                 SIMDWidth: 32               TotalMemory: 2.1475e+09           AvailableMemory: 1.6566e+09       MultiprocessorCount: 2              ClockRateKHz: 954000               ComputeMode: 'Default'      GPUOverlapsTransfers: 1    KernelExecutionTimeout: 1          CanMapHostMemory: 1           DeviceSupported: 1            DeviceSelected: 1

MaxThreadsPerBlock: 1024

其中这段话关键, 如果你是block是二维的话,那么你的threadsPerBlock.x * threadsPerBlock.y 不能大于1024.

我用dim3 threadsPerBlock(256, 256); 试了半天, 最终返回的矩阵都是全零矩阵, 所以希望大家注意

转载地址:http://nsxdi.baihongyu.com/

你可能感兴趣的文章
coursesa课程 Python 3 programming Functions can call other functions 函数调用另一个函数
查看>>
coursesa课程 Python 3 programming The while Statement
查看>>
course_2_assessment_6
查看>>
coursesa课程 Python 3 programming course_2_assessment_7 多参数函数练习题
查看>>
coursesa课程 Python 3 programming course_2_assessment_8 sorted练习题
查看>>
在unity中建立最小的shader(Minimal Shader)
查看>>
1.3 Debugging of Shaders (调试着色器)
查看>>
关于phpcms中模块_tag.class.php中的pc_tag()方法的含义
查看>>
vsftp 配置具有匿名登录也有系统用户登录,系统用户有管理权限,匿名只有下载权限。
查看>>
linux安装usb wifi接收器
查看>>
补充自动屏蔽攻击ip
查看>>
多线程使用随机函数需要注意的一点
查看>>
getpeername,getsockname
查看>>
让我做你的下一行Code
查看>>
浅析:setsockopt()改善程序的健壮性
查看>>
关于对象赋值及返回临时对象过程中的构造与析构
查看>>
VS 2005 CRT函数的安全性增强版本
查看>>
SQL 多表联合查询
查看>>
Visual Studio 2010:C++0x新特性
查看>>
drwtsn32.exe和adplus.vbs进行dump文件抓取
查看>>