博客 找到与“cuda”相关的博文共133篇
按相关性排序  按时间排序
CUDA学习笔记(四)——CUDA性能   2009-11-15 19:20:19
2009-11-3四、CUDA性能CUDA中的block被划分成一个个的warp,在GeForce8800GTX上,一个warp有32个线程。若不够32个线程,则padding相应数目的线程。Warp中的线程ID是连续且递增的。对于二维组织的线程来说,先把threadIdx.y为0的线程按照threadIdx.x从小到大排,然后把...
CUDA学习笔记(二)——CUDA线程模型   2009-11-15 19:04:01
每种执行方式可能有不同的开销,功耗和性能。例如,一个mobileprocessor可以以很低的功耗慢速执行,一个desktopprocessor可以以高一些的功耗快速执行。程序相同,但是这种改变是透明的。线程分配一旦启动一个kernel,CUDA run-time系统就产生对应的grid。Grid中的线程分配...
CUDA学习笔记(三)——CUDA内存   2009-11-15 19:14:00
CUDA中的共享变量。共享变量的scope是block,block中的所有线程都可以看到共享变量的同一个版本。Lifetime是kernel,kernel结束,共享变量内存也就不存在了。对共享内存的访问非常快而且是高度并行的。CUDA编程者通常用共享内存来保留一部分在kernel中用的多的全局内存数据...
CUDA学习(一)   2009-11-02 20:50:47
算不上高手,希望看到本博文的朋友多多批评指正。言归正传,网上关于CUDA的介绍铺天盖地,相信都可以看得明白,我也不废话了。先从CUDA,visualstudio的配置开始吧!看了很多的资料,最后觉得http:/cuda.csdn.net/news.aspx?id=105778f8-f616-4964-8ad1-bfb51a4990...
G300Fermi:Dx11 vs Dx10 游戏效果区别_Tesla中国制造   2009-10-15 04:51:20
则升级到了最新的IEEE754-2008。除此之外,GT300架构原生支持C(CUDA)、C+、DirectCompute、DirectX11、Fortran、OpenCL、OpenGL3.1/3.2等一系列技术标准,尤其是C+,这是GPU历史上第一次能够顺利运行这种代码,再加上C、Fortran就可以看出NVIDIA在通用计算方面的强势了...
关于CUDA的一点看法   2009-10-09 19:55:12
CUDA,即计算机通用设备架构,它主要为类似GPU的设备提供API。网上许多文章都介绍了CUDA的许多好处,让程序员看了就期盼去掌握...
AMD不愿接受NVIDIA CUDA(转自驱动之家)   2009-08-18 19:39:33
CUDA,但在是否与AMD显卡有关的问题被回避了,未对此做明确解释。AMD发言人GarySilcott的回应就非常直接了:“他们(NVIDIA)会刻意降低(CUDA在AMDGPU上的)性能,以便让NVIDIAGPU在运行同样程序的时候速度更快。…即使不是故意的,(CUDA)也不会像我们自己的SDK那样针对我们的...
MediaCoder--国产免费软件的典范(转)   2009-08-18 11:14:55
包括声道映射、重采样、音量调整等主要特点基于优秀的众多的开源编解码后台,能够解码和编码的格式多良好的多线程设计,为多核处理器优化(PCPOP评),在四核上可达到90%以上的平均CPU使用率极为丰富的可调整的编码参数全部编解码器自带,不依赖于系统的编解码器和任何组件良...
cuda unclear list   2009-08-14 21:45:06
怎样处理让一个warp内的线程都走一个分支?5.流管理 for( int i=0;idevice);/line a for( int i=0;ihost);/line c(1) 必须放一起么?是line a和lineb交叉,然后line b和line c交叉.还是line a,line b,line c同时交叉执行呢?(2) 如下情况:cudaMemcpy(d_data1,hostToDev...
CUDA problem shooting   2009-08-13 21:35:03
1.segmentationfault:cudaStream_t stream;for(
相关搜索