首页 新闻 论坛 群组 Blog 文档 下载 读书 Tag 网摘 搜索 .NET Java 游戏 视频 人才 外包 培训 数据库 书店 程序员
中国软件网
欢迎您:游客 | 登录 注册 帮助
  • 质疑CUDA的发展前景!
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • stoneszone
    • 等级:
    • 可用分等级:
    • 总技术专家分:
    • 总技术专家分排名:
    • 揭帖率:
    发表于:2008-04-07 15:39:02 楼主
      各位好,我刚刚接触CUDA,之前对GPGPU有一些了解,看到一些国外鬼佬用GPU做CFD的论文,相比基于MPI的PC 集群高性能计算其优势是明显的。业界发展出一个针对GPU指令集的编译器提供给用户也是大势所趋,而且NV在专业显卡的地位是不容质疑的.
      可是NV提出的CUDA平台只能支持NV自己的GPU,不能整合业界的所有硬件而指定出标准。而目前amd买了ati,intel 也在潜心研究自己的GPU, 明年就可以退出自己的高端GPU芯片,可以看出,cpu厂商正在努力整合cpu和GPU,这样的话,相信他们的芯片设计能力不会比nv差,以后nv在gpu的优势就会被超越,加上amd和intel在cpu上的技术封锁,估计以后的GPU高性能计算将会是amd,intel的天下,而cuda只支持nv的gpu,那么,我们现在浪费时间在这个封装层面上有意义吗?请各位专家指点,谢谢。
     
    100  修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • coy_zhangce
    • 等级:
    • 可用分等级:
    • 总技术专家分:
    • 总技术专家分排名:
    发表于:2008-04-07 16:13:381楼 得分:0
    哈哈,这个问题提的好。
    对于我来说,目前闲着也是闲着,就研究一下看看。
    另外,GPU是协处理器吧。跟CPU是两码事呢。
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • stoneszone
    • 等级:
    • 可用分等级:
    • 总技术专家分:
    • 总技术专家分排名:
    发表于:2008-04-07 16:35:362楼 得分:0
    嗯,是呀,可是以前的浮点运算也是独立于CPU的,主板上另外插个浮点运算的协处理芯片,后来就被集成进CPU里面了,还记得小学时老爸买个浮点运算协处理器回家,我家的老486就焕发新春了,有些游戏跑的就快些,如果被intel和amd集成进去,那岂不是以后没有nv的玩了。
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • darkstorm2111203
    • 等级:
    • 可用分等级:
    • 总技术专家分:
    • 总技术专家分排名:
    发表于:2008-04-07 16:40:203楼 得分:0
    现在还是初级阶段,大家东西都还没出来全,要说标准规范暂时还太早了。
    再说已经是在面向硬件编程以提高速度的范畴了,硬件架构都不同(intel以前是千亿核心,现在公布出来显示计算的还不知道是不是simd;amd的概念其实感觉和cuda差不多,只是因为是一个厂可能集成度会好一些;目前只有nv手上有实实在在的东西...),暂时很难统一
    未来的标准要由未来市场竞争决定。就当前来说,现在nv的cuda做的比amd好,intel的东西暂时还没影,现在对nv是个不错的机会。

    我用过brook的早期版本,对C扩展比cuda少很多,易用性没话说,也同时支持nv和ati卡,就是性能差,对硬件操作也太高层次了。
    如果用类似openMP或者MPI的方式来做,感觉不适合当前显卡的架构
    我感觉nv的cuda封装做得不错,给了足够的灵活度和性能,但对并行算法设计和对硬件的了解要求有点高。nv的library性能还可以,但是在gpu上用的时候觉得有点不灵活,能开放代码就好了...nv最好能给出一些__device__函数的库来用,现在我们这些开荒的基本全要自己写,暂时用cuda写的东西也不好复用

    学习c语言是要学会向机器一样思考,学cuda还得学会向并行机器一样思考,所以转型重点不是在语法上...cuda非常面向硬件,要亲自操作六种存储器以加大带宽,要尽量避免for循环,要设计计算模型...用cuda编写程序有时会让你想起写汇编...

    我个人感觉,一段时间内,还很难出现足够智能化的编译并行程序的编译器,因此暂时来说,给出封装层面的东西及早抢占市场还是正确的策略。未来一段时间内在显卡上跑的商业程序很可能大多数都是各种库,还会是根据不同厂商有区别的。
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • Cyrosly
    • 等级:
    • 可用分等级:
    • 总技术专家分:
    • 总技术专家分排名:
    发表于:2008-04-08 08:56:134楼 得分:0
    这个问题我认为没有太大的意义,毕竟客户只选择一种平台,而不是同时选择AMD或NV,AMD的不也只支持A卡吗。所以凭个人的喜好以及对他们之间的不同认识选择适合自己的平台就可以了。
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • stoneszone
    • 等级:
    • 可用分等级:
    • 总技术专家分:
    • 总技术专家分排名:
    发表于:2008-04-08 13:43:195楼 得分:0
    * Future CPUs will have heterogeneous cores
    * MIMD and SIMD on one chip –the best of both worlds!

    预测趋势,cpu 内将要共存异质架构的多核心, 即MIMD和SIMD ,
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • darkstorm2111203
    • 等级:
    • 可用分等级:
    • 总技术专家分:
    • 总技术专家分排名:
    发表于:2008-04-09 00:11:026楼 得分:0
    如果是mimd,估计就是做成128位或者更长的字长,用指令集做simd并行...这样灵活性和速度可以兼顾一点
    都用32位字长的计算单元的mimd个人感觉性能不会太高。
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • byteh
    • 等级:
    • 可用分等级:
    • 总技术专家分:
    • 总技术专家分排名:
    发表于:2008-04-13 13:52:107楼 得分:0
    就看推广的如何了,能不能干过CPU厂商

    否则只是过客

    对我们来说了解点没有坏处
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • Ronaldinio
    • 等级:
    • 可用分等级:
    • 总技术专家分:
    • 总技术专家分排名:
    发表于:2008-04-13 22:21:158楼 得分:0
    高见~~,有道理啊~~~
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • ShoonVII
    • 等级:
    • 可用分等级:
    • 总技术专家分:
    • 总技术专家分排名:
    发表于:2008-04-25 08:01:489楼 得分:0
    CPU对CUDA来说也就是个host,必要的话,nVidia可以做一个PowerPC进去当host,这其实就和CELL里的PPE非常像了
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • DING_YIMING
    • 等级:
    • 可用分等级:
    • 总技术专家分:
    • 总技术专家分排名:
    发表于:2008-04-25 10:54:0710楼 得分:0


    目前提供SIMD指令的GPU应用于通用计算,而不只局限于图形处理专业领域的GPU厂商很少,所以没有所谓的工业标准。而NVIDIA跑在这领域的领先者。

    GPU在运算能力的远远超越CPU,GPU是否能取代CPU呢?答案是否定的。GPU具有CPU所没有的局限性。GPU只提供单指令多数据类型处理,适合于数据并行计算。GPU在条件控制能力方面非常弱,若程序使用条件控制语句会极大影响GPU程序的执行效率。另外现在的GPU与主机 (host)数据交换只能通过总线来实现,对于需要大量I/O的应用,通讯就会成为GPU性能瓶颈。

    参考:

    《利用GPU进行高性能数据并行计算》
    丁艺明,刘 波 (趋势科技)

    (全文文发表于《程序员》2008第4期)

    http://topic.csdn.net/u/20080425/10/320c7e70-f3a8-43b5-acab-db9e31bac60f.html
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • kings_zqz
    • 等级:
    • 可用分等级:
    • 总技术专家分:
    • 总技术专家分排名:
    发表于:2008-04-29 21:41:5511楼 得分:0
    ...
    牛人
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • kings_zqz
    • 等级:
    • 可用分等级:
    • 总技术专家分:
    • 总技术专家分排名:
    发表于:2008-04-29 21:47:5512楼 得分:0
    下了那个东西,x86 64的,有什么用,能不能解释一下呢,还有那个我的显卡支持不支持,7300LE的七彩虹的
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • knowledge_Is_Life
    • 等级:
    • 可用分等级:
    • 总技术专家分:
    • 总技术专家分排名:
    发表于:2008-04-30 19:22:2613楼 得分:0
    有问题请先GOOGLE,BAIDU
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • kenan1014
    • 等级:
    • 可用分等级:
    • 总技术专家分:
    • 总技术专家分排名:
    发表于:2008-05-08 23:42:1714楼 得分:0
    这就是为什么nVidia现在大力推广CUDA的原因啊~~~~而且nVidia也可以设计CPU的~~~明天的竞争你今天知道了那你就超越BG了~~~
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • teacheryangbit
    • 等级:
    • 可用分等级:
    • 总技术专家分:
    • 总技术专家分排名:
    发表于:2008-05-09 19:32:2015楼 得分:0
    你老爸被骗了,真的486都集成了浮点处理器。

    引用 2 楼 stoneszone 的回复:
    嗯,是呀,可是以前的浮点运算也是独立于CPU的,主板上另外插个浮点运算的协处理芯片,后来就被集成进CPU里面了,还记得小学时老爸买个浮点运算协处理器回家,我家的老486就焕发新春了,有些游戏跑的就快些,如果被intel和amd集成进去,那岂不是以后没有nv的玩了。
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • Vicious_Tipper
    • 等级:
    • 可用分等级:
    • 总技术专家分:
    • 总技术专家分排名:
    发表于:2008-05-12 11:39:1516楼 得分:0
    引用 4 楼 Cyrosly 的回复:
    这个问题我认为没有太大的意义,毕竟客户只选择一种平台,而不是同时选择AMD或NV,AMD的不也只支持A卡吗。所以凭个人的喜好以及对他们之间的不同认识选择适合自己的平台就可以了。

    不知道你说的AMD只支持A卡是什么意思,AMD的平台,NV的卡用的也很好,只是SLI和CF没有互相授权罢了。
    但是,CUDA的前景,短期内也不好说,就像MS当初搞DirectX的时候,也不见得就一定会好过OpenGL,但现在是DirectX一枝独秀了。
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • passos
    • 等级:
    • 可用分等级:
    • 总技术专家分:
    • 总技术专家分排名:
    发表于:2008-05-12 13:15:2217楼 得分:0
    GPU是3D加速芯片发展的一个里程碑式的阶段,是一种通用的解决方案,3D加速不死,GPU照样活的很好
    浮点运算协处理器能够被集成到CPU中,但是目前至少不可能看到3D加速芯片被集成到CPU中吧,那么GPU就更不太靠谱了。光散热和功率的问题就够GPU头大的
    A卡和N卡都有GPU的概念,但是实现区别很大。不过谁知道未来不会出现一个像DirectX在显卡领域一样能够统一GPU开发接口的东西
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • WilfredLiu
    • 等级:
    • 可用分等级:
    • 总技术专家分:
    • 总技术专家分排名:
    发表于:2008-05-14 11:07:5818楼 得分:0
    Intel方面Larrabee的发展其实是一个未知数,就像NV CEO黄说的, intel连个驱动都还做不好,想发展显卡(毕竟GPU首先是个显卡\游戏卡,其次才是高性能计算)业务还差得很远.

    AMD在收购ATI后元气大伤,再加上A卡最新的体系架构设计原理和N不同(说白了就是不如N架构来的好用),在短期内很难和NV竞争,还搞什么GPU-CPU结合,结果必然是什么都做不好,可谓大势已去.

    所以,虽然NV没有CPU业务,但目前财政节节高,方向明朗,也有实实在在的东西,前途是看好的.
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • cudanet
    • 等级:
    • 可用分等级:
    • 总技术专家分:
    • 总技术专家分排名:
    发表于:2008-05-16 10:57:0519楼 得分:0
    我认为有前途,但是很渺茫。
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • hilukk
    • 等级:
    • 可用分等级:
    • 总技术专家分:
    • 总技术专家分排名:
    发表于:2008-06-18 11:21:2420楼 得分:0
    比较一下:
    1、tesla +CUDA
    2、20个pc+linux。
    3、celoxica accelerator Card。或者类似。
    你选哪个?
    而且tesla+cuba干净,绿色,上手快,性能不差,可以往上加。

    linux cluster 垃圾多。软件该做的还得做。

    Celoxica的FPGA卡一般人玩不转。并行处理需要的软件门槛比CUDA高多了。


    就凭这个,是个方向。并不一个“封装”是可以了结的。是一个市场的问题。 想想PowerPC当初为什么拱手给X86,同样想想arm怎样活着。
    lz有点门户情结。大量的低端高强度计算等待这种东西很多年了,NVIDIDA把软件再往上赶一下。后来上来的就会更吃力。就是软件目前有瑕疵也是可以提高的。Intel要在这一点上超越CUDA,有希望。AMD要在软件上超越CUDA几乎不可能,ATI是收来的。

    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • hilukk
    • 等级:
    • 可用分等级:
    • 总技术专家分:
    • 总技术专家分排名:
    发表于:2008-06-18 11:44:3121楼 得分:0
    补充:
    搭在fpga 的加速卡,能力绝对可以,而且日新月异。价格选择范围也比较大,关键是需要有专业训练的人配合(以前只有这一个方向,所以有才有人尝试自己勉强能扛得起的linux cluster,但效率大家都看到了)。现在的GPFPU肯定的讲,并驾齐驱。Intel现在做Larrabee进攻Nvidia,其实还受那个cell的夹击(人家是做大系统的,战线极长)。软件的确成了Intel的软肋,它肯定想利用自己X86的东西,但编译器呢。如果要操作系统配合,还的看MS的脸色。MS在 HPC领域早有打算了。现在CUDA已经用上了,即使有Larrabee但明天能插到机器上吗?所以先到先强,Nvidia有用户基础就象17楼说的只要3D加速不死,就GPU HPC饭吃。左右逢源啊
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • whyjld
    • 等级:
    • 可用分等级:
    • 总技术专家分:
    • 总技术专家分排名:
    发表于:2008-06-22 19:11:2122楼 得分:0
    如果担心通用性或类似的问题,完全可以直接用opengl,源和目标都用fp32的texture,计算用glsl,但是这样要复杂不少。
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • linzsoft
    • 等级:
    • 可用分等级:
    • 总技术专家分:
    • 总技术专家分排名:
    发表于:2008-06-25 05:58:5223楼 得分:0
    GPU 集成到 CPU 的说法不正确,现在应该叫GPU core 集成到 Chip.

    GPU core 集成到 Chip 是必然的趋势,这也符合高度集成的要求。

    Intel 预测未来10年,我们会看到 1 千亿晶体管 (transistors)的chip。

    所以一个 chip (所谓的CPU)将集成上千个核,所以GPU core集成是必然趋势,这时候 NV 还可以买 IP core

    即使 GPU core 集成到 Chip,CUDA 还是有意义的 ,CUDA 已经走到竞争者的前面,它能使GPU core发挥最大的效能。
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • Archx
    • 等级:
    • 可用分等级:
    • 总技术专家分:
    • 总技术专家分排名:
    发表于:2008-06-27 20:24:3724楼 得分:0
    很希望看到Telsa降价占领市场
    这样我才能买得起C870...
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • bbcnews24
    • 等级:
    • 可用分等级:
    • 总技术专家分:
    • 总技术专家分排名:
    发表于:2008-06-28 11:38:2425楼 得分:0
    未来的标准要由未来市场竞争决定。就当前来说,现在nv的cuda做的比amd好,intel的东西暂时还没影,现在对nv是个不错的机会。

    我是新手,2007年底看到有关CUDA的介绍,比较少,但是最近半年数量质量都大增,我看好它!
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • MageMaster
    • 等级:
    • 可用分等级:
    • 总技术专家分:
    • 总技术专家分排名:
    发表于:2008-06-28 12:30:0726楼 得分:0
    引用 18 楼 WilfredLiu 的回复:
    Intel方面Larrabee的发展其实是一个未知数,就像NV CEO黄说的, intel连个驱动都还做不好,想发展显卡(毕竟GPU首先是个显卡\游戏卡,其次才是高性能计算)业务还差得很远.

    AMD在收购ATI后元气大伤,再加上A卡最新的体系架构设计原理和N不同(说白了就是不如N架构来的好用),在短期内很难和NV竞争,还搞什么GPU-CPU结合,结果必然是什么都做不好,可谓大势已去.

    所以,虽然NV没有CPU业务,但目前财政节节高,方向明朗,也有实实在在的东西…

    有见地!!!
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • zansan
    • 等级:
    • 可用分等级:
    • 总技术专家分:
    • 总技术专家分排名:
    发表于:2008-06-28 21:07:3427楼 得分:0
    跟风
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • nifengfeiyang
    • 等级:
    • 可用分等级:
    • 总技术专家分:
    • 总技术专家分排名:
    发表于:2008-07-03 10:08:5828楼 得分:0
    引用 15 楼 teacheryangbit 的回复:
    你老爸被骗了,真的486都集成了浮点处理器。



    只有80486DX才有协处理器,80486SX是没有协处理器的。
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • liubingqian
    • 等级:
    • 可用分等级:
    • 总技术专家分:
    • 总技术专家分排名:
    发表于:2008-07-04 17:13:4829楼 得分:0
    未来的事情让未来决定吧!至少在现在,低成本的选择只有CUDA。
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友