嗑技三人行：异构计算崛起云服务遭质疑

作者：曾智强来源：ZDNetCBSi企业方案解决中心频道【原创】 2013-08-30 12:06:01

英特尔将要发布14nm芯片，以用于Core和Atom系列，业内诸多人士认为这是英特尔对ARM阵营挑战的回应。纵观整个芯片市场，英特尔的对手还真不少，AMD自不必说；ARM阵营正妄图逆袭X86,；Nvidia，正虎视眈眈数据中心领域……他们之间的“爱恨纠葛”将会怎样演绎？

英特尔将要发布14nm芯片，不仅用于Core系列，还将用于Atom系列产品，业内诸多人士认为这是英特尔对ARM阵营挑战的回应。纵观整个芯片市场，英特尔的对手还真不少，AMD整个老牌对手自不必说；ARM阵营也正妄图逆袭X86,；Nvidia，这个GPU市场的王者也正虎视眈眈数据中心领域……他们之间的“爱恨纠葛”将会怎样演绎？给市场带来什么样的影响？另，连续两周之内，包括微软、亚马逊、苹果、谷歌以及腾讯等云领先公司接连发生宕机，给火热的云计算市场浇了一盆冷水。其宕机的深层次原因是什么？是否意味着云神话的破灭？企业用户面对公共云时该如何抉择？欲知详情，请关注《嗑技三人行》。

曾智强：大家好，欢迎回到我们的《嗑技三人行》，这是我们的第二期节目，也是8月份的第二期节目。

张广彬：8月份的尾巴，你不是狮子座，虽然你是曾哥。

曾智强：书归正传，最近这两周关于IT方面的新闻比较多，经过我们这边筛选来看，可能有两个话题我们需要讨论一下。第一个就是关于异构计算的，第二个是关于云计算的，两个都是计算。

张广彬：那咱们先讨论哪个？

曾智强：比较基础性的先说吧。

张广彬：就是传说中的异构计算，或者说已经不是传说了。

曾智强：那行，我们先从比较技术的话题开始讨论，关于这个异构计算，最近因为秋季IDF又要召开了，特别是关于英特尔的新闻比较多，就传出这么一个消息，说英特尔在明年要量产14纳米的芯片。

张广彬：是Atom和酷睿都有，是吗？

曾智强：对，Atom和酷睿都有，可能就说酷睿可能会比Atom要提前半年的样子。

张广彬：但是这个半年，我觉得已经比较短了，记忆中如果从去年算的话，以前Autumn用新的工艺可能比酷瑞要慢很多。

盘骏：是，确实是慢很多，譬如说以前英特尔酷睿系列它很早就有22纳米了，但是像Atom还一直是33纳米。但是据我所知，到明年它年初第二个季度，它就会推出用平板的Atom CPU，但是用到手机上面还是比较晚，可能要再过半年左右，其实从这个来看，它的进度确实大大提升，因为它大概是跟桌面，其他酷睿系列都是同一个阶段上。

张广彬：对，我们很容易想到这是受到ARM的威胁。

曾智强：影响。

张广彬：我们在以前的节目中也对这个英特尔的应变速度做过高度的肯定。那这个事情是不是英特尔，Atom一出是不是就天下无敌了，别人就全都歇菜了呢？

曾智强：我觉得这个可能还是要从本身，就是Atom这个芯片，因为这个东西主要还是针对移动市场的，这一块可能得请盘大师分析一下Atom的这么一个优势和ARM方面的一些东西。

盘骏：相信大家都知道在移动市场，手机上，Atom有一个很强大的对手就是ARM，其实在数据中心方面，它们两个也有点短兵相接。它现在已经到了不得不面对ARM这个程度了，所以它才开始发力，加快速度，加快进度，它以前没那么重视Atom。

为什么Atom相对酷瑞之类的可以更适合面对ARM，因为它恐怕不在第一，像酷系列工艺做得再好，但是你工艺也达不到ARM那种移动的水准。像Atom它有比较好的性能，它有比较低的功耗，特别是下一代22纳米，它已经开始使用乱序架构了，它以前都是顺序执行。像ARM的V7它也是顺序执行，像ARM那个A10，A15，之前是A9和A7。A15它是乱序执行，它性能就提升了一倍，当然它功耗也提升很大，所以现在只有你手上那个手机里面有A15的核。

张广彬：对，但是它这个性能上我感觉发热量也还是挺大的。

盘骏：对，性能提升，发热量就提升了，对这个Atom来说它就从顺序调整到乱序架构，那它这个性能同样也能大幅提升，并且它工艺上有优势，比如说到了明年它到14纳米了，其他人还是22纳米，或者更高，那样它就功耗也下去了，但是性能它还能提升，所以这方面它是一个比较大的改进。这样它就有了对抗ARM的一个基础。

张广彬：但是看起来好像是英特尔受人欺负一样，被ARM逼得，实际上是英特尔太强大了，敌人越来越多，很多人越来越多人联合起来对付他了。

曾智强：对，因为前几天我也听到这么一个消息，就是惠普加入了Nvidia Grid联盟，你看这个事情到底是怎么一回事？

张广彬：对，Nvidia和英特尔对着干。

曾智强：而且惠普之前应该是英特尔的一个铁杆盟友吧。

张广彬：对啊，感觉很容易，因为你看惠普那个Moonshot它本来一开始原形，没有正式出产品的时候，它是基于ARM的，英特尔Atom一出，它其实真正的第一代产品，它就投靠Atom，但是现在又跟Nvidia勾搭到一块，这是啥意思？

盘骏：在运算方面，其实英特尔，还有ARM这个对手，但是英特尔它做另外一块业务就是显卡，CPU这一块，但是这方面它又有两个比较重要的对手，就是AMD，还有Nvidia，它在GPU这方面做得比较早，比较强。

张广彬：但是我觉得英特尔给我的感觉其实是，集成的咱不算，英特尔在GPU方面，如果光说GPU，桌面，包括移动的，感觉英特尔这方面还比较弱，如果光是这个的话，应该不至于联合起来对待它吧。

盘骏：这方面其实不在我们讨论的话题，但是其实还是可以说一下。现在英特尔的集成显卡GPU它现在已经量很大了，因为每一个CPU里面都有它，桌面级的，I3，I5，所以它现在铺货很大，现在那些人都已经不大愿意买低端的入门级的独立显卡。

张广彬：最便宜的总是量最大的，对吧？

盘骏：这个没错，在GPU方面它确实做得比较慢，它一开始是一个叫（06：44）的计划，后来变成…之类，到现在变成Phi。

张广彬：但是它不是用来显示的。

盘骏：对，它不是传统意义上的GPU，但是它做的事情差不多，就是GPGPU是通用计算的。

张广彬：对，那你要这样的话，好像还有一个新闻，也不算是新闻了，也就是说包括咱们的同事著名的凉薯（老梁）说过AMD，又引出一个敌人来，它做HSA，好像要把CPU和GPU又给放在一起。

盘骏：更高层次上看，我觉得这个敌人更为强大一些。因为它是从更高层次上想统一CPU和GPU，像Nvidia它现在也算是有CPU，就是ARM方面的CPU，但是它很弱，但是对于AMD来说不同了，它X86很强，ARM也做，GPU也做，所以它HSA架构就相当于统一它所有资源，CPU和GPU都统一在一起了，这方面我觉得策略是比较强大。

张广彬：那你怎么看AMD？

曾智强：实际上我看盘大师这么一个解读，实际上我就觉得AMD它可能在X86那一块我不及英特尔，在显卡那块我可能有点打不过Nvidia的那种样子，但是现在我把两者统一起来，然后做成这么一个综合的东西，可能就说你英特尔显卡不行，我这里面有显卡，相当于是它APU那一块，但是你像Nvidia这一块，可能就说你可能计算不行，但是我这里面有计算，实际上从AMD现在发的这个产品，包括我们大家所熟知的APU这么一个产品来看，实际上就说它至少在CPU和GPU融合这一块，实际上做得已经算比较好的了。但是可能大家反映到这么一个问题，它CPU的计算能力可能有点不足，但是我觉得这个是可以改进的。

盘骏：就是它这个HSA架构，异构它其实也可以运用英特尔资源，它自己有X86，自己也能在里面支持X86，那样它就可以自然地把英特尔的东西集成进去。如果HSA最开始的时候，它其实是想把CPU和GPU的通信打通，大家在同一个地址空间，这是以前CPU里面数据没有通过PCIe总线传过去，还有一个内存单元来做这种转换，你程序不能直接同时访问这两个。但是，AMD这个架构，它就做出来，你可以无缝访问CPU和GPU，减轻了编程的一大麻烦，性能也会下降。

张广彬：我觉得你说到这里头，我想到其实技术都是相通的，其实我们知道数据的传输其实是非常消耗资源和时间的，其实这让我想起来Hadoop来了，第一它是分布式的计算，计算贴近存储，避免把数据从存储搬运到计算那里。

另外，大家现在也在想很多办法，因为Hadoop和传统的企业计算集成，以前可能用ETL把这个数据转换再送过去，然后再做分析，其实这个效率也比较低。其实大家现在可能就是说，按照我的理解，HSA就是好像大家都可以访问，就需要共享的内存空间，而不是搬来搬去了，对吧？

盘骏：差不多是这个意思，这是原始的HSA，是CPU加GPU，现在提出HSA联盟里面我们可以看到，它里面还有很多ARM的厂商，高通之类的。

张广彬：对，TI，一大堆，还有三星，还有联发科，你最讨厌的联发科。好像感觉其实我是这么觉得，因为你看它这个不管X86，GPU，还是ARM，反正它弄这一联盟，肯定就是反对英特尔的，X86方面英特尔肯定不会参加，所以X86就它一个。

另外，我觉得AMD还是挺值得佩服的，以前有首歌，为了生活我们四处奔波，这个AMD为了反英特尔也四处奔波，跟ARM勾搭，当然GPU它早就有了，它现在把这些，反正什么都有，那你说它会不会除了CPU加GPU，会不会弄X86和ARM搞在一起？

盘骏：我觉得这很有可能，HSA后面这个架构它其实用软件层来掩盖底层的区别，就相当一个中间层，它通过一个HSA，IL，IL就是中间软件层，中间语言的意思，它就把下面各种体系，CPU，GPU之类的，它得上面提供一个标准的API，你可以通过标准的C++，AMT或者OpenCL来调动这些资源。其实这个事情大家都有，Nvidia的也有，英特尔也有，但是它可能是首先做到把X86和ARM统一在一起，这很有可能。

张广彬：关于X86和ARM统一到一起，你能想到啥？

曾智强：我觉得可能就说更像是云计算的那种感觉，你看云计算的那个核心理念不也是吗，它忽略底层硬件的这么一个区别。

盘骏：这挺像的。

张广彬：我觉得也挺像。

曾智强：云计算它的一个核心理念也是按需分配，实际上这个东西，我感觉AMD这种做法，可能不管你怎么讲，CPU和GPU至少在处理应用方面还是有区别的，但是我通过这么一个中间层，我把这种区别至少让应用感觉不到，只让应用提交这么一个需求过来，然后按照应用所提的这个需求，OK，你如果说计算能力强一点，我可能就说把CPU的那个计算资源分配多一点。但是你对图形那一块，或者是其他那一块会比较多一些的话，可能我就会用GPU，或者甚至你把ARM加入进来，如果说你可能这个应用的需求比较单一或者说怎么样子的话，我用ARM可以处理的话，出于环保或者低碳，我可能就把ARM的计算资源分配给你，这样实际上我感觉就相当于是芯片级别，或者CPU级别的，应该这不叫CPU级别了，应该叫芯片级别的这么一个云计算的感觉。

盘骏：就我来看，它可能还有进军移动市场的打算，因为它里面有高通，Imagination，所以它可能在手机里面使用ARM，再加上它自己的或者什么之类的。

张广彬：那你说这个传输中的，有可能你在一个系统里面，这和传说中的一个系统里面用安卓和Windows有关系吗？

盘骏：我觉得其实没什么关系，它只是引导不同的操作系统而已。像我们很早之前用过多启动的，Windows95，Windows98，NT什么之类的。

曾智强：对，之前我记得有，那时候说出来可能就显得我老了，因为那时候的操作系统里面你可以选择，我记得我当时用电脑的时候它有两个选项，你是用Windows操作系统，还是用DOS，那时候还有DOS。

张广彬：那说明你比我们两个年轻不了太多。

曾智强：其实坐在一块都有共同语言，如果说大家有代沟的话可能就坐不到一块来做这个节目了。

张广彬：其实我觉得两位大师说的各有一点，其实都挺重要的，我的感觉就是刚才你讲的硬件方面，包括你讲的操作系统方面。其实作为厂商来说，厂商肯定希望自己的一个技术架构，一个什么东西，就全都是我的，千秋万代，一统江湖，但实际上客观来说还是各有所长的，比如说CPU擅长干CPU的事，GPU擅长干GPU的事，Windows和LINUX也各有擅长。你要弄个服务器或者什么的，你可能弄LINUX比较合适，你要打游戏还是Windows比较好。

所以怎么在一个，不管是哪个层面来说，把这两个东西，以前可能因为技术的限制我们可能只能用一个，或者你要双启动，双启动真的很麻烦，要么你这个DOS和Windows一方面，Windows和LINUX你还要退出来再进另一个。后来有虚拟化技术，在不同的虚拟机里头，这样切换时间就短多了，可能ARM和X86，包括和GPU，是不是它也最后也能达成这么一个效果，甚至更好的。

盘骏：对，其实有很多例子，像你的手机它有一个core是A7，有一个A15的核，然后分不同的时候应用，这是一个性能高，但是功耗高；另外一个性能低但是功耗也低。对于X86和ARM，还有GPU这个方面来说，这个话题比较多，首先是X86和ARM。

张广彬：或者哪怕就像你那个例子我觉得可以要推广的话，酷睿和Atom也可以组合一下。

盘骏：没错，一般认为X86的性能比较高，但是功耗也高。下一代14纳米它可能就会赶上不少。

曾智强：就说在功耗上面降低，然后性能提高。

张广彬：而且我觉得英特尔比较厉害的，它哪怕都是22纳米的时候，我比你功耗还高一点，但是我工艺比你先进，我先14纳米，这就是不对称优势。

曾智强：没错，这是它独有的。我们接下来谈谈CPU和GPU的区别，应该可能很多人比较关注，首先一点比较直观的是GPU它频率比较低，都是几百兆，1G多，但是CPU它可以达到3G，4G。

张广彬：说到这里我有一个笑话，也是我从AMD那个HSA官网上看的，它列举了一个它的APU对普通的CPU和GPU那个组合的优势，它把CPU的频率就写了2.3M赫兹（可以Turbo到3.2G赫兹），可能就把M写成G了，但是它下面的GPU的频率就675M，所以我觉得它可能在两个体系里头，有时候你可能会（18：48）之下。

曾智强：我来介绍一下，GPU它是这样子，因为GPU它刚开始是处理图形的，图形需要的运算量很大，所以它就高度并行化，因为很多图形处理的东西都是差不多的。它也不需要太复杂的逻辑，它处理的东西比较固定，所以它首先要并行很多核，现在你可以看到几千个CUDA核心，你合上去了，你要配置相应的功耗，那你频率就得降下来，这也是为什么它现在频率得降下来。

频率降下来同时对应它也不能处理太复杂的逻辑，像CPU它可以处理很复杂的那种逻辑运算。

张广彬：各有所长。

盘骏：对，但是你GPU就不擅长这个，它频率低，频率低你再加上你又做得不能复杂，所以导致你很多什么分支计算就不如CPU。还有它内存也比较小，显存，可能对它来说是显存，这方面它就限制了一些应用，所以它只适合一些高度并行化，大量的计算，并且IO负荷不能太大，而且内存或者显存也不能太大，GPU的限制就在这里。CPU它频率高，但是核数比较少。

张广彬：对，那你说到这个让我想起你刚才也提到至强的融合那个Phi，它好像也是几十上百核心，8GB的显存，还是叫内存比较好呢？

盘骏：它又没有显示能力。

张广彬：对。

盘骏：就称之为它的内存我觉得就可以了。

张广彬：其实这个刚才咱们说到CPU和GPU，又是CPU和Phi，当然按照盘大师说法，Phi本质上也还是GPU，这两个东西关联让你想起了什么呢？

曾：可能就想起某些比较特殊的行业，比如像天河二号，因为它之前在透露的消息，它是用CPU和GPU这么一种模式。像现在比如不管是HSA或者是那种融合，它实际上就是这种更细致到那种硬件级别的这么一种融合吧，因为之前比如像天河二号，它可能是直接装CPU的，服务器里面，GPU这样子做。

但是，现在我可能就说从芯片级别把它两人做到一块去，有这种感觉吗？

张广彬：其实从一号和二号变化还是挺大的，但是不是每个人都了解，盘大师还是得给普及一下。

盘骏：其实可以说GPU运算在里面比较普及，现在Top500里面有很多用的是GPU系统。刚才我们可能说过GPU就是擅长并行计算，它（浮点运算）能力比较强，所以很多机器都用了它。对天河一号，二号这个来说，它是比较特别的，它更特别，在于它其实有三个运算部件，一个是传统X86，还有一个是GPU，天河一号用的是AMD的方案。还有另外是自己的飞腾1000，这个CPU架构也比较奇特，它们三个要融合在一起是比较特别的，这不像其他的，这是CPU和GPU，只有一个CPU，还不大一样。

然后到了天河二号，它其实其他方面没变，把GPU也换了。

张广彬：对，也就是说虽然它从一号的AMD的CPU和GPU的组合，换到英特尔的至强CPU加上融合的组合，你看来它本质上还是CPU和GPU？

盘骏：对，只不过是CPU比较混合一些，有点像我们刚才谈的X86加ARM，但是这里它不是ARM，那个飞腾1000它不是ARM架构。

张广彬：好像是OpenSPARC？

盘骏：应该是OpenSPARC。

曾智强：那这样子的话，看来这两家不管是英特尔，还是他们在这一块的市场打得还是比较激烈的。这样子我就会比较好奇这么一个问题，就是像GPU大家都在争夺这一个东西，GPU目前和CPU的融合，在我们一些普遍行业里面它有这样子的应用吗，据说百度里面有运用这种GPU的模式？

张广彬：对，好像是用来做机器学习。

盘骏：其实这个融合之前也有，但是可能不是现在谈的融合，之前它的融合其实是以GPU来做的，他们想占领主导地位，但是它确实不能占领。因为它做不了复杂的逻辑，很多控制，分支什么之类，只能CPU来完成，所以它现在是两个一起用，但是可能不是很好很完美地用在一起。

最近有一个OpenCL它就把通用计算比较融合，相同业务可以分给CPU也可以分给GPU，你刚才说那个机器学习那个是另外一个领域，它其实做的是GPU本身的应用，充分发挥GPU的优势。

张广彬：也就是它只是说在我们看来它只是互联网行业的一个GPU的应用，但是什么时候我们能够看到在互联网行业这种CPU和GPU混合模式，或者在非高性能计算的领域，我们能看到更多的这种，比如数据库之类的。

盘骏：其实这种GPU运算在很多方面都能发挥应用，但是我们要看到它的限制，我记得是在外国有一个机构，它用GPU做了一个40G流量的防火墙，说明它在网络方面能应用，因为网络方面是高度并行化的，大量运算。不过，IO能力另外说，除此之外还有数据库方面，也有人做出来一个模型，这是运行在GPU方面，因为数据库有很多大量并行，而且在查询过程中它也有大量运算，这个比较符合GPU的性质。

张广彬：那你的意见呢？

曾智强：我意思就是说，其实CPU在传统领域，不管是互联网还是什么，它都会涉及到最大的优势应该是并行计算，它可能能够应对那种多运算的那么一个环境，而CPU在这一块就会显得不是那么得心应手，因为这显然明显是GPU的这么一个强项。

它这样子运用的话，但是GPU它又有另外一个缺点，就是说它不擅长那种逻辑运算，就是说如果说你逻辑判断有点多的话，可能它就做不了这么一个事情。这实际上可能我就觉得CPU和GPU这么一个融合，看来至少从技术方面来看，它前景还是比较有前途的。

盘骏：就我来看，就像你刚才说的那样，它们各有所长，就我来看它们融合是一个不可避免的趋势。就是大家都把好的拿来一起用，其实这是潮流，不可抵挡的。

张广彬：这一点上来说，我有个想法，不知道其实对不对，比如说大家都说，刚才都说高性能计算领域它的特殊性，可以去尝试很多更前沿的技术，成本可能相对次要一点。然后有些技术比较成熟以后，可能就到了一些，因为高性能计算它在数据中心的角度来讲，它也是比较大规模的数据中心，可能另外一些大规模的数据中心，比如说互联网行业它也会大量用，它可能也会采用这些技术，包括像Facebook，你看Facebook它在考虑X86和ARM它都用，它可能不在HSA那么用了，包括Google它之前都用X86的，也跟IBM搞OpenPower，它也进去插一腿，这是互联网行业，我们很快也许能看到互联网行业扩散。

可能再往下就是那种传统的数据中心了，但是说到这个互联网行业，我也觉得说是不是这个互联网也有些东西是被神话的？

曾智强：我觉得可能还是说跟他们本身的基因有关，像互联网给人最大的感觉就是创新，当然它们天生就具有那种探索创新的基因。但是我觉得你在创新过程中，你如果没有错的话，那是不正常的。比如说像现在云计算应该是互联网行业最先应用的，前几天，这两周也是事出凑巧，亚马逊宕机，因为它是云计算方面的领头羊，然后微软那块也宕机，苹果也宕机，接着还有什么什么，反正就说关于云计算或者说在互联网那一块，大家可能采用新技术或者怎么样，比较早的，大家这两周就接连宕机，我们就会想到这么一个问题，为什么它们会宕机呢？

张广彬：你说为什么会宕机呢？

曾智强：而且是集中在这两周之内宕机。

张广彬：你觉得为什么会宕机呢？

盘骏：我觉得分析吧，首先它们架构有没有问题，就是首先说云计算这个架构，大架构有没有问题，我觉得应该是没什么问题。

异构计算：AMD四处押宝英特尔暗藏韬略？
1
云服务：巨头宕机高发期理性看待公有云
2

在本页阅读全文

嗑技三人行：异构计算崛起云服务遭质疑

异构计算：AMD四处押宝英特尔暗藏韬略？

云服务：巨头宕机高发期理性看待公有云

相关文章

最新文章

Amazon Bedrock年度更新大盘点新功能发布全收录

新华三曾富贵：应用与AI双轮驱动，演绎智能时代的“算力×联接”

新华三发布智算网络解决方案以开放网络赋能多元融合智算体系

2024通信会｜迈向智慧配电网建设新时代，锐捷网络发布双平面配电通信解决方案

安波福如何讲好本土化智能汽车故事？

中国在线反欺诈市场代表性厂商，瑞数信息再获IDC认可

类比半导体EF1048Q：革新汽车配电保护，引领智驾新趋势

IBM专家观点：保险业面临“新质”大考，打造弹性、敏捷的IT架构是转型关键

IBM发布2024年第一季度业绩报告：软件业务加速增长，利润和现金流延续强劲表现

IT支出预测似过于乐观，生成式AI浪潮未能撑起销量

联想王立平：联想全新升级“4311”合作伙伴战略，持续践行合作共赢战略

AI技术为帕金森病找到新的潜在治疗方法

嗑技三人行：异构计算崛起 云服务遭质疑

异构计算：AMD四处押宝 英特尔暗藏韬略？

云服务：巨头宕机高发期 理性看待公有云

相关文章

最新文章

Amazon Bedrock年度更新大盘点 新功能发布全收录

新华三曾富贵：应用与AI双轮驱动，演绎智能时代的“算力×联接”

新华三发布智算网络解决方案 以开放网络赋能多元融合智算体系

2024通信会｜迈向智慧配电网建设新时代，锐捷网络发布双平面配电通信解决方案

安波福如何讲好本土化智能汽车故事？

中国在线反欺诈市场代表性厂商，瑞数信息再获IDC认可

类比半导体EF1048Q：革新汽车配电保护，引领智驾新趋势

IBM专家观点：保险业面临“新质”大考，打造弹性、敏捷的IT架构是转型关键

IBM发布2024年第一季度业绩报告：软件业务加速增长，利润和现金流延续强劲表现

IT支出预测似过于乐观，生成式AI浪潮未能撑起销量

联想王立平：联想全新升级“4311”合作伙伴战略，持续践行合作共赢战略

AI技术为帕金森病找到新的潜在治疗方法

扫一扫

分享文章到微信

扫一扫

关注官方公众号

至顶头条

嗑技三人行：异构计算崛起云服务遭质疑

异构计算：AMD四处押宝英特尔暗藏韬略？

云服务：巨头宕机高发期理性看待公有云

Amazon Bedrock年度更新大盘点新功能发布全收录

新华三发布智算网络解决方案以开放网络赋能多元融合智算体系