当英特尔遇上大数据

2016-09-01 16:37 出处:PConline原创 作者:佚名 责任编辑:sunziyi

  【PConline 自媒体专栏】百度外卖为什么比其他平台送的快?当然不是因为它的骑手比别人跑的快,而是由于背后有一套智能的算法,能更加合理地派单、规划送餐路线。

  这属于大数据的范畴吗?属于。

  电商平台的商品推荐系统为什么能推荐给你感兴趣的东西?也是因为掌握了你的数据,并据此分析你的生活、工作习惯。

  这属于大数据的范畴吗?属于。

  显然,透过数据分析,作为消费者,我们能体会到大数据给我们生活带来的变化(更快地吃到美食,买到自己感兴趣的东西);作为商家,则能更好地服务客户,发掘商业价值(提升客户体验,获得更高的业务成长)。

  这也是为什么大数据这么火的主要原因,三赢,除了客户、企业,还有大数据解决方案的提供商。

  但这和英特尔有什么关系吗?

  论应用,像百度、阿里、京东,他们这些最终用户在做,论平台软件解决方案,Hadoop、Spark这些开源社区、解决方案提供商在做,论硬件解决方案,浪潮、联想、华为、HPE等基础架构解决方案提供商在做。

  答案是有,而且关系还很大。

  2

  你听说过不打地基直接盖房子吗?反正我没有。

  广大硬件解决方案提供商如果说是房子,那英特尔就是地基。Intel Inside的slogan不仅适用于PC领域,同时适用于数据中心市场。不完全统计,世界上有90%以上的中小型计算机采用的是英特尔的处理器,也就是说绝大多数的数据都是通过英特尔的处理器来处理的。

  你还能说大数据和它没关系吗?地基和房子共同组成了处理数据的硬件平台。

  当然,英特尔在大数据领域扮演的一个角色。另外,你见过装修房子前不测量的吗?我没有。

  如果平台软件解决方案提供商是装修的话,那英特尔所担负的正是测量那个环节。不测量,装修无法做到精准,结果就是费时费力费钱。英特尔是世界上最大的硬件公司不假,但同样英特尔也有着世界上最大的软件研发团队。据悉,它的规模超过万人,而硬件与平台软件解决方案之间的优化、适配就是很重要的一项工作。站在这个角度看,大数据只能是其中的一个分支。

  同样的,应用软件与硬件之间的关系,就像是家具家电和房子的关系,在购买之前也需要测量尺寸。

  也就是说,英特尔作为最底层的平台,无论是与平台软件还是应用软件都有不可分割的关系。其之所以有那么大的软件研发团队,原因不明而喻。

 

  于是,我们看到了这样一个英特尔,大而全。

  硬件层面,不仅是处理器,还有存储、网络,英特尔都做,而且都做的不错。

  软件层面,除了发挥测量功能,对很多项目,包括大数据项目,除了进行优化外,还会主动推出一些开源项目,比如大数据领域,英特尔最近推出了TAP(Trusted Analytics Platform,一个云应用程序的加速工具)。

  给合作伙伴、用户的错觉是英特尔软硬件都要做,而且越做越广。事实上并非如此,英特尔的核心业务还是在硬件,软件方面的投入更多还是在服务硬件,让用户有更好的硬件体验。而为了离用户更近(英特尔并不直接对接用户),英特尔与很多业内的软件服务商都达成了合作,比如与Hadoop解决方案提供商Cloudera的合作。

Hadoop创始人,Cloudera首席架构师Do
Hadoop创始人,Cloudera首席架构师Doug Cutting介绍他们在数据分析领域的探索,以及与英特尔之间的合作

  至于硬件,确实英特尔涉及的领域在不断扩展,这一点英特尔自己也承认。不过听听英特尔公司软件与服务事业部副总裁、系统技术和优化部门大数据技术总监马子雅的解释,或许你会释然。

  马子雅表示,确实任何一个客户都不希望被绑定,但为什么英特尔还能不断扩展,而且越做越好。最简单的道理,这是一个市场化、优胜劣汰的结果。用户可能对英特尔有意见,但比较了性能、用户体验、性价比等后,可能还是会选英特尔。从英特尔自身的角度出发,我们希望能给用户带来最好的解决方案,于是有了至强、至强融核、FPGA。同样做网络、存储也都是一个道理,我们希望给用户最具性价比的产品和方案。

  尽管情感上你可能不太接受,但道理就是如此。就像笔者听某大厂说过的一句话,用户不选你的产品,首先要反思的是你产品是不是足够好,而不是其他。

 

  当使用新技术后,数据处理性能能有几倍、几十倍的提升(当然,其他方面成本、可靠性、安全性等并没有太多的变化)时,可能他真的不会去再纠结是不是有被绑定的可能。

  这样的例子对于英特尔而言,有很多。

英特尔公司软件与服务事业部副总裁、系统技术和优化部
英特尔公司软件与服务事业部副总裁、系统技术和优化部门大数据技术总监马子雅介绍英特尔在大数据领域所做的工作

  在演讲中,马子雅就举了几个例子。一是,一个客户在利用英特尔新一代硬件技术(最新至强处理器、网络、SSD)后,大数据的机组性能整整提高了7倍。

  二是中国一个比较大的互联网公司,在其已有的Spark机组的每台服务器加一块英特尔的SSD,整个机组的性能就能提升20%,在此基础上,利用英特尔开发的Hierarchical storage management Solution层次性存储软件,使得性能再获大幅度提升,最终的效果是整个机组性能提升70%。

  三是一个Hadoop用户,在传统Hadoop中,数据通常存储三个副本,这样造成了200%存储资源的浪费。为此,英特尔和Cloudera在开源社区共同主导开发了一个项目HDFS Erasure Coding,通过它可以把存储成本降低一半,并把编码器和解码器的性能提升30倍,即便和新的Java编码器和解码器相比,性能也提升了6倍。

  这样的例子还有很多,从中也能看出英特尔在其中发挥的作用,就如前文所讲,它不仅仅是个硬件平台提供商,在硬件和软件、硬件和应用之间起到了很重要的润滑作用。

 

  英特尔在大数据领域的脚步还在继续。

  继续在Hadoop、Spark相关的项目,包括SQL、存储等方面继续努力,继续在各种开源项目中贡献,继续在机器学习方面探究,继续在物联网领域摸索……能做的和要做的都有很多。

  比如英特尔正在引领业界大数据基准测试的标准化,制定了Big Bench、High Bench的测试标准。在机器学习方面,通过硬件、软件的同步提升、优化帮助客户提高机器学习模块的可扩展性。在物联网领域,如何更好地将数据收集和商业决定实时结合,英特尔和浙江大华在视频监控领域已取得成果。

网络设备论坛帖子排行

最高点击 最高回复 最新
最新资讯离线随时看 聊天吐槽赢奖品