正在阅读:EMC为你解析大数据来源及实际应用趋势EMC为你解析大数据来源及实际应用趋势

2012-04-23 11:58 出处:PConline原创 作者:Echo 责任编辑:xujian1
1大数据应用对个人生活的改变回顶部

  【PConline 资讯】和云计算一样热门的大数据一词,其产生原因是什么,大数据应用,未来在个人日常生活中的实际作用又是如何,前几日,EMC内部几位高管在EMCGreenplumChorus发布会上,对大数据的这一领域,发表了自己的看法,同时还对EMC中国大数据市场战略做了大体介绍,Chorus的产品经理讲述了Chorus的开发历程及主要特点。

李映谈大数据应用对个人生活的改变

   EMC全球副总裁兼中国卓越研发集团总经理,李映博士介绍到,EMC中国卓越研发集团有超过一千名工程师,北京、上海、成都都有卓越研发集团的分布,在沈阳和无锡有两个研发技术解决方案中心。所以在过去五年,EMC的发展是非常迅速也是非常惊人的。

8

  李映在谈及大数据时分析道,在过去的一年中,尤其是大数据成为业内一个大家的共识,中国研发集团很大一部分增长也是来自于大数据和大数据方面的研发。例如,在2010年EMC收购了Greenplum,但是2011年8、9月份,Greenplum在美国第一个全球研发团队就在卓越研发集团在北京开始正式启动,在短短一年半的时间内,整个卓越研发集团在做大数据相关的技术研究、产品研发、测试以及市场推广的团队,加在一起已经有超过一百名研发工程师在为大数据和大数据相关的工作努力工作。

  对于本次EMC正式宣布的Chorus产品意义,首先,Chorus产品是中国卓越研发集团主导的第一款产品,更重要的是,从开始的第一天,从最开始整个想法的产生,到市场需求的收集,到产品的基础研究,到后期的测试、开发,以及到中国和全球的市场推广,都是EMC中国团队主导和美国的Greenplum团队一起努力的结果。

  对于大数据这一话题,李映认为,大数据和云计算三年前、四年前很相象,刚开始谈云计算的时候,不仅是客户,不仅是媒体,甚至做技术的人有时候都觉得云里雾里,但是短短三四年,云计算成为一个共识,是业内真正IT的革命,而且无论是私有云,无论是公有云,无论是混合云,都有切实的案例出现,帮助客户和用户带来实实在在的效应。未来五年中,大数据也会像云计算一样,真正成为给用户、给企业带来更多的价值,能够带来业务的更多的腾飞。

   李映博士还举了一个案例,大概一个月前,有一次接他美国的老板,坐飞机过来,一般接机的时候最关心的是什么时候到,去早了在机场很无聊,可能要待两三个小时,去的太晚了,不好意思,老板已经先到了,是老板等你,你也觉得非常不好意思。所以掌握这个点是非常重要的一个事情。传统来讲,大家打个电话到首都机场,或者到网上查一查航空公司最新的数据,飞机什么时候到,可能都以这个点为准。

  事实上,除了打电话外,一些大数据的应用能带来更为精确的时间,不仅仅能够根据航空公司现在公布的实时的时间,还能够根据当前的天气情况、机场的繁忙情况以及这个航班历史数据,给出你一个更准确、更合适的飞机到达的时间。

  那次李映在接老板就出现这个问题,他一查首都机场的时间,说飞机要晚一个小时到,一查这些大数据的应用,说一个小时之前到,李映当时决定还是相信大数据,所以到了机场,结果最后的结果也是确确实实我老板是根据大数据应用推测的时间那个点到达的机场。

  当时李映在微博上跟很多朋友也分享这个案例,马上就有很多微博粉丝跟我留言,说他在吹牛,在中国怎么能拿到机场的最新的数据,怎么能够了解得到这个机场的航班的历史数据,李映就回答说,第一种是吹牛,第二,这也是大数据未来作为厂商、作为企业、作为用户大家一起努力的方向,怎么能够让大数据真正落地,真正能够帮助我们成为未来,对每个人的生活、对整个社会能够产生长足的影响的新的技术和新的方向。>>

2解读大数据及EMC定位、相关产品回顶部

大数据产生原因及EMC定位、相关产品

  EMC中国区的总经理和全球的副总裁蔡汉辉,负责EMC中国区的业务,从1995年就来到中国,一直到现在,之前在几家公司工作过。蔡汉辉则是剖析了对大数据这一概念的产生原因。

5

  蔡汉辉提到,IT现在已经到了后PC时代,平板电脑、上网本、智能手机等等,不单单改变了个人日常的生活,还有工作的方式,它也对整个全球数据量的变化带来很重要的影响。

  例如,Google每天有10亿条查询,而且所有这些查询都是在全球同时进行的。Facebook每天有超过2.5亿张新的照片在传发。Twitter每天有2.9亿条微博,再加上转发和回复,这些等等等等,都是为什么现在的数据量会产生海量的变化。

  除了数据量爆增以外,数据的来源其实也是多元化的,日常接触到的数据已经不是传统的数据源,一些数字等等,而是它包括了很多叫“非结构化的数据”。连航班航线也可以成为一个数据。地球的物理信息、基因组的信息、影视媒体信息等等,都是比较典型的非结构化的数据。

  在最近的一个名为“创建数字宇宙模型”的调研里面,IDC指出,作为一个个人,每个人每天生活里接触很多数据,很简单,像拍照片,通过ATM取钱,从Mp3下载音乐,写微博、写博客、发电子邮件等等,其实所有这些数据我们日常接触到的,达到整个数字宇宙的大概10%左右。所以大家可以看到,其实现在的数据量是多么的大。

  实际上IDC也指出,在未来十年里面全球数据将会爆炸性的增长,增长44倍,从原来0.9ZB增加到35.2ZB,数据增长量是非常强大的。所有这些数据里面,达到90%的数据是非结构化数据,就是我刚才提到的不是传统的数字等等的数据。

  现如今是信息经济年代,在信息经济年代里谁能掌握好、掌握透信息,谁就是赢家。所以大部分的企业也好,政府部门也好,都想怎么样有效的能够取得利用和分析海量的数据,还有怎么样利用这些数据去增加竞争能力,从政府部门来讲,可能是商业化,怎么样提高给市民、给社会服务的质量和响应力。这些都涉及到一个大数据的话题。

  蔡汉辉说道,EMC作为全球领先的信息技术架构,信息和解决方案的提供商,在大数据的使命是要引领客户和合作伙伴成功的走上大数据之路,要帮助他们用大数据之旅加速业务的转型,这是EMC的使命。

  而对于EMC的定位,蔡汉辉认为EMC有能力提供最好的在大数据方面的解决方案,会使用户从数据源获得最大的价值,增强他们业务的灵活性,提高他们业务的效率。

  另外,EMC的大数据解决方案是构架在一个弹性的横向扩展的存储平台上,会运行特定设计的分析工具,设计可用于结构化、非结构化的数据,在生产环境和业务流程平台上面提供可以付诸实战的洞察力。>>

3EMC大数据的市场策略三个阶段回顶部

EMC大数据的市场策略三个阶段

   蔡汉辉将EMC大数据的市场策略分成三个阶段。第一个阶段是先要建构一个云基础架构。

  为什么首先需要有一个云基础架构呢?这是因为大数据的两个特点,从数据方面,第一是海量,第二是90%是非结构性的,所以要成功的进行大数据,也需要首先有大数据方面的存储。

  也就是说,传统的无论是存储方法还是管理方法都会出现瓶颈,EMC能够为客户提供解决方案,为客户提供的产品有几个。有海量数据和非结构性数据,EMC的Isilon产品也是通过在过去几年前并购的产品,这个产品可以提供无限的横向的扩展能力,因为今天的数据量爆发性的增长,谁能够很有效的预测究竟这个数据量在未来的时间内会是怎么样增长的情况,所以我们要提供非常具有灵活性的扩展的环境,恰恰EMCIsilon就有这个能力,无限的横向扩展,这是其中的一个产品。

  现在全球Isilon的用户很多,已经有超过差不多两千。在中国现在Isilon的企业级用户已经超过80个,较大的两个,华大基因就是用Isilon来分析基因的数据信息,他们的量达到超过7PB。还有一个是浙江省的图书馆,数量也超过1PB。

  EMC的另外一个产品是Atmos。Atmos也是EMC在大数据方面提供的存储的解决方案,它跟刚才的Isilon不一样,比如分布式的大数据的做法,Atmos是很好的解决方案,很多在提供内容的、提供服务的供应,Atmos对他们来讲是非常有帮助的。

  在一个多月前,中国三个电信运营商之一,就采用了EMC的Atmos,建他们的公共云的平台,给他们的客户提供公有云的服务。它为什么会选择我们的Atmos,其中有几个重要的原因,第一是性价比很好,它比较简单,用户只需要点击三次,就可以实现存储。另外,Atmos还有一个特点,它拥有一个很好的API界面,可以帮助他们很快的开发应用,所以最后Atmos产品击败了很多参与投标的对手,成为电信运营商选购的产品。

  Isilon和Atmos都是提供存储的平台。当然有了数据以后,就需要有效的分析能力,才能通过这些数据的分析让不论是企业也好,政府单位也好,取得更加深的洞察力。

  在数据分析方面EMC提供的解决方案、提供的产品是Greenplum,Greenplum有两个产品,第一是GreenplumDatabase,GreenplumDatabase是大规模的并行成立的数据库,它可以管理、存储、分析PB级量的一些结构性数据,它下载的速度非常高,最高可以达到每小时10TB,速度非常惊人。这是EMC可以提供给企业、政府,用来分析海量的数据。但是GreenplumDatabase面对的是结构化数据。很多数据超过90%是非结构化数据,EMC有另外一个产品是GreenplumHD,GreenplumHD可以把非结构化的数据或者是半结构化的数据转换成结构化数据,然后让GreenplumDatabase去处理。

  这两个产品加起来就能够提供给无论是商业的还是政府的用户,去分析他们存储下来的海量的数据。另外,还有企业级的Hadoop解决方案。

   大数据的市场策略,第一阶段是建构一个云基础架构,给海量PB级规模的数据、实时的、多源的数据提供存储的环境、分析的环境。第二阶段是跟协作有关系,第二个阶段是怎么样提供协作的环境、怎么样提供自助服务的环境,蔡汉辉说道EMC也将这个阶段称为社交化的阶段。

  大数据这个概念的出现,也出现了一个新的角色,这个角色我们称它为“数据科学家”,数据科学家是负责分析和解释无论是在企业里面、在政府部门里面所有这些数据的。但是我们要为这些数据科学家提供什么样的环境,来帮助他们更有效的工作呢?我们需要把这些数据科学家跟IT、跟业务部门之间的界限打破,需要给他们提供一个灵活的环境、标准的环境,让他们去共同分享信息。这个环境关键是需要能够让这些数据科学家能够灵活分析这些数据。

  大数据战略的第三个阶段是要提供一个敏捷的环境。需要考虑的是怎么样能够有效的支持大数据的应用程序,从而可以在实际决策方面得到进步,怎么样可以掌握好数据为经济时代提供帮助。EMC是具有预测分析能力的企业,以应用程序为重点。要提供打包的应用,成本比较低,同时灵活性比较小,比较局限,需要一个非常精确的模型才能取得成功。

  另外的一个选择是定制的应用,定制的应用是按照用户的需求去定制的,但是它的缺点是这个做法慢,而且昂贵、难度也非常大。如果我们能够给这些用户提供一个以应用为重点,能够通过应用让他们具有预测分析能力的企业,这是我们的目标,就是通过我们刚才说的敏捷开发的方法,既针对客户的需求,也避免了由于定制化应用产生出来的一些不足的地方。简单的说,就是敏捷的开发的方法是基于迭代的、渐进式的软件开发模式,在开发过程中需求和解决方案都在逐步演进。这就是大数据之旅的第三个阶段。

  在这方面EMC提供怎样的解决方案呢?刚刚在3月下旬EMC收购了一个公司叫做PivotalLabs,这个公司是旧金山的公司,就是在敏捷开发方面提供服务跟软件的。底下都是一些有名的公司,他们都是PivotalLabs的客户,比如Salesforce.com、Twitter等等。

  总的来讲,EMC希望通过刚才这三个阶段建立一个云的基础架构平台。第二,提供一个协作的环境,社交化。第三,应用的敏捷化。EMC希望通过这三个阶段来帮助我们所有的用户成功的走向大数据之旅,让他们都成为具有商业预测能力的企业。

  谈及未来EMC在中国的发展的发展规划,蔡汉辉指出,EMC看到在中国大数据的机遇很多,实际上从08、09年开始,EMC引入了Isilon、引入了Greenplum,到2011年,EMC的业务的增长大概是10倍左右,平均每年都是3倍的增长。未来三年EMC的目标,每年翻一番,其实单谈到2012年,相对去年EMC在大数据方面刚才提到的产品、服务,目标也是去年的3倍,所以今年EMC达成2012年的目标,都不只翻了一番。

  蔡汉辉还对大数据业务的战略举措提到了几个重点,有几点。第一,EMC还会依赖目前其核心的市场销售和咨询顾问团队,加强行业的覆盖。无论是云计算也好,大数据也好,都是EMC其中的一个重点。第二,EMC会利用在中国的3000多个渠道的合作伙伴,会重点培养一些来帮助完成我们大数据在中国的市场策略,比如有一些大家很熟悉的,神州数码、怡德、易通等等。第三,在中国EMC有一个立足本土的研发团队,就是李博士的团队,GreenplumChorus产品主要是在中国研发的,这个产品不但是支持中国本土的市场,还支持全球的市场。有那么强大的研发团队在中国,这对于EMC去开拓大数据业务、开拓大数据市场是非常有帮助的。>>

4Chorus产品的开发和它的特性回顶部

Chorus产品的开发和它的特性

  EMC中国卓越研发集团资深产品经理,庄富任则是介绍了Chorus产品的开发和它的特性。

3

  庄富任强调了几个重点,第一,Chorus是一个由中国研发团队主导产生的产品,不只是针对中国的市场,也是针对全球的市场。

  经历了短短的一年半的时间,其实才很短的时间,从没有,到整个data,才通过短短一年半的时间,这是非常难能可贵的。如果没有中国的研发团队,Chorus这样一个这么好的产品是不可能问世的。

  第二点是,Chorus是全世界第一个基于协作分析的大数据平台的协作分析平台,在EMC看来整个业界认可的其他软件提供商,他们都还没有用到这个品牌,EMC等于是整个中国研发团队在大数据分析是很领先的领头羊,所以其他一些竞争对手可能是看到Chorus之后,才开始觉得协作、分析大数据是很重要的,才开始投入关于它的研发,但是晚好几年的时间。

  第三,Chorus有一些beta客户,EMC团队是可以很快的会回应客户的需求,所以当EMC邀请一些beta客户来进行试用,大概每个礼拜我们会提供一个版本给客户,就是客户在这一个礼拜有什么问题、他有什么需求,EMC研发团队会很快的针对他们的需求做跟进,所以这是非常快速的。庄富任相信其他公司很难在这么短的时间开发一个架构,提供给客户。所以Chorus不只是产品的特色,甚至整个研发团队在中国是很靠近我们的客户,可以很快去回应客户的需求。

  去年对于Greenplum来讲有一个很重要的时刻,我们提出一个新的概念,叫做统一的分析平台,就是针对海量数据有一个统一分析的平台,它包含什么呢?有三个主要部分,刚才也提到了第一是Greenplum的数据库,第二是Greenplum的非结构化的数据,这是什么不一样的呢?数据库很传统,就是储存一般化的数据,这已经发展了好几十年了。

  我们看到客户越来越多的需求,刚才提到非结构化数据,什么是非结构化数据呢?我们可以看见文件是非结构化数据,对于Internet来讲网站的数据是非结构去数据,对电信业者来讲,每个人打电话的明细是非结构化数据。这样的数据增长的非常快,我是不是有一个能力去帮助这些客户储存这些数据,用一个很便宜的架构,去存储这样的数据?这就是Greenplum的产品公布,可以帮助客户用最便宜的价格去存储这些数据。第三就是GreenplumChorus,是基于这上面的协作分析平台,因为有了数据的储存,需要有一个共同的平台去分析底下的结构化跟非结构化数据。

  当前时代的一个趋势,数据科学家在每个企业里面是一个逐渐茁壮的团队,这个团队包含什么呢?不只是单纯的数据科学家,还包括传统的数据工程师、IT部门,还包括事业部分析师和一般事业部用户,都是我们称之为的数据科学家,因为每个人都有他的知识或者信息去做分析。

  GreenplumChorus是在最上面一层,是统一的界面,让数据科学家能够登录进来,甚至这个平台是开放的,对第三方或者合作伙伴是可以很容易的去整合进来。然后可以去访问底下的结构化数据,GreenplumDatabase等等。EMC有一个beta客户是电子商务客户,他可能在原本数据库里面,刚开始做的时候,他可能从5TB的数据库资料,因为这会一直增长,增长之后他发觉很多数据想要存在数据库里面是没办法去满足的。

  这其中的原因大概有几点,第一,成本可能越来越高,数据库可能没办法储存一些非结构化的资料和数据,因为他们是电子商务平台,所以他们有一些客户或者消费者当登录网站以后,在每个页面去点击这些记录想要记录下来,他想要去追踪我的客户里面的消费性的习惯,甚至他也想把一些外部的数据拉进来,就是一些微博的讯息等等。

  这些都需要一个很好的储存设备或者很好的计算设备,这时候EMC把hadoop这样一个解决方案加进来。有了这样一个基础的数据的基础建设以外,更需要一个共同的平台,能够把非结构化的数据转化成结构化数据,或者希望把这两个东西结合起来做分析,也就是说我的客户资料或者我的客户的交易信息,都存在数据库里。页面上点击的资讯是存在hadoop里的,是不是这两个数据能够结合起来做分析?这时候就需要Chorus做分析,产生一个最后的结果。

  数据处理的速度是越来越快,同时也越来越便宜。但是这还不够。Chorus要的是什么,达到一个什么效果呢?首先它是一个社交平台,是一个开放式的平台,然后它是敏捷的,这是整个Greenplum在产品战略里面着重的部分。所以对数据科学的分析,首先它是结构化的数据、非结构化的数据,其次在企业内部的所有人都可以做协作的分析,然后通过Chorus这个平台也能确保它的安全性跟可靠度。

  现在的企业不能够单单只想说它的数据是只有小部分,或者它的工具只要用几个工具就可以了,或者用少部分的人做分析。我们看的是一个更大的平台,所有的数据都应该进来这个大数据分析的平台,所有的工具都能够很轻易的进来分析,所有的员工都可以参与数据分析,任何一个人都可以是数据科学家。

  对于GreenplumChorus的几个比较重要的功能,庄富任列出了四个,个人的沙盒、数据发掘、协作分析、开放架构。

  EMC想要把Chorus当作数据科学家的分析平台,每天一大早起来,登录的就是Chorus,就会很兴奋,一大早进来没有登录Chorus就活不下去。以前在做一个数据分析的时候,是很痛苦的,也非常冗长,它的流程是非常久的。

  为什么这样讲呢?如果你真的经历过数据分析的流程,比如这张照片里看到的,第一,要去发掘数据,然后拿到这些数据,这样的流程可能要跟IT打交道,可能要跟他申请,申请了之后,还要等到一些流程,他们同意了,才可以拿到资料做分析,这样的时间可能要花一个礼拜,这样的时间还是蛮快的。

  拿到这些数据之后,目前没有很好的工具让这些数据科学家或者分析人员去了解这些数据,因为对他们来讲,数据不仅是0跟1或者是数字,需要有很好的工具,能把这些0和1的数字变成图形化,展现给研究人员。

  第三步是哪些数据是我要的,我怎么把它拉进我的沙盒,沙盒就是自己独有的数据库,可以在里面做任何分析,做任何分析都不会影响到生产线里面的效能,所以你可以在里面做任何实验,都没有关系。这样的话,IT也不用担心你滥用计算机等资源,他会很放心的可以让你去做,但是以前是没有办法这样做的。之后是开始分析,他可以自己一个人单打独斗,就一个人埋头做分析,没有协作的平台,因为很多分析是可以靠很多人进来参与的,缩短这个分析的流程,所以这样一个分析流程你单打独斗会花费很多时间。最后我建立了一个很好的模型,就可以进行运营化。这样一个流程可以花去好几个礼拜或者几个月的时间,才可以得到一个分析的结果和发布出来。

  为了解决这样的问题,EMC希望Chorus是达到一个更快、更容易的、敏捷的分析平台,所以当它从探索数据、创建一个所谓的项目的空间,一个你自己独有的沙盒,到做数据分析,都是一个协作的平台,任何人都可以进来做协作分析,而最后把你的发现或者你的程序代码或者你的建议好的模型发布出去,让别人可以重复利用,这样就真正缩短了整个分析的流程。

  刚才提到几个case,甚至我分析的模型可以很快,一天两天就可以完成,很快就可以给我的事业部门或者别的部门去用。

  第一个功能在Chorus里面,就是个人的沙盒,当每个部门可能有不同的分析需求,例如华北、华中、华南不同区域可能有不同的分析需求,所以可以为华北、华中、华南自己去创立他们自己的个人的沙盒,就是数据库,创建的沙盒不会影响到整个数据存储里面的资料或者数据存储里面的项目,在里面做的分析或者做了一些很笨的事情,都不会影响到原本的生产线的数据存储资料或项目。

  就是对IT来讲,沙盘等于是非常放心的,因为反正你在你自己的沙盒里面随便试验,都不会影响到生产线。数据科学家也可以很容易的去创建他自己的工作空间。这个东西是很有弹性的,就是我要的数据越大,我可以有更大的空间,如果当我的分析结束以后,我可以很容易把这些资源收回,让别人去使用,所以它是很有弹性的。

  另外是对于企业级的搜寻的应用,EMC觉得越来越重要,就是结构化的数据跟非结构化的数据,这两个加在一起以后,怎么样有一个更好的搜寻引擎可以去找到结构化跟非结构化的数据。例如Google或者百度提供的就是所谓的网站的一些搜寻,但是目前针对企业级里面的数据库或者Hadoop的搜寻引擎,并没有很好的解决方案,EMC中国研发团队建立一个非常强大的企业级的搜寻引擎,使用者可以很简单的只要把握关键字,例如想要知道华中地区的市场数据,很快就可以把这样搜寻出来的结果,例如你可以去哪个数据库里面找到,点击进去以后就可以看到每个数据之间的关系。

  我们看到的数据不只是0跟1或者是很简单的文字性的叙述,我们要有很好的视觉化处理的工具或者引擎,可以把0、1转化成统计式的很简单的图形,可以让你很容易的看到整个数据的分布情形,这对他们来讲搜寻数据变得越来越容易,越来越视觉化。>>

5EMC解读协作分析总结Chorus特点回顶部

EMC解读协作分析总结Chorus特点

  协作的分析,这是EMC觉得越来越重要的一点。庄富任举了一个简单的应用场景来解释协作分析带来的便利。

  可能在事业部里面,在华北的零售商是专门卖冰品或者冰激凌,他们会发现为什么这个礼拜我的冰品或者冰激凌销售量增加很多,他们不知道什么原因,他们只要登录到Chorus平台,然后跟数据科学家讲,我想要知道为什么华北地区冰激凌的销售量在这周突然增加。他登录进去,通过这个平台发布这样一个问题。

  身为一个数据科学家,当登录Chorus以后,看到这样一个问题,就赶快做分析,所以不用等到IT去申请资料,就可以找到客户的资料,华北地区的销售资料,甚至可以很容易的把非结构化的资料抓进来,因为光有客户的资料等等还不够,还可以把几个资料抓进来,比如天气因素,天气因素可能是从气象局,把外部的资料拉进去给Chorus做分析,或者是可能怀疑是其他竞争对手降价促销,也把这个资料拉进去做分析。

  通过Chorus这样一个平台,很快可以建立一个模型,做一个所谓的分析,找到关联性。最后可能发觉华北这个礼拜气温突然升高很多,数据科学家会把这样一个结果发布在Chorus,非常快的有一个及时的通知,华北的这些事业部的兄弟就会知道,为什么冰激凌的销售会突然爆增,是因为天气的因素。而且通过分析的结果,我分析出来,因为我拿到气象局的资料,未来一周气温会持续维持很高,甚至一两天的时间我就做出决定,因为这样一个因素,我希望在华北地区增加铺货的量或者我希望多做一些方案,让销售量更大。

  所以通过这样一个共享的空间,可以很快的及时的去面对市场的反映,这比一般传统的分析的工具或者平台,达到这样的效果要快,他们可能要好几个礼拜才有这样一个分析的结果,如果这样的话市场先机就失去了。除了这样灵活的分析以外,当然也要确保在Chorus里面数据、资料的安全性,什么样的人可以搜寻什么样的数据。

  最后一点,Chorus在今年有很大的宣布,也就是说EMC希望去开放平台,这对EMC来讲是一个非常不一样的产品的战略,EMC看到一个开放性平台的重要性,对于Chorus来讲,除了提供更广的整合环境,任何第三方的人都可以进来做整合,也可以看到一些第三方的数据越来越重要,很多第三方合作伙伴,提供很好的视觉化的工具,EMC都希望他们可以很容易进到这样一个平台。

  开放性成功的例子,java还有最近很成功的安卓。大部分智能手机都有安卓这样一个开源、开方式的平台。所以EMC希望Chorus是企业级里面的大数据分析里面的开源、开放式的平台,它就像是安卓在智能型手机里面扮演的那么成功的角色。希望任何人都可以下载使用,拿来以后他可以自己修改,符合自己的需求。就是你看到安卓的系统虽然是Google开源、开放出去的,但是三星或者HTC可以把这样一个东西拿出来修改成符合自己需要的产品。

  所以EMC希望Chorus也是这样的产品,客户和我们的伙伴可以免费使用、修改,然后去做成他们符合自己需要的大数据分析的解决方案,这就是EMC想要建立的生态系统,把所有的伙伴,把这样一个大数据分析的生态系统做得更大。EMC的计划,因为Chorus现在还不是开源的,希望它逐渐的在2012年下半年可以开源,任何人都可以使用。

  庄富任总结Chorus的特点时这样说,Chorus是非常不一样的,它是全世界第一个基于大数据分析的社交协作的平台。第二,因为开源和开放性的特性,跟其他的封闭性的系统不一样,可以很容易的让第三方伙伴进来做整合,扩充整个大数据分析的功能。最后,EMC最重要的一个宣告或者宣誓,我们对于Chorus的开源觉得是很重要的具有战略性的,希望所有的伙伴可以使用下载,做成符合他们自己的大数据分析。[返回频道首页]

为您推荐

加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多

网络设备论坛帖子排行

最高点击 最高回复 最新
最新资讯离线随时看 聊天吐槽赢奖品