大数据操作系统的革命

来源 :中国计算机报 | 被引量 : 0次 | 上传用户:xub23
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  海绵数据的大数据操作系统Sponge为用户提供了一个简单易用的高性能大数据平台,同一个平台可以满足用户不同层面的需求。Sponge是一个划时代的产品,代表了大数据未来的发展方向。
  5月20日,海绵数据科技有限公司(以下简称海绵数据)在北京发布第二代大数据操作系统Sponge。海绵数据CEO朱晓明称Sponge是全球首款基于内存计算技术的大数据底层操作系统:“我们希望利用公司技术团队在IT领域二三十年的技术积累,在大数据底层技术上实现突破,同时抛砖引玉,吸引更多合作伙伴共同投资于大数据基础技术的研发,推动大数据应用快速落地。”
  加速大数据落地
  当前,大数据已经从概念炒作的阶段过渡到应用落地的阶段。用户迫切需要高效、简单、易用、成本优化的大数据平台和工具。但是,目前用户正在使用的第一代大数据操作系统比较复杂,在数据同步和一致性、数据安全、数据处理性能等方面存在不足。为此,海绵数据才潜心研发新一代大数据底层操作系统Sponge。有人说,Sponge的矛头直指Hadoop。“从市场角度讲,Sponge不会刻意与Hadoop竞争。有人担心能否将应用从原来的Hadoop平台平滑迁移到Sponge平台上。其实,在Sponge推出后,已经有用户这样做了。”朱晓明说。
  Sponge在性能、部署和使用的简便性等方面明显优于第一代大数据操作系统。实际测试和使用过Sponge的用户都有这样的感觉。举例来说,第一代大数据操作系统在不出现任何问题的情况下,至少也要半天才能完成部署,而Sponge从下载到安装最多也就十几分钟,大大改善了用户体验。“我们的目标不是与谁竞争,而是希望尽快在中国建立大数据应用和推广的生态链。”朱晓明表示。
  第二代大数据操作系统与第一代产品之间的区别在哪里?“两代产品在技术架构和设计理念上完全不同。”海绵数据CTO李东介绍说,“第一代大数据操作系统15年前就诞生了,其技术架构是在满足当时用户的需求和技术条件下设计的。随着时间推移,用户需求改变了,技术也在不断发展,从底层架构到上层应用,大数据都发生了巨大改变。”
  举例来说,第一代大数据操作系统的工作方式是先进行大量文件的抓取,然后进行存储,再对这些文件进行处理和分析。随着社交网络的发展,大量智能设备不断涌现,传统的文件批处理方式已经转变为现在的交互式处理、实时处理。用户端也要求数据处理的手段更加多样化。“正是看到了技术的变化和当前用户的需求,我们决定重新开发一套大数据底层操作系统,用一个统一的平台满足用户不同的数据处理需求。”李东表示。
  注重用户体验
  评判一个软件产品优劣的标准是什么?强大的性能,还是丰富的功能?是用户的体验。李东表示,第一代大数据产品技术架构比较复杂,应用比较困难,性能调优更是难上加难。海绵数据在开发第二代大数据操作系统Sponge技术框架时,特别注意了架构的简化与整合。用李东的话说,Sponge技术框架短小精悍,功能齐全。
  Sponge在以下几方面实现了突破和创新。在存储层,Sponge整合了高性能的存储,可同时处理结构化和半结构化的数据,并结合了云对象存储和软件定义存储,采用统一的核心,扩展性非常好。在分析计算层,Sponge与Apache Spark紧密集成。Sponge提供的分布式NFS与POSIX完全兼容,可以更容易集成现有的系统、应用和脚本。Sponge拥有支持Hadoop文件系统的接口,可以很容易地与Hadoop生态系统兼容。由于底层的存储架构支持细粒度的数据块,Sponge还实现了CDR(持续数据复制)功能,其集群的拓扑结构采用Masterless,消除了单点故障和文件数目的限制。
  让大数据应用变简单是Sponge的最终目标。Sponge在设计之初就秉承让大数据平台简单实用,同时又不失丰富功能的原则,各功能模块基于同一个核心,实现了高度整合,开发和使用都基于同一个平台界面。Sponge之所以与Apache Spark集成,也是希望将用户的使用、维护和开发融为一体,提供一个简单高效的平台。
  从产品开发难易程度来看,基于Hadoop平台开发一个大数据工具肯定比自主开发一个大数据底层操作系统要容易得多,但海绵数据并没有“取巧”,而是选择了一条比较艰辛的道路。为什么呢?一是海绵数据看到了大数据应用推广难的症结所在,就是因为没有一个简单易用的大数据操作系统;二是IT领域许多底层或核心的系统都是国外厂商开发的,作为中国厂商,海绵数据愿意做这个“吃螃蟹”的人;三是,海绵数据在国内外拥有强大的技术研发能力。“很多人可能认为,开发底层操作系统是一件枯燥乏味的事。但对于大数据应用来说,底层操作系统是不可或缺的。我们希望从这个层面实现全新的突破。”海绵数据COO刘栋表示。
  Sponge是一个底层操作系统平台,包括丰富的技术和功能,比如文件系统、分布式NFC技术、数据分析引擎、数据实时同步技术、软件定义存储、SWIFT云集成等。这些技术和功能合在一起构成了一个高性能、简单、易用的大数据平台,分开也可以成为独立的产品,比如现在十分流行的软件存储等。“有些功能模块确实可以变成独立的商品化软件。”刘栋举例说,“有的用户只关注存储,那么就可以直接采用Sponge软件定义存储产品。我们的销售策略十分灵活,既可以提供打包的整体解决方案,也可以单独提供其中的某个功能模块。”
  不开源 但开放
  Hadoop之所以在大数据领域拥有极高知名度,主要是因为Hadoop是开源的,而且已经建立了一个庞大的生态系统。海绵数据在推广其大数据操作系统时,是效仿Hadoop的成功模式,还是另辟蹊径呢?
  海绵数据已经在产品落地、技术推广、生态链构建等几个方面开始了积极尝试。第一,海绵数据希望培养更多的大数据专业人才,为此将与国内众多高校合作,并为高校免费提供大数据产品。第二,海绵数据还会与高校合作建立一些产业园基地,最快今年6月就会有集产学研用于一体的基地投入建设。第三,在杭州当地政府的支持下,海绵数据正筹划建立一个推动大数据应用实践的产业联盟实体,如果这一模式能够成功,还计划在北京、上海等地复制和推广。“目前,中国的大数据市场规模还不够大,主要原因是炒作概念的人多,而真正落地的项目少。从技术角度讲,缺少大数据底层的操作系统也是一个掣肘。”朱晓明强调说,“我们只做大数据底层操作系统,包括核心的文件系统、存储等,而不会涉及上层应用开发。我们的产品策略是不开源,但开放。我们会开放API接口给合作伙伴,由它们结合不同行业的应用需求进行二次开发,这样也避免了与生态链上的其他厂商竞争。”
  海绵数据的核心技术团队在美国硅谷,其技术专家很多曾参与过第一代大数据操作系统的开发,不仅具有很强的开发能力,而且可以密切跟踪国际最新的技术发展潮流。目前,海绵数据申请的自主知识产权已有20项左右。
  “我们应该感谢第一代大数据操作系统的开发者和使用者。因为站在他们的肩膀上,我们才能用更短的时间开拓并建立大数据操作系统2.0生态圈。”刘栋表示,“我们在努力开拓大数据操作系统2.0的新市场的同时,对于第一代大数据操作系统的客户也志在必得。一方面,我们会用更先进的产品解决用户遇到的技术难题;另一方面,我们的大数据操作系统2.0全面兼容第一代大数据操作系统,方便用户从原有系统平稳迁移到新的平台上。”
  海绵数据的中长期战略目标是,争取在五年内成为全球最大的大数据厂商,占据全球市场50%的份额。海绵数据哪来的这种霸气和自信呢?朱晓明表示:“我们研究发现,大数据2.0时代潜在的市场规模比1.0时代大得多,至少是5倍左右。如果我们能按预期的年均50%的速度增长,5年后我们应该能够与Hadoop平起平坐。”
其他文献
在科技瞬息万变,风起“云”涌的时代,通信行业内的视频会议业务已由最初的鲜为人知成为时下流行的信息沟通工具,中国视频会议市场正以每年超过20%的速度快速增长。传统视频会议模式已不能满足当下灵活、多元化的社会需求,如何实现对传统视频会议的超越以满足多样的客户需求日渐成为视讯行业的重要考量。  作为国内视讯业的领军企业,科达凭借多年来在视讯行业中的积累及自身的综合实力,将云技术融入视讯系统,在云计算的基
天津神州浩天科技有限公司(以下简称神州浩天)是一家自主创新型的高科技企业,由原天大天财股份有限公司核心软件业务优化组合而成,注册资金5000万元,现有员工300余人,是一家集管理软件设计、开发、销售、服务于一体的高新技术软件企业。公司主营业务方向为教育信息化、财税信息化软件产品研发及服务。  对于广大中小企业而言,由于管理不规范,同时缺乏信息化所需的资金、技术和人才,信息化程度往往较低,甚至连基本
中美企业的商业模式经常被人们拿来对比,近日Zynga回归亚马逊AWS云服务一事就着实引发了不少讨论。就应用AWS云服务的角度,笔者首先想到的是,还好小米不是Zynga,米粉节也不是圣诞节。  几天前,国外媒体爆料,美国红极一时的社交游戏企业Zynga宣布关闭投资1亿美元的自建数据中心,重新投入到亚马逊AWS云服务的怀抱。  要知道Zynga鼎盛时期曾在Facebook排名前十位的游戏中占据六席,一
卡巴斯基正在向中国的中小企业安全市场发力。  “其实除了大家所熟知的端点安全解决方案外,卡巴斯基在企业安全领域有着完整的安全产品体系,我们也将逐渐把这些产品引入国内。”卡巴斯基实验室大中华区总经理郑启良表示,卡巴斯基面向中国市场推出全新的中小企业安全解决方案,就是要发力中小企业市场。  郑启良介绍,卡巴斯基中小企业安全解决方案包含反病毒保护、在线交易保护、云管理和数据备份、密码管理等多重强大功能,
8月24日,沪指重挫8.49%,创8年最大跌幅,超过2000只股票跌停。笔者不禁想起一位朋友讲的有关舆情牛股的一件趣闻。  今年上半年,A股市场狂热,新浪财经也适时推出了舆情牛股的付费服务。据称,舆情牛股是基于大数据挖掘技术,快速获知市场热点和重要财经新闻,通过手机短信订阅服务,即可获得每日盘前8:00推送的每日牛股等信息。  现如今,但凡沾上互联网 、云计算、大数据等,鸡犬都能升天。加之,新浪在
人脸识别技术,这种高科技听起来似乎有些遥远,但是其实它早已深入到我们的日常生活当中了。我们通常所说的“刷脸”这种考勤方式,就是通过人脸识别技术来完成电子考勤的。  事实上,人脸识别技术是目前三大主流生物识别技术之一,其他两种是指纹识别技术、虹膜识别技术。目前,全球很多国家都已经建设了各种生物识别技术特征数据集的大型数据库系统,例如,欧洲EURODAC(避难者登记,采集指纹)、非洲HANIS(身份证
快速应对、差异化服务、洞察客户反应 IBM 发布核心银行系统解决方案CBOD 2.0  早在上世纪80年代末,IBM就携手中国工商银行,打造了中国银行业的第一代业务处理系统SAFE,实现了传统银行业务和操作的电子化。后来,为了帮助中国银行业实现随需应变,满足创新的需要,构建灵活、完整和创新的核心银行体系,IBM又发布了“随需应变的核心银行(Core Banking On Demand,CBOD)”
北京宇信网景信息技术有限公司是专注于公共卫生及医疗行业信息化建设,特别是社区卫生及区域医疗信息化建设领域的高科技企业。公司自成立以来,始终致力于开发面向公共卫生和区域医疗信息化领域的自主知识产权的软件产品和解决方案,为各级公共卫生和医疗行业用户提供包括系统集成、软件开发、运营维护在内的IT服务。  北京宇信网景信息技术有限公司(以下简称“宇信网景”)是一家专注于公共卫生及医疗行业信息化建设的高科技
本报讯 10月29日,智华信发布物联空间解决方案。来自教育、零售、金融、政企、公共机构等众多领域的上百位嘉宾代表,参与了发布会,并对信息交互、物联管理等行业解决方案的发展趋势进行了深入探讨。此次发布的智华信物联空间管理系统,基于互联网 、物联网、信息交互、Beacon等技术与理念。通过管理软件系统、智能硬件终端和高效管理规则三大模块,整体实现了对研讨间、实验室、实训室、会议室、办公室、自习座位,乃
从2005年开始,埃森哲会每两年做一次卓越绩效信息技术研究调查项目,以期发现企业信息技术的发展趋势。第四次的研究共调查了全球202家大型企业(其中包括17家中国大陆企业),得出并发布了《卓越绩效IT:以数字定义未来》的研究报告。1月10日,埃森哲大中华区信息技术服务副总裁兼技术咨询总经理何悠毅在京接受采访时向记者阐述了数字化企业趋势,并就CIO和IT部门的变革方向做了深入探讨。  研究报告得出了企