慧科:挖掘全媒体数据“真相”

来源 :中国计算机报 | 被引量 : 0次 | 上传用户:zemao1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  8月25日,由中国计算机报社、中国计算机行业协会、中国信息化推进联盟共同主办的“第八届中国行业信息化奖项评选活动暨2016中国行业信息化发展高峰论坛”在北京新世纪日航饭店隆重举办。在会上,全媒体大数据智能方案专家慧科讯业(北京)网络科技有限公司(以下简称“慧科”)获得2016年度大数据行业领军企业奖和2016年度中国行业信息化最佳解决方案两个奖项。
  数据创造价值
  慧科成立于1998年,以香港中文大学的一个学术研究项目起步,利用新闻检索技术采集信息,为企业提供媒体资讯和市场情报。由于当时互联网技术刚刚起步,慧科在迅速推出第一代 WiseNews产品后,获得20多家媒体伙伴提供转载授权,并在香港设立的“创新科技基金”的赞助下,得以快速发展。目前,慧科已先后在北京、上海、深圳、南京等9处设立分公司,拥有逾1100名员工(包含合约分析师),服务全球超过2500家大型企业,包括阿里巴巴、中移动、兴业银行、三星等。多年来,慧科为客户提供舆情监测分析和企业信息情报服务的创新产品解决方案,包括新闻数据库、公关、媒体和市场情报方案、社交媒体方案、金融及风险信息方案、商业智能方案等,协助客户随时随地掌握市场和行业信息、制定有效策略。慧科正以强劲的势头迅速发展,成为知名中文资讯商业智能方案提供商之一。
  慧科讯业有限公司研究总监何超博士表示:“慧科早期的商业模式是从公关服务的角度出发,将传统中文媒体上的资讯电子化,也就是利用互联网技术对资讯进行处理,分门别类,在第一时间送达给客户。近年来,随着大数据技术的发展,数据价值凸显,采集数据、掌握数据、运用数据已成为企业的核心竞争力,大数据正在影响着商业模式的转变,为企业带来新的商业机会。慧科的商业模式也从之前的媒体监测转变为以客户需求为导向的全媒体大数据商业情报和市场情报提供商,目前覆盖全媒体智能检索数据库、媒体监测及舆情分析、金融风险舆情及资讯和商业大数据服务等四大核心业务范畴。”
  全媒体大数据智能方案专家
  慧科之前大部分的业务集中在PR方面,而现在拓展至综合的数据供应商和解决方案供应商。
  何超表示:“慧科从之前业务集中在公关方面,到现在拓展至综合大数据,转变是以点概面的。因为,数据无处不在,随着计算机的处理能力日益强大,如果获取的数据量越大,数据挖掘到的价值就越多。慧科的优势就是在十几年的发展中同中国、新加坡、美国等近2000多家媒体结成合作伙伴关系,建立起集信息数据资源、信息管理工具和信息增值服务为一体的全方位、多层次综合服务数据库系统。并且,随着互联网媒体、社交媒体的快速发展,信息和数据更是快速地积累和流动,需要更高计算处理速度和复杂模型来提炼相关信息,挖掘真实的信息。慧科通过对网络、报纸、微博、微信、论坛等全媒体舆情信息进行监控、收集、处理、解析,提供一整套完善的市场情报,以及风险控制解决方案。”
  对公司来说,情报中与业务相关的信息才是最关键的,通过数据洞察将信息添加到业务策划过程,可有助于公司制定一个多维度的可操作性的战略。
  何超表示,在技术方面,慧科引入大规模分布式“网络爬虫技术”,提升信息精准获取和有效整合应用能力,并根据客户个性化的需求,为其提供高效的信息管理工具、定制化的信息情报系统,提供准确及时的情报,辅助客户作出商业决策。
  在产品方面,慧科之前注重在传统纸媒上,主要从公关的角度出发,提供精准的简报服务,以人工为主,技术为辅,但传统媒体缺乏时效性、有效性,随着每天都有海量资讯在网络、微博、微信、论坛上传播,收集这些信息、理解这些信息成为大数据文本挖掘的重点。因为消费者在哪里,企业的营销方式就需要做出变化。当前,慧科紧随信息传播渠道的步伐,配合客户不断锐变的需求,从全媒体角度出发,以大数据技术和人工服务相结合的方式提供四条产品线:一是全媒体智能检索数据库,通过智能媒体资讯搜索,帮助企业相关部门、研究咨询机构、高校等,快速锁定精准的商业资讯;二是专为公关及市场人员量身定制的全媒体监测洞察解决方案,包括WiseEnterprise舆情监测分析、WiseSocial社交媒体营销评估及品牌洞察、以及WiseInsight全媒体研究报告体系三大板块,帮助企业时刻掌握最新舆情,即时发掘重要商业资讯和情报,做出明智的决策;三是WiseSignal,提供全面的金融财经信息,一站式监测和管理风险;四是WiseBI商业大数据服务,慧科透过大数据分析,准确掌握业务状况,制定最佳决策。
  慧科讯业有限公司 BI产品总监李晓伟表示,慧科未来将构建基于互联网大数据的生态系统,除了对文本数据进行语义分析和情感分析以外,还将对行为、交易、CRM等数据进行扩展,目前正在与上下游的合作伙伴合作来打通相关数据链路,从而实现更精准的企业竞争情报分析和消费者刻画,为企业的市场、营销、品牌等经营决策提供数据支撑,实实在在为企业带来价值。另外,将重点针对垂直行业提供解决方案,比如为汽车、快消、3C等行业提供品牌监测、产品体验分析、用户服务分析、营销活动监测、消费者刻画等有针对性的解决方案。在传统业务上,也针对PR行业进行产品升级,提供更加及时快速和精准的分析工具、预警研判的平台产品,真正实现大数据对业务的支撑。
  更胜一筹的中文语义分析
  有别于一般的大数据应用,慧科作为中文资讯服务商,在中文自然语言处理方面积累了丰富的经验,多年来一直致力研发语言学及人工智能技术,并为了更好地服务客户,对普通话和粤语的分析大力投入,使其在中文语意分析上更胜一筹。慧科独家研发的“排版转换技术”系统 (ENMPS),将大量繁、简体中文内容转化至一个易于搜索并具弹性的数据库。慧科的“雅博中文全文检索系统”(IPOC),融合了语意学与上下文的脉络关系逻辑,用户可以用词语、词句进行检索,搜索的灵活性和准确性均大增。
  何超表示:“大数据时代的资讯监测、分析与挖掘,离不开海量的数据存储与处理,同时特别需要人工智能技术(如机器学习、深度学习、数据挖掘、自然语言处理、图像识别等),及大规模分布式计算与存储技术(如Hadoop、 Spark、流计算、图计算、GPU加速等)作为支持大数据解决方案实现的技术基石。慧科注重技术的发展,成立了独立的慧科研究院,目前团队20人毕业于中国、英国、德国、丹麦、加拿大等知名高校,85%以上具有硕士或博士学位,专注中文智能化的分析,即在大数据的基础上对中文自然语义进行智能的解析与挖掘,聚焦的研究方向有文本挖掘与社会媒体分析、自然语义分析与知识图谱、情感分析、深度学习与机器学习等。”
  何超举例说,“敏感”一词带有情感意义,但是在不同行业中的极性不同。比如,在汽车行业提到“操控敏感灵活”是正面词,但在化妆品中提到“皮肤敏感发炎”就是负面词,这就需要结合具体的场景,才能给出正确的结果。慧科除了文本挖掘以外,在品牌识别、图像识别等方面的成绩也很不错。
  慧科通过行业知识和自然语言处理技术,进行数据整合、分类和分析,让客户可以透过慧科的解决方案掌握有价值的资讯,发掘各种资讯之间的关连性,洞悉危与机。慧科有专职的语言学编辑团队维护行业知识;同时也为研究院提供标注数据供其训练人工智能分析模型。
  “慧科的定位不是纯技术公司,也不是仅为公关公司提供简报的人工服务公司,而是把人工和技术深度结合,并应用到企业业务场景去,从而成为提供专业精准的全媒体大数据智能解决方案的公司。公司的未来,媒体的提供渠道在不断改变,慧科作为囊括传统与新媒体可靠内容的中文媒体及商业情报公司,必须提供最全的数据,帮助客户在第一时间获取最相关、最重要的、及最有价值的东西,紧跟市场的变化,根据客户的需求,提供一站式解决方案。”何超表示。
  慧科的转型,不仅体现在商业模式上,在公司的职能部门的划分上也体现出慧科要走的方向。
  李晓伟表示:“主要是根据客户业务类型进行职能上的重构,在原有销售、产品、技术、运营等职能体系之上搭建为每个垂直行业服务的专属团队。比如BI,金融、汽车、奢侈品等行业属性明显的行业,这样的好处是,以每个行业的行业专家和垂直产品为主,慧科可以为该行业客户提供更加贴近客户需求的整体解决方案,比如,针对汽车用户的产品用户体验分析,经过行业专家的模型搭建,利用大数据技术,更精准全面地找到社交媒体上每个用户对于该款产品的体验反馈,咨询团队再根据数据结果进行定性和定量分析形成最终方案,为汽车用户在进行产品改进决策时提供严谨高效的数据支撑。”
其他文献
信诺ETS(Enterprise Technical Support)是一种新型的服务模式,也是当前现代服务业发展的第三阶段。他是以一种高度专业化服务为客户提供长期嵌入式贴身服务的新模式。它既符合近现代产业逐渐分工细化的大趋势,又能满足大量客户需要贴身服务的需求。  信息互联时代的信息化ETS服务,主要给客户提供在企业级的IT策划、设计、实施、采购、维护、安全等一系列的主动服务,即服务商通过一站式
过去,由于技术的局限性,广电用户一直使用传统机械硬盘作为其重要的存储介质,但是随着广电用户业务的创新,传统存储系统的问题开始逐渐暴露出来。传统的企业级机械硬盘,无论是采用SATA接口还是SAS接口,尽管在存储容量上具有一定优势,但在I/O能力、可靠性、持久度方面无法满足新环境下广电用户的新需求,广电用户在存储方面将做出新的选择。   “最先应用到固态盘的是互联网领域,主要是在搜索和CDN方面,之
本报讯 10月13日至16日,由香港贸易发展局举办的第36届香港秋季电子产品展,以及由该局与慕尼黑国际博览亚洲有限公司合办的第20届国际电子组件及生产技术展在湾仔香港会议展览中心举行。  香港贸发局署理总裁周启良表示:“秋电展和国际电子组件及生产技术展云集约4200家来自全球29个国家及地区的参展商参与,是亚洲规模最大的电子产品商贸平台。从本届的展品来看,参展商善于掌握科技趋势,推出了迎合市场需求
本报讯 网易于9月20日举行发布会推出“网易云”,并将其云计算战略定位于“场景化云服务”,致力通过技术方案 知识体系输出,满足“互联网 ”时代企业的研发、运营等实际需求,与以往偏向于存储计算的云计算厂商展开差异化竞争。目前网易90%以上的互联网业务已经运行在网易云上。网易CEO丁磊甚至在网易云的宣传片中表示,要“解放全国千千万万的程序员”,宣布先行投入数十亿元,保持在云计算领域的持续发力。发布会上
北京硕人时代科技股份有限公司成立于2003年,坐落在北京市海淀区上地彩虹大厦,是供热行业领先的高新技术企业之一。硕人时代是国内采用先进嵌入式计算机技术、打造远程测控和市政自动化产品的领先企业,被誉为暖通控制和能源与环境解决方案的市场领导者,为城镇供热企业和终端热用户提供专业化、智能化、自动化的供热节能产品与相关服务。  硕人时代主营业务属于节能环保领域,由热网监控、计量温控、供热能源管理三大板块组
随着移动互联网、云计算的迅猛发展,网络流量的分布从以PC为主的固定网络向规模更大的以移动化的手机、平板电脑、智能设备等为核心的移动网络转移。用户业务的Web化、APP化让数据的存储和计算进入云端。海量的数据呈现多样化和集中化的趋势。同时,为保障网络中各个信息点和核心区域的安全,多种网络安全设备和软件也在每天不间断地运转过程中产生着海量的数据信息。这些信息借助大数据分析正在为网络安全发展提供新的机会
不断增长的企业数据加重了存储的负担。IDC预测,到2020年,美国生成、复制、消费的数据总量将达到6.6ZB,而且大约每隔三年数据总量将翻一番。ZDNet的报告指出,到2020 年,中国产生的数据总量将超过8.5ZB。让人忧虑的是,在如此庞大的数据量中,很多数据仍然处于“黑暗”之中。  什么是“暗数据”?Gartner将“暗数据”定义为企业在开展正常业务活动期间采集、处理和存储,但通常无法用于其他
在管理信息化应用当中,GRC(管控、风险和法规遵从)平台是很重要一个组成部分。GRC平台提供了一整套的IT理论架构,即如何在“以流程为中心、以风险辨识为基础、以实现有原则绩效为目标”的整体思想下,构建一体化企业管理信息化架构。各项GRC管理活动都要与相关的核心业务活动深度交互才能真正实现GRC的价值,而这需要GRC平台充分协调整个组织中的大量人员、流程、技术和信息。  现代信息技术带来的全球化、虚
随着人们对云计算的理解更加深入,现在运用到云的场合越来越多,政务云、办公云、电子商务云,层出不穷。但是针对创意产业的云则一直是空白,Adobe近日在中国发布了其Creative Cloud,填补了这项空白。  此次发布,Adobe将15个适用于Windows和Mac的旗舰级创意应用全部放到Creative Cloud中,包括Adobe Photoshop、Illustrator、Dreamweav
全联接的世界,将是怎样一个美丽新世界?2014年,当华为首次发布全球联接指数时,可能就已经为今年举行的华为首届全联接大会埋下了伏笔。  站在云端看世界,企业的数字化转型势在必行。华为作为智能社会的使能者与推动者,有责任将有转型需求的企业扶上马,并送一程。  9月21日至23日,NetEvents2016全球媒体与分析师峰会在美国加利福尼亚州的萨拉托加举行,汇集了全球各地IT行业100多位的IT厂商