复杂数据探勘的道德风险与规训机制

来源 :图书与情报 | 被引量 : 0次 | 上传用户:iversonKKE3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:立足广域共享信息资源池和聚汇机器学习算法的实时且廉价的可视化数据探勘在充分展现出深度发掘数据资产价值剩余、创新优化公共服务能力、有序增进社交福祉等强劲实力的同时,逐渐暴露出直观探勘干扰自由表达、智数决策破坏平等格局、数据鸿沟扰乱竞争秩序等严重背离基本人权与经济目标的道德风险。亟待在弘扬超越异质群体不同诉求的共在、共生、共享、共荣之共同道德精神的基础上,全面执行安全、自主、适应性和利益协调等具体道德规训。
  关键词:大数据;复杂数据探勘;道德风险;共同道德精神;道德规训
  中图分类号: G203 文献标识码: A DOI:10.11968/tsyqb.1003-6938.2016114
  Abstract When the real-time, low-priced, and visual data are discovered through sharing information resource pool over the wide area, converging machine learning algorithms efficiently reveals powerful strengths like deep mining of the surplus value of data assets, and innovation and improvement of public service capacity makes ordered enhancement of social well-being possible, moral hazards which seriously deviate basic human rights and economic goals are gradually exposed, for instance, intuitive mining interferes free expression, intellectual data decision-making breaks equal structure, and digital divide disturbs competition orders. The solutions to these burning problems lies in the promotion of common moral spirits which is symbiotic, co-existing, shared and co-prosperous to advance the different demand of heterogeneous group. Specific moral disciplines like safety, independence, adaptation, coordination of interests ought to be fully implemented, in order to help the leap development of singularity era.
  Key words big data; multiple data discovery; moral hazards; common moral spirits; moral disciplines
  1 引言
  IT4.0时代,海量数据与创新技术逐渐构成人类生存的整体环境背景,同时,随著具有语义特征的智数基础设施、并发采集工具、分布式存储集群及计算能力的指数级攀升,旨在促使数据清洗、数据整合、数据选择、数据流转、数据挖掘、型式评价等流程日渐澄明,而及时且直观的复杂数据探勘通过深入揭露事物本质特征和内在规律,改善人类族群的思维逻辑与行为模式,助力数据引领的爆发式经济增长迅速走出混沌无序的状态,驱动着整个社会的多栖化自由发展。复杂数据探勘不仅可以筑造出可供任意需求者(如政府部门、企事业单位、其他组织和强势个人)自主挖掘海量数据的简便通路,亦在一定程度上加深了这些探勘主体与原初数据权利人之间资源占有和技术认知的巨大鸿沟。面对数字经济的历史性机遇,缺乏法律规制、政策调控、舆论干预与信念影响的恶意探勘者通过输入巨量冗余数据、搭建错漏频现的集成模型、超界域深度挖掘敏感关联、悄然独占数据资产价值增幅以及篡改探勘结果等牟取短线暴利,频频引发了评估失真与预测偏差,甚至动摇了多元利益群体之间脆弱的动态平衡。
  人类活动的价值基础和生命意义的判断标尺是道德良善。以道德败坏为代价的技术胜利只能使得个人愈益成为别人的奴隶或自身卑劣行为的奴隶[1]。充分发挥复杂数据探勘推动不同产业融合创新、助力供给侧结构性改革等正向效应亟待建立以公正、平等、效率、互利等为核心的道德规训机制,全局闭环导控直观可视的海量数据存储、流转与分析过程,有序平衡政治、社会和精神力量,联动增进全人类福祉。
  2 复杂数据探勘概述及分析
  复杂数据探勘(Multiple Data Discovery)特指大数据时代基于人工智能技术开发的创新型数据处理平台中技术实力薄弱的泛在探勘主体自助采集、传输与分析海量数据的直观流程,具有廉价、简单(无需编码)、实时(数分钟内完成建模并随数据更新自动运转)、直观(可视化透明处理)等特征[2]。如多摩平台(Domo)从广大探勘主体正在使用的多元数据资源池中直接调用零散信息并以可视化方式实时展现浓缩和提炼的挖掘结果[3]。
  复杂数据探勘大幅降低深度挖掘的准入门槛,有力提升以中小企业为代表的弱势探勘需求群体的社会竞争力。近年来,巨量数据资产满溢的潜在价值促使众多逐利主体通过积极挖掘以前因为科技所限而忽略的资料,构筑崭新的数据引导决策的高效运营模式。如亚马逊公司(Amazon)通过集中分析140万台服务器上10亿GB数据优化供应链和动态价格,以提供卓越的个性化购物体验,促进总销量和平均盈利增长[4];又如,领英网(LinkedIn)基于高量级、高速率与高辨识度的数据挖掘形成推荐列表,提升了职业双选满意度[5];再如,捷孚凯市场研究集团(GFK)通过挖掘海量高附加值调查数据及其关联资讯,较为精准及时地披露受试者的掩饰倾向[6]。然而,这些传统的深度挖掘模型较高的物理设施要求与高新技术障碍等迫使探勘需求者投入大量成本购置基础设备并培育和雇佣众多数据专家。复杂数据探勘虽然“没有完美无缺的内部架构,却具备简明、便捷和廉价的优势”[7],确保任一需求者均有能力自主参与多元共治的数据资源流转,通过实时关联决策从消费源头重识产品价值、从个人终端完善知识共享[8],推动去中心化的泛化社交平台逐步替代传统交互场域[9],引领所有社会领域的革命。如“点对点”的全景亿图系统(Panorama Necto)通过“比Excel更直观的界面、比Tableau更强的分析能力、比SaS更简单的操作”[10],为广大探勘需求者提供动态自主完成数据存储、挖掘并生成分析报告的“所见即所得”的自助平台,促进整个市场的公平竞争与有序发展。   同时,复杂数据探勘避免了委付数据引发的诸多风险。高度专业化的旧式数据挖掘迫使无力自建平台的探勘需求者(如中小企业)冒着泄露、损毁商业机密或客户数据的巨大风险委托第三方进行深度挖掘。受托者却不可能完全了解委托人的运营细节和具体市场状况,常常在算法选择与模型建构上出现错漏偏失,导致挖掘结果失真无效,甚至产生较为恶劣的负面影响。如基于Facebook巨量运作数据挖掘的精准广告投放不断暴露的实效偏差迫使全球最大的广告主宝洁公司(Procter & Gamble)大比例削减精投费用,迅速回转传统营销平台[11]。复杂数据探勘为广大弱势需求者提供了安全低耗、直观廉价地自主点亮暗数据(Dark Data)的最优选择,正在改变包括天睿(Teradata)、维提卡(Vertica)、哈道普(Hadoop)等在内的晦涩深奥的二进制运作机体垄断挖掘市场的局面。
  3 复杂数据探勘的道德风险
  复杂数据探勘技术与平台的出现,一方面是以梅尔数据(Datameer)[12]为代表的“傻瓜式”复杂数据探勘系统广泛应用于政府部门、企事业单位乃至个人用户的靶向研发、精益生产、精准营销、个性教学以及普惠金融等,在一定程度上突破了探勘需求者的技术局限,填补了专业数据处理机构、数据工程师与探勘需求者之间的实力差距,减轻近乎固化的“自然的或生理上的不平等”以及“精神上的或政治上的不平等”[13],迅速获得大众信赖和推崇;另一方面是“基于信息技术无限扩容的数据蓝海”[14]的复杂数据探勘私密化的可视化运作方式无形之中加深了熟悉对象数据内涵与关联价值的广大探勘需求者与原初数据权利人之间的能力鸿沟。道德规则认知有限或自信有能力规避的需求者为了“多快好省”地“追求眼前短暂的利益”[15],通过违反了自主、公平、不伤害等基本道德要求的自主探勘侵害合法的数据权益,导致原初数据权利人长期处于边缘化的社会失语状态[16]。缺乏道德规制的直观探勘情境正在转变为事物判定的唯一标识,日渐引发不确定、不可靠且有失公允的唯数主义和数据独裁,有可能逐步将整个社会推向失控和崩溃的异化边缘。如应用复杂数据探勘的医药企业和保健机构可以通过直观的动态图表实时地自如掌控和自主分析成分混杂的多元数据资源池集聚信息,导致相关违法违规事件的曝光、取证、追责和救济难度几何乘数增加[17]。
  3.1 直观探勘干扰自由表达
  数据渗透到当今每一个行业和业务职能领域,我们每个人随时都在成为大数据源端[18],广大掌握海量原初数据的政府机关、企事业单位和强势个人通过融会贯通新一代信息技术的复杂数据探勘廉价、直观且实时地自主使用元数据负载设备、聚合集成控制平台、动态分割管理布局以及广域挖掘架构等,在未获原初数据权利人明示同意的情况下肆意采集、阐释与识别颗粒数据变化趋势。如用于健康医疗的全景亿图系统助力医疗机构通过低成本地自行悄然广域挖掘病案地理位置信息和关联内容分享信息,具体识别特定的医生、护士、患者及其家属等相关主体并评估预测其行为模式与趋势,进而成为确定本单位资源补给、价格定位、服务标准与技术投入的核心依据[19]。此类探勘需求者通过廉价、便捷、直观且實时的复杂数据探勘系统,搭建最优化控制成本与提升质量的预测预警模型,严重侵害了原初数据合法持有者的知情权与自主选择权,违背了遵循诚信与尊重自由等道德要求。
  3.2 智数决策破坏平等格局
  场景时代作为现状评估与趋势预测新标尺的易操作的复杂数据探勘为每一个需要数据处理的社会主体提供了独立、低价、便捷且私密地完成海量数据存储、流转与分析的全新途径,逐步扩展应用于劝服、调整与控制决策领域,切实提升众多探勘需求者的洞察力与战略远见,推动产业转型升级和经济快速发展。如众多科研院所和医药企业通过共链生物银行(Colink Biotics)进行基因数据自主探勘,较为准确地实时预测客户巨量基因数据中隐藏的绝症发病率[20],相应的精准用药自动化探勘机制更是将文明社会的医疗水平提升到崭新的高度[21]。包括梅尔数据、全景亿图等在内的可视化复杂数据探勘平台使得掌握定量数据的机构和个人有能力自行完成数据处理并持续推送精准量化分析结果,在一定程度上导致全社会范围内的个人奋斗、企业选择、社会服务和政府管理等异化为固态计算程式。相关价值博弈带来的负面效应和恶劣后果则进一步加剧人性蜕化和创新危机,破坏整个社会的平等格局。如不同规模的企业只要耗费少量成本就可以在“正确”时间以“正确”形式即时地可视化私密探勘“正确”数据引领的长期决策往往侵害平等用工权或公平交易权等[22]。又如,掌握大量适龄男女等信息的婚介公司通过操作简单的可视化复杂数据探勘勾勒的看似理性的配对决策模型试图将人类情感作为技术干预的工具和对象,可能造成严重的心理失衡和人格障碍[23]。将之拓展为全方位优婚、优育、优养的精密探勘计划更是肆意侵害了独立个体的尊严和权利,违背“己所不欲,勿施于人”的道德准则,破坏现代社会引以为傲的平等人际关系,背离了实现“兼收并蓄、取长补短、相互容忍、和平共存的人类共同文明”[24]之道德初衷。
  3.3 数据鸿沟扰乱竞争秩序
  复杂数据探勘可视化集聚了广域深层离散数据,在一定程度上消减了数据资源共享中的信息孤岛现象,逐渐展现出“让一切改头换面”[25]的颠覆性价值。庞大的政府部门、企事业单位和个人用户群通过独立自主地开展复杂数据探勘,积极掌握数据处理主动权并占据发展制高点[26]。复杂数据探勘助力构建“跨行业、跨部门、跨区域”的电子政务智慧管理体系[27];高效且代价合理地优化个性化动态竞争情报生态链,颠覆地区封锁和行业垄断[28];真正实现社会零库存,改善综合实力薄弱中小企业的前途和命运[29]。然而,极简探勘模式大幅降低了数据存储、流转与分析成本,使得众多探勘需求者之间的竞争演变为彻底的原初数据量额和质比纷争。探勘主体出于短期利益需求与长远发展考虑,在数据采集、存储和综合挖掘中设置长效割裂原初数据横向转移与纵向传承的诸多障碍,通过廉价抛售交叉聚探的数据变量交互关系释放盈利潜能,动态阻挡创新力量参与行业竞争[30]。物理世界与数字世界汇聚进程中日渐扩大的数据鸿沟导致部分新生业态陷入难以洞悉周边态势的信息失衡困境,打破有序竞争的良好愿景,严重违背不伤害的基本道德准则。   4 复杂数据探勘的道德规训机制
  行之有效的道德规训是维系社会统一稳定、平衡创造力不可或缺的具有凝聚性与主导性的协调工具。实时、直观、廉价且多样的复杂数据探勘是信息爆炸引发社会变迁的重要助推器,有助于全面优化智慧生命的洞察力、决策力与竞争力,大幅提升标准化与集体化发展模式的边缘收益。而缺乏管控的万物互联迅速破坏精确的探勘部署与有序运作,造成关涉主体利益失衡与秩序紊乱,倒逼急速构筑填补道德缝隙的崭新探勘规训机制。通过勾勒通达向善目标的共同道德精神,构建科学调控探勘行为的道德准则体系,平衡主体发展需求与社会道德期许,实现探勘流程趋利避害的良性循环。
  4.1 确立共同道德精神
  数据时代的科技变革和业态翻新是世界经济走出困境、实现复苏的根本。普惠各行各业的复杂数据探勘在持续创造巨大需求、创新整合虚拟经济与实体经济、颠覆性变革生产与生活方式的同时,开始暴露出封闭化、滞后化与碎片化道德规训引发的干涉自由表达、影响有序竞争、破坏平等格局等诸多缺陷。虽然主要文明国家和地区价值标准多样、文化传统各异,但“推动经济增长的愿望相同,应对危机挑战的利益相同,实现共同发展的憧憬相同”[31]。亟待基于人类命运共同体机会均等与分配正义的道德需求,坚持公平公正、和合共生的价值取向与终极关怀,协同确立复杂数据探勘中弘扬超越异质群体不同诉求的共在、共生、共享、共荣之共同道德精神的重叠共识,合作共建包容联动的数据探勘道德治理机制。
  4.2 制定具体道德规训
  未来的三十年各行各业都会发生天翻地覆的变化,数据将成为核心资源[32],数据活性、探勘规模与结果价值等正在成为衡量综合国力的重要指标。复杂数据探勘平台助力广大缺乏技术认知的普通需求者直观、快捷地自行创造性分析数据资源池以解决特定难题,但也亟待通过安全、自主、适应性以及利益协调等具体的道德规训,积极整肃杂乱无序的探勘市场,有效避免智数失控,引导探勘主体确立自由、平等、公正的内心确信,助力次世代生产生活方式的跨越式發展。
  4.2.1 安全规训
  井喷式速度增长的海量数据、迅速提升的储流技术、日趋即时私密的可视化挖掘过程以及道德规则缺失等促使探勘主体频频泄露和恶意使用原初数据权利人的合法信息。这亟待在广域探勘中坚守安全规训,持久尊重社会主体的生命健康、自由需求与隐私保障等基本权益。主要包括:(1)独立自主地开展探勘活动的政府部门、企事业单位和个人用户追逐效益最大化的探勘行为至少不减损原初数据权利人的现有利益;(2)探勘意图必须源于明确特定的合理事由、及时完整履行通知和同意义务且不得他用;(3)探勘全程应当通过不断完善密钥技术并增加痕迹追踪难度等有效保障复合聚化的个人隐私与商业机密,建立避免未经授权再识别的安全屏障。
  4.2.2 自主规训
  原初数据权利人应当享有自主决定敏感数据分享量值与具体途径的基本权利。复杂数据探勘接近零值的数字化存储成本、无障碍互通实践以及由深刻了解探勘对象的需求者独立自主地开展探勘活动等改变了自权利人拥有一定控制能力的特定资源池中提取原初数据的传统模式,助力探勘主体自由地从零散资源中关联披露大量私密信息,致使原初数据权利人难以了解信息存储与使用的真实情况。亟待通过体系化的探勘道德规训保障数据权人有效表达自由意志的基本权利,实现文明社会的可持续发展。具体包括:(1)增加复杂数据探勘的透明度与公允性,要求探勘主体以通俗易懂的方式向原初数据权利人告知可视化探勘的目的、方法、过程、风险及收益等;(2)规定数据迁入、迁出和彻底拭除的合理费用及调整程序,建立数据隐私溯源框架,切实提高原初数据权利人的管控能力,避免无序探勘相关关系。
  4.2.3 适应性规训
  不同的时空区域、社会状况、个人观念和生活经历等均有可能导致不同的道德认知。在地理界限模糊的复杂数据探勘领域践行适应性规训是基于普世发展需要与殊别情境中文明建设的个性化需求而有差别地整合全球相关道德规范以适应集约化数字未来特殊战略的明智选择。这一规训要求广大探勘主体立足复杂多样的直观数据探勘与区域变化和全球发展的交互关系以及可能引发的道德风险,持续灵活地遵循符合基本价值观与长期普惠需要的特色化道德规训。
  4.2.4 利益协调规训
  低耗便捷的复杂数据探勘的超高回报率促使众多社会主体前赴后继地参与这一崭新业态,但实际探勘过程中充斥着利益分配不均衡的恶劣现象。尤其是原初数据权利人不仅几乎未曾获得过探勘红利,还经常性遭遇用工歧视、购房歧视和保险歧视等[33]。亟待贯彻公平处理有限资源的利益协调道德规训,建立兼顾探勘主体、原初数据权利人以及其他参与者不同利益主张和社会责任的合理分配制度,督促包括相关公权部门及其他社会主体等在内的利害关系人自动自发地维护整个系统良性运转,逐步填平知识鸿沟和技术壁垒导致的弱势偏见和不公平待遇,实现没有明显道德瑕疵的协同发展。
  5 结语
  社会道德体现于群体的行为倾向[34]。直观、实时且廉价的复杂数据探勘中道德失范的妥善解决不仅有赖于确立助力自我实现的共同道德精神与具体道德规训,更有赖于全面完善严谨务实的道德审查体系。有必要建立由公权部门、行业协会、数据权人、其他参与者以及大众媒体组成的超然的独立道德委员会并发布探勘道德规训、行为指标和激励举措;设置道德调查专员全权负责探勘过程的道德评估;通过组织探勘道德培训、对话探勘利益群体、多渠道(如立法研讨、理论会议或媒体访谈)宣传探勘道德规训等深化整个社会对复杂数据探勘道德松弛及其规制的认知水平,强化广大探勘主体遵循道德要求的自主意识,提升社会公众对数据探勘的信任指数与监督力度,鼓励和引导可视化实时探勘技术良性共同发展,确保探勘结果向善益民。
  参考文献:
  [1] (德)卡尔·马克思.中央编译局,译.在《人民报》创刊纪念会上的演说[A].马克思恩格斯全集(第12卷)[M].北京:人民出版社,1962:4.   [2] Oracle.Big Data Discovery:The Visual Face of Big Data[EB/OL].[2016-10-10].http://www.oracle.com/us/technologies/big-data/big-data-discovery-ds-2412271.pdf.
  [3] Advizor.Deep Data Discovery Made Easy[EB/OL].[2016-10-15].http://www.advizorsolutions.com/images/uploads/main/Advizor_6-6_Release_12-15.pdf.
  [4] 王培.亚马逊如何利用大数据练就“读心术?”[EB/OL].[2016-10-29].http://www.cbdio.com/BigData/2016-03/29/content_4747175.htm.
  [5] Deepak Agarwal,Bee-Chung.Statistical Methods for Recommender Systems[M].Cambridge University Press,2016:69.
  [6] 张韫.大数据改变教育[J].内蒙古教育,2013(9):26-30.
  [7] Visual Data Discovery:More than a Pretty Face?[EB/OL].[2016-10-07].insideanalysis.com/2012/08/visual-data-discovery/.
  [8] David Streitfeld.Teacher Knows if You’ve Done the E-Reading[N].New York Times,2003-04-08(A5).
  [9] Ravi Bapna,Jui Ramaprasad,Galit Shmueli,et al.One-way Mirrors in Online Dating:A Randomized Field Experiment[J].Management Science,2016(2):3100-3122.
  [10] Advizor.Deep Data Discovery Made Easy[EB/OL].[2016-10-15].http://www.advizorsolutions.com/images/uploads/main/Advizor_6-6_Release_12-15.pdf.
  [11] Sharon Terlep,Deepa Seetharaman.P & G to Scale Back Targeted Facebook Ads[N].The Wall Street Journal,2016-08-17(B3).
  [12] James Bolton.Smart Data Discovery:How to Identify Multiple Correlation Coefficients With Datameer[EB/OL].[2016-08-22].https://datameer-wp-production-origin.datameer.com/company/datameer-blog/smart-data-discovery-identify-multiple-correlation-coefficients-datameer.
  [13] (法)让·雅克·卢梭.邓冰艳,译.论人类不平等的起源和基础[M].杭州:浙江文艺出版社,2015:8.
  [14] Derya Birant,Pelin Yildirim.A Framework for Data Mining and Knowledge Discovery in Cloud Computing,Data Science and Big Data Computing[M].Spring International Publishing,2016:249.
  [15] 劉小枫.蒋庆,译.当代政治神学文选[M].长春:吉林人民出版社,2011:27.
  [16] Yee Fen.The Data Protection Paradigm for the Tort of Privacy in the Age of Big Data[J].Singapore Academy of Law Journal.2015(27):789.
  [17] Edmon Begoli,Ted Dunning,Charlie Frasure.Real-Time Discovery Service over Large,Heterogeneous and Complex Healthcare Datasets Using Schema-Less,Column-Oriented Methods.Big Data Computing Service and Applicationa[R].2016 IEEE Second International Conference on Big Data Computing Service and Applications,2016.
  [18] Arvind Narayanan,Solon Barocas,Vincent Toubiana,et al.A Critical Look at Decentralized Personal Data Architectures[R].Proceedings of the Data Usage Management on the Web Workshop,2012.
其他文献
文章通过对Counting Online Usage of Networked Electronic Resources Codes of Practice(COUNTER)项目的成立背景、组织成员、日常管理、业务的介绍以及其成功因素的分析,认
高等教育发展二十几年来,民办高校由兴盛转向萧条,有客观的原因,也有民办高校自身的原因。面对逐年下滑的招生现状,民办高校更多地应从自身的管理、建设和发展入手,充分利用自身的
新农村建设需要农民自身素质的提高,农民自身素质的提高必然要依靠教育。日本社会转型期发展职业技术教育的经验,对其社会进步、经济发展、文化及科技教育的进步具有积极的作用
学历教育与职业培训是高职学院的两大功能,转变办学思想,坚持学历教育与职业培训并重并举,充分认识开展职业培训工作的重要性,拓宽合作领域,建立职业培训新机制,提高培训实效,形成特
近年来,随着国家对工业设计专业的重视,许多理工类院校相继开设了工业设计专业,一方面体现出中国工业设计教育的繁荣,另一方面也带来了一系列的问题。一些理工科院校的工业设计专
发展和代价密不可分,研究成人高等教育的发展不能忽视代价的研究。从代价视角看发展,对于确立科学的成人高等教育发展观,深化我国成人高等教育的健康发展具有重大理论意义和实践
职业中专的教育模式与普通高中不同,以就业为目标培养专业技术人才是决定职业中专教育模式的根本。要实现这一目标,职业中专必须确立实践教学的主体地位,作为教学模式的导向。
政府在成人职业能力开发中的角色的讨论本身就是一个公平如何与效率相结合的问题,它是一个政府应该提供多少职业培训经费和在培训费用一定的情况下,如何提供最多的、最有效的、
在成人教育管理中,因管理人员的不经意而为引起“蝴蝶效应”,从而对工作产生负面影响的事例时有出现,成人教育管理如何最低限度地减少失误,提高成教管理工作的效率,管理人员综合素
质量是普通高校成人高等教育发展永恒不变的主题,是成人高等教育的“生命线”。近年来,由于诸多甲素的影响而导致我国普通高校成人高等教育质量有所下滑,引起了社会各界和教育界