近日,中国电子报社在其旗下官方微信“中国电子报”(微信号:cena1984)发布文章《大数据交易所掀起新一轮数据“掘金潮”》,报道了大数据交易的发展现状、瓶颈问题与未来发展等。
同时,文章还穿插了包括中国大数据应用联盟人工智能专家委员会主任、南京云创大数据科技股份有限公司总裁刘鹏教授,中国科学院科技战略咨询研究院大数据战略研究中心执行主任冯海红,北京计算机学会数字经济专委会秘书长王娟,DAMA(国际数据管理协会)中国主席汪广盛在内的多位专家对于行业的深刻思考和独特观点,让读者印象深刻,收获颇丰。文章也将刊登在《中国电子报》上。
《中国电子报》由中华人民共和国工业和信息化部主管,中国电子报社主办,隶属于中国电子信息产业发展研究院 (CCID),是具有机关报职能的电子信息产业行业报。
刘鹏教授,清华大学博士,中国大数据应用联盟人工智能专家委员会主任、中国信息协会教育分会人工智能教育专家委员会主任、教育部全国普通高校毕业生就业创业指导委员会委员、2019年全国大学生数学建模比赛命题人、第45届世界技能大赛中国区云计算选拔赛裁判长/专家指导组组长、中国电子学会云计算专家委员会云存储组组长、工业和信息化部云计算研究中心专家、2002年PennySort国际计算机排序比赛冠军与2003年全国挑战杯比赛总冠军。
文章如下:
近日,上海数据交易所在成立当天落下了备受瞩目的第一单,交易双方分别是国网上海市电力公司和中国工商银行上海分行。以往上海的电力大数据主要用于“一网通办”、“一网统管”平台,此次交易后,电力公司可对合法采集到的企业用电数据进行脱敏和深度分析,形成涵盖企业用电行为、用电缴费、用电水平、用电趋势等特征内容的数据产品,通过数据交易所提供给银行,为其信贷反欺诈、辅助授信、贷后预警等提供决策参考。
数据作为重要的生产要素和战略资源的核心价值在这次交易中得到体现。当前,全国各地都在积极布局大数据交易所,精心培育数据要素市场。上海数据交易所、中新天津生态城北方大数据交易中心、北京国际大数据交易所……不断成立的大数据交易所将“数据交易”推上热搜。然而处于起步阶段的数据交易在实现数据要素的价值上,面临很多现实难题。
各地大数据交易所“花开遍地”
作为“第一个吃螃蟹的人”,贵阳大数据交易所(以下简称“贵数所”)于2015年正式挂牌运营,开启了国内数据交易的历史。此后,大数据交易所在全国各地如雨后春笋般涌出,北京、上海、浙江、武汉、陕西、黑龙江等地先后跟进。据不完全统计,截至今年,国内已公布的(含筹建)的大数据交易所(中心)已超过30个。
很多人其实并不清楚所谓的大数据交易究竟交易的是什么。中国科学院科技战略咨询研究院大数据战略研究中心执行主任冯海红在接受《中国电子报》记者采访时介绍说:“常见的数据交易标的主要分为三类,一是以API(实时数据)接口形式提供的数据服务,主要交易的是数据使用权;二是在原始数据基础上衍生的数据产品及服务,如数据包或数据集等;三是数据报告。”
“参与数据交易的买卖双方多为央企、国企、科研院所和高校等研究机构,真正有数据需求的企业出于政策风险、合规性边界等方面的考量还未真正参与进来。” 北京计算机学会数字经济专委会秘书长王娟坦言。
她指出,价值评估是数据要素市场化的关键问题。过去的价值评估包含市场法、成本法和收益法等,现阶段的数据要素评价更多是收益法与市场法的结合,即以数据可能带来的收益和市场交易参考价值共同决定。DAMA(国际数据管理协会)中国主席汪广盛表示,除了数据本身,模型和算法的价值评估也很有难度,目前还没找到很好的评估方法。DAMA提出的评估方法还是以成本法为主。
中国大数据应用联盟人工智能专家委员会主任、南京云创大数据科技股份有限公司总裁刘鹏则对《中国电子报》记者说道:“数据要素的价值实际上取决于供需关系,供小于求必然价格居高不下,供大于求导致无人问津。”
目前来看,国内市场大数据交易模式尚未统一,各地大数据交易所正在进行不同程度、不同方向的探索。例如,贵阳大数据交易所不进行基础数据交易,而是根据需求方要求对数据进行清洗、分析、建模等处理后再出售。湖北华中大数据交易所不仅提供原始数据集,还提供API和基于数据分析的智力成果,以及数据采集、数据挖掘和数据分析、数据建模等服务。香港大数据交易所则是深度整合物联网、密码学、大数据、区块链、人工智能等前沿技术,将采集的数据通过编码的方式记录在区块链上及分布式存储服务器内进行交易。
尽管交易模式不尽相同,但各地的大数据交易所在整个数据产业生态链中扮演的角色是一致的。“大数据交易所既是数据流通与交易相关政策、应用落地和技术创新的重要推手,也是数据交互的重要枢纽,为数据提供方、数据需求方、数据服务方等提供了一个相互促进、相互成就的平台,驱动着供需之间的高效匹配。”冯海红说道。
行业高价值数据受到市场欢迎
冯海红在采访中指出,政务数据一般会按照国家相关规定,由专门的数据开放平台或相关机构统一管理,因此并不是各地大数据交易所的交易重点。相较之下,一些重点行业的数据,尤其是电力、交通、金融、医疗、通信等行业,在大数据交易市场更受欢迎。
王娟分析称,数字化程度较高的行业本身就拥有大量数据,而且他们受到降本增效、供给侧改革和提高客户体验等因素的驱动,在数据应用方面动力充足。冯海红表示:“这些行业数据质量好、价值高、场景需求丰富,且在数据治理方面走在前列,像这种‘需方有需求、供方能提供’的数据自然受到市场欢迎。”
以金融行业为例,刘鹏指出,该行业与信息技术紧密融合,在利用大数据技术推动大数据交易方面非常积极主动,尤以基金公司表现亮眼。基金公司利用大数据交易信息,可以比较交易成本、挖掘投资机会、测评机构活跃度、加强投资交易监测、了解市场不同机构行为特征、关注市场债券交易价格异常偏离、进行信用风险及流动性风险预警等。
但从总体来看,整个数据交易市场还有很大成长空间。汪广盛在采访中谈道:“目前数据交易的数据还是很有限的,交易主体以商业机构为主,主要来自一些脱敏后的数据和集体性数据,比如人口总体分布,经济数据等。工业数据的收集和应用率几乎还是零。”
技术创新成打破僵局的关键
尽管近几年来各地大数据交易所数量不断增多,但交易规模仍然低于预期。·究其原因,汪广盛认为,这与数据确权问题没有得到根本性解决、数据价值评估模型不够完善、市场供需矛盾明显(购买侧有强烈的需求,但供给侧却匮乏)等方面息息相关。在DAMA最近的一份调查中,71%的企业认为自己企业拥有的数据还不足以推进数字化进程。此外,刘鹏表示,缺乏共享理念、交易平台定位模糊、专业人才不足等问题普遍存在。
多维度技术创新与突破被认为是打破当前数据交易僵局的重要手段。“大数据交易主要考虑的交易双方的安全性、可信性和数据可用性。目前围绕这三个点,区块链、人工智能、云计算、物联网和量子通信都有各自的发力点,多方安全计算、联邦学习和隐私计算等也在不断为行业大数据共享提供综合解决方案。”王娟表示。
在技术创新方面,北京国际大数据交易所(以下简称“北数所”)被寄予厚望。据了解,北数所利用区块链技术、多方安全计算技术、隐私加密技术等,在数据权属确认、数据流通效率、数据安全治理等方面开展创新实践,能在一定程度上进一步解决数据定价和交易中固有的难题,也因此成为了国内首家基于“数据可用不可见,用途可控可计量”新型交易范式的数据交易所。尤其值得关注的是,北数所刚刚推出的业内首创“数字交易合约”所使用的核心技术就是区块链。
此外,在技术领域其实还有很多值得探讨的地方。“人工智能训练数据可以作为数据交易一个很重要的方向。”刘鹏指出,“人工智能训练数据,比如无人驾驶汽车采集的周围环境数据,包括障碍物、拥堵情况等,不会涉及太多隐私,但是需求量大,无论是对于数据交易还是促进就业而言,都具有很大价值。”
新一轮数据“掘金潮”已来
在第一批大数据交易所成立之初,相关法律政策尚未完善,未能打造出一套比私下交易更好的信任机制,因此普遍没能实现预期交易规模。如今,以北京、上海、浙江和广东等地以机制与技术创新为亮点掀起了新一轮数据交易热潮。
北数所探索以政府与企业合作的模式,由北京金控来参与公共数据的分级开放。广东在数据交易方面以龙头企业为试点,发挥产业链数据经纪人的优势,以企业为主体来实现发挥数据要素价值。东部沿海比较发达的几个省市开展CDO(首席数据官制度)试点,对数据要素市场的培育也具有非常重要的参考作用。
尽管已有不少城市走进数据交易的“无人区”,探索着政府与市场搭配的不同范式。但王娟提醒说:“平台经济用数据模糊了行业边界,给监管带来了巨大挑战。数据交易涉及不同行业、不同监管机构和不同市场主体,是一个统筹协调发展中的新问题,需要提前做好风险防范,预研预判的同时大胆尝试,以包容审慎的态度面对未来的数据大市场。”
如何让市场健康有序发展,冯海红建议:“首先,数据交易管理制度有待细化,尽管目前宏观政策已明确指出鼓励大数据交易,但具体实现路径、措施、方法等细则尚在探索过程中;其次,数据交易涉及的核心技术需要时间沉淀;此外,从数据采集、分析、处理到流通交易的全生命周期环节都需要完善,产业生态中各方之间的合作方式也需进一步磨合。”
刘鹏认为,应该实行备案制,建立数据保全机制,保护数据主权;进一步建立和完善数据交易标准,在相关环节出台技术标准;设立大数据交易试点城市,建立第三方审计和评估机制;明确数据交易和使用边界,加快推进相关法律法规建设。
王娟表示,如果总是以单边利益最大化、对抗分割权属等方式讨论和实行数据管理,可能会阻滞数据交易成长性,不仅无法有效利用数据,还会耽误数据要素的市场化进程,并给监管带来跨界问题。大数据交易所应当成为数据规范化发展的“学校”,成为数据走向应用前的“老师”,并最终成为数据走向市场的“经纪人”。