公共数据领域可信数据空间

分享到
政务部门数据是我国极具特色的基础性战略资源,也是公共数据资源开发利用的核心组成和突破口。同时,公共企事业单位数据及科研机构数据也是公共数据资源的重要组成部分。随着公共数据资源开发利用的“1+3”政策体系的实施推进,作为可信数据空间建设落地的关键路径之一,公共数据授权运营模式迎来场景落地的重要时期。

一、摘要

政务部门数据是我国极具特色的基础性战略资源,也是公共数据资源开发利用的核心组成和突破口。同时,公共企事业单位数据及科研机构数据也是公共数据资源的重要组成部分。随着公共数据资源开发利用的“1+3”政策体系的实施推进,作为可信数据空间建设落地的关键路径之一,公共数据授权运营模式迎来场景落地的重要时期。一方面,公共数据在权责关系、运营监督、数据服务、合规管控、收益分配等核心机制与管理规范逐步明确的进程中,以政务数据“一本账”为基础,加速与跨系统、跨业务的领域数据资源融合共创,并推动数据要素市场从试点示范走向规范化、规模化运营阶段。另一方面,公共数据依然存在共享开放机制未健全、授权运营模式不清晰、产品价值成效不显著等方面的共性问题。通过明晰界定公共数据授权运营前、中、后三个阶段的关键因素,基于可信数据空间技术框架形成“标准接入-可信服务-空间运营”授权运营能力体系,并在政务、公安、气象、交通、医疗等方向进行了落地实践,形成20余种业务模型和8个应用场景,广泛应用于政数局、公安局、气象局、交通局、卫健委、疾控中心、医保局等行业部门,有效提升了公共服务水平。

二、背景

公共数据授权运营作为新兴数据开发业态,面临着数据授权确权、授权范围、分类分级、质量评估、安全管控等方面的挑战。在开发实践中,还存在以下几个方面的难题。

一是数据共享开放机制未健全。公共数据分散存储于多个部门机构,尚未建立面向专业场景领域的跨组织共享利用的机制,导致数据供给量和开发利用率低。由于服务对象、业务逻辑、应用逻辑及数据加工处理的需求各不相同,使得公共数据在跨领域数据流通和应用时面临诸多障碍。

二是数据授权运营模式不清晰。公共数据来源广泛,由于数权归属及数据责任方面难以明确界定、管理、追踪和约束,在授权运营环环相扣的多个环节中易于引发权属纠纷,因而导致“供数方”共享意愿低,而“用数方”担心二次授权隐患,同时可能存在数据信用级联传递风险。

三是数据产品价值成效不显著。公共数据在采集存储、加工处理、建模计算及服务封装等环节,普遍存在数据格式、数据接口及数据标准不统一的问题,影响了数据的可得性与可用性,大部分数据集只能在调试环境中开展试用验证,却难以在生产环境中提供有效的数据产品及服务。

为此,万里红基于可信数据空间技术框架,提出公共领域可信数据空间建设整体方案,旨在解决公共数据“供不出”、“流不动”、“用不好”的问题,实现公共数据的可信安全与高效流通。

三、目标

依托《可信数据空间技术架构》《可信数据空间标准体系建设指南(2025年版)》《可信数据空间能力要求》等标准,围绕公共数据开发利用过程中存在的“不敢共享、不愿共享、不能共享”重点、难点及堵点问题,以可信技术服务体系为基础,面向关键数据开放场景,形成覆盖授权运营全链路、可复制的整体解决方案。设计开发一套数字合约,应用于集中运营、分布接入、可信管控、数据交付、收益分配和效用评估等环节。在政务公安联合查验、大型活动与公共安全保障、气象数据融合分析、交通拥堵管理、商业保险服务、老年专病研究、个人健康管理、公卫大模型开发和泛行业语料库构建等方向打造多方安全协作模式和数据共享应用合作机制。通过试点先行、以点带面的方式,扩大公共数据在供需双方的影响力,进而驱动更多参与主体共同参与公共数据可信数据空间的建设与发展。

四、建设内容

基于数据生态共建共享模式,接入公共数据智能服务平台作为数据提供方,吸引卫健部门、交通部门、院所高校、科研机构、医药企业等数据需求方,与平台运营方、模型/应用开发方、智算基础设施提供方,共同形成公共数据可信数据空间生态。

一是明确授权运营阶段要素。基于时间维度可以将公共数据授权运营分解为前中后三个阶段,一是运营前阶段,关键因素包括数据权属、运营规则、安全责任、授权范围、授权机制、合作模式与技术架构等;二是运营中阶段,关键因素包括数据质量、安全交付、使用控制、运营监控、合规审计及服务保障等;三是运营后阶段,包括效益评估、反馈改进、数据更新、知识沉淀等,需要配套的标准规范和规则体系,从而确保授权运营机制的高效、合规落地。

二是定义数据可信交付链路。数据需求方授权委托数据加工方(即模型/应用开发方)开发模型或应用,数据加工方接受委托并查询数据目录,订阅相关数据集用于预定义场景的开发和验证。双方基于数字合约协商约定数据获取方式、核心字段、数据价格、交付模式、安全等级及所需资源等。其中,数据价格由平台运营方根据数据质量评估模型和数据使用频次实行动态积分定价,交付模式根据技术栈的差异,分为直连交付(即数据集交付和数据API交付)、沙箱交付和隐私交付三种模式。数据建模和应用开发所依赖的计算资源环境由智算基础设施提供方提供。

三是构建授权运营技术系统。公共数据可信数据空间建设在明确主要参与方的基础上,分别从可信接入、技术服务、资源交互、空间运营和应用场景5个方面进行能力建设。其中,可信接入层采用连接器的分布式架构设计模式,基于数字身份标识实现机构、节点和数据的可信认证,基于数据目录实现连接器与空间服务平台的目录信息同步,构建从资源管理、数据交付、安全管控到产品上架的可信管控能力。技术服务层主要包括区块链服务、隐私保护服务、数据沙箱服务、数据应用服务和AI大模型服务,基于可插拔、松耦合的组件模式,为可信接入层和空间运营层提供动态服务调用特性。

空间运营层提供从资产评估、登记确权、资产入表到运维监控的全链路运营组件和可信认证、数字合约及连接器管理等关键技术组件。数据市场层包含多种数据资源,提供资源交互能力,为空间运营层提供数据访问入口。应用场景层为业务用户提供低代码交互式项目空间,基于共享共享的数据资源、模型和应用,提供快速验证模型假设和构建应用开发的样板体验区。

四是组建数据运管管理团队。构建涵盖公共安全、气象领域、公共卫生、数据挖掘、数据工程、数据服务、数据安全、可信AI等多个专业领域的跨学科运营管理团队。制定并完善数据授权准则和运营规范流程,形成基于样本数量、样本质量、调用频次、研发投入、技术创新等特征变量的收益效用价值评估模型,构建可持续运营的数据产品开发模式,打造多主体协同、创新驱动、可持续发展的生态体系。

142031834.png

五、实施效果

集成区块链、数据沙箱、隐私保护、数字身份、数字合约等技术,建成服务行业级公共数据可信流通平台,打造“数源可信接入、模型安全开发、交付高效可靠、业务场景多元”的公共数据协同开发范式。构建公共数据可信合规体系,实现数据可信、可靠、可溯源,全面保障数据安全性。

推动跨区域的行业生态、数据资源及可信技术服务的深度融合。形成20余种业务模型和8个典型应用场景,服务于政数局、公安局、气象局、交通局、卫健委、疾控中心、医保局等行业部门,定制化赋能政务管理、公共安全、气象服务、交通管理、医疗健康等多个场景,有效提升了公共服务水平。

完成单位:北京万里红科技有限公司

完成人:张小亮、范金刚、付珊珊、郭艳来

责编:左右