国家数据基础设施(南京)先行先试
一、背景及需求
2024中国国际大数据产业博览会上,国家数据局刘烈宏局长提出在数据流通利用基础设施方面,支持有条件城市积极开展数据空间、数场、数联网、数据元件、隐私计算、区块链等多项数据可信流通技术路线探索尝试。
南京市作为18个首批试点城市之一,承担了数联网建设任务,聚焦为数据供需双方提供便捷高速、智能稳定的信息共享传送服务。南京市基于自身完善的网络及存算基础设施优势,建设数联网,可在完整实现国家数据基础设施功能的前提下,更好实现统一底座跨域互联互通,助力形成全国数据要素统一大市场。
在本次试点项目中,数智公司与未来网络通力配合,重点支撑了数据基础设施底座建设,按照“三统一”要求,提供连接器统一接入,面向各类数据流通利用技术路线提供统一支撑服务,包括接入管理、身份认证、资产登记、目录发布、策略管理、跨城支撑等能力。实现数据流通利用主体广泛接入,支持重点行业的跨区域、跨行业数据流通利用,打造示范性强、带动性广的典型应用场景,赋能产业经济发展,且具备与其他数据流通利用基础设施的互联互通能力。


二、项目内容
1、主要场景
开展应用场景构建,围绕工业、电信、交通、金融、文旅、自然资源、卫生健康、教育、科技、政务、海运航运等重点行业领域,覆盖工业制造、交通运输、城市治理、商贸流通、医疗健康、金融服务等6个行业,打造公共数据运营、科学数据流通、行业数据流通等三类跨区域、跨行业数据流通利用应用场景,打造35个示范性强、带动性广的典型数据流通利用场景。
2、能力体系
数据基础设施底座以“数据驱动、服务赋能、安全可控”为核心目标,构建分层协同、闭环管理的体系化框架,覆盖基础支撑、数据汇聚、交互连接、应用服务、标准规范、安全防护六大维度,实现从底层资源到上层应用的全链条贯通,支撑跨域、跨系统的数据服务与业务创新,促进数据的高效流通与价值挖掘。
3、项目方案
本次试点建设充分利用南京现有的算力、存储、安全资源,基于南京CENI的确定性网络一体化能力,建设由基础支撑平台和接入连接器组成的数据基础设施底座,实现接入连接器的统一管控、泛在接入,数据资源、数据产品的开发交付。
依托数据基础设施统一底座实现数据流通的横向与纵向的互联互通互认。在横向上,与其他城市通过底座基础支撑平台实现主体身份互认、数据的申请、合约、交易、交付从而形成跨域数据交换,同时,与其他试点城市之间,实现与数场、可信数据空间、数据元件、隐私保护计算、区块链。在纵向上,与省级数据流通利用管理平台、国家数据流通利用管理平台,实现主体身份、数据产品、交易合约、交付记录等数据信息进行同步,满足省级、国家的管控需求。
以确定性网络技术为基础,建设确定性骨干网及接入网,从而形成城市内(城域)及跨域各数据流通基础设施、数据主体之间的共享服务网络。
通过接入连接器,搭建各方数据主体、各类数据资源接入基础设施的桥梁;遵循“统一目录标识、统一身份管理、统一接口服务”的原则,构建标准化、安全可信的数据流通环境;服务各方开展数据治理加工、开发利用、流通交付、运营管理、运维支撑等工作,构建多元化、低技术门槛的业务中心;依托区块链、隐私计算技术,构建权限隔离、可信协同的租户数据空间;打造以南京为核心枢纽,面向全国区域的开放兼容、可信共享、互联互认互通的数据流通利用底座。
从管理、技术、运营、监管四个方面,构建一体化安全保障体系,将数据安全能力、网络安全能力贯穿于建设的各领域和全过程,实现数据安全、网络安全可管可控可溯可视。
根据数联网试点建设需求,制定数联网方向国家或行业标准,主要包括技术标准、建设规范及管理运营相关标准规范,通过标准规范的制定,提高数据流通的效率和质量,推动数据流通相关产业的发展。
4、项目创新点
(1)AI模型开发训练能力
平台提供了低门槛、高效能的可视化服务,紧跟AI技术前沿发展。在算子库方面,涵盖了丰富的算子,这些算子是构建模型的基础单元,丰富的算子库为用户提供了更多的选择,能够满足不同类型模型的构建需求。无论是简单的线性模型,还是复杂的深度学习模型,都能在算子库中找到合适的算子进行组合和搭建。在训练模式上,支持多种模式,包括监督学习、无监督学习和强化学习等。不同的训练模式适用于不同的数据和任务场景,监督学习适用于有标注数据的分类和回归任务,无监督学习则用于发现数据中的潜在模式和结构,强化学习可在动态环境中通过与环境交互来学习最优策略。通过可视化建模和工作流管理,用户能够便捷地构建、训练和部署模型。在模型构建过程中,用户只需通过简单的拖拽操作,即可将各种算子组合成所需的模型结构,无需编写复杂的代码,大大降低了模型开发的技术门槛。在训练过程中,用户可以实时监控训练进度、准确率、损失值等指标,并根据监控结果灵活调整参数,如学习率、迭代次数等,以确保模型能够达到最佳的训练效果,大幅提升了模型开发效率和质量。
(2)强化能力支撑中心设计
在平台架构中,全面涵盖了数据开发与流通利用等一系列具备高度可扩展性的能力服务,为数据的全生命周期管理提供了坚实保障。在开发交付环节,平台创新性地集成了隐私计算、模型算法训练等功能。隐私计算技术的应用,确保了数据在流通和使用过程中的安全性与隐私性,有效解决了数据共享中的隐私担忧,使得敏感数据能够在安全可控的环境下进行分析和利用。模型算法训练功能则为数据价值的深度挖掘提供了强大工具,通过对海量数据的学习和分析,能够生成精准的预测模型和决策支持,助力各行业提升业务效率和创新能力。数据标注服务的引入,进一步提升了数据的可用性和准确性,为机器学习和人工智能应用提供了高质量的训练数据,推动了智能化应用的发展。创新功能的有机结合,使得平台在数据处理和价值挖掘方面具备了领先优势,能够满足不同行业、不同场景下的数据开发与流通利用需求。
(3)跨域互联互通互信
平台基于区块链技术实现了身份、策略、算法协议、数据格式和接口规范等方面的互通互信互认。在身份互认方面,通过可信基座和多种身份互认方式,确保了不同域之间用户身份的真实性和一致性。用户在一个域中进行身份认证后,在其他域中也能得到认可,无需重复认证,提高了用户体验和业务办理效率。在策略管理方面,采用统一的策略管理机制,对数据的访问、使用和共享等策略进行集中管理和控制,确保了数据在跨域流通中的合规性。算法协议的互通,使得不同域之间能够采用相同的算法进行数据处理和分析,保证了数据处理结果的一致性。数据格式和接口规范的统一,消除了数据在跨域传输过程中的格式差异和兼容性问题,确保了数据的准确传输和有效使用。通过这些技术手段,保障了数据在跨域流通中的安全性、可靠性和合规性。
三、应用成效
1、跨域互联,全国首批验证通过
率先与国家级节点开展互联互通测试验证,成为首批在接入连接器、业务节点和区域功能节点等基础设施应用与国家级节点、其他试点城市区域节点实现跨域互联互通的城市。
2、数网融合,打造数联网新范式
基于“三大运营商资源和CENI确定性网络技术”构建确定性网络,具备高速传输、低延迟、高可靠性及安全性等技术优势。实现跨主体、跨业务节点、跨域数据上报与查询的高效交互。基于特定场景实现1TB以上数据实时传输。
3、数智融合,AI智能体应用新模式
创新打造“数据访问策略”、“数据使用策略”、“数据登记编目”、“数据成本估算”智能体应用,高效赋能“可信管控、资源交互、价值共创”三流合一。实现数据流通智能化分析与控制。
4、场景赋能
聚焦南京“4266”产业体系,精准对接工业、医保、交通、金融等重点行业领域。赋能“智能驾驶”、“金融风控”、“商保核验”、“材料分析”等跨行业、重点领域学科的典型数据应用场景。
完成单位:联通数据智能有限公司
中国联合网络通信有限公司南京市分公司
完成人:康晓宇、曾佳玉、薛松泰、胡晓玥



