光伏组件多光谱数据集建设

分享到
项目依托自研扩散模型感知注释生成技术、自动化标注大模型及双向反馈迭代机制,建成5大行业数据集、600余万张标注图像,研发三款智能检测装备系统,实现标注效率与数据质量双重跃升。

本项目聚焦光伏行业智能制造与智能运维痛点,攻克多模态图像数据标注时空对齐、大模型可靠识别、迭代优化三大核心难题,构建行业首个全流程数据标注工作流,打造覆盖生产全链条的高质量标注数据集。项目依托自研扩散模型感知注释生成技术、自动化标注大模型及双向反馈迭代机制,建成5大行业数据集、600余万张标注图像,研发三款智能检测装备系统,实现标注效率与数据质量双重跃升。项目成果斩获多项国家级、省部级荣誉,成功入选京津冀重点应用场景,具备极强的市场推广价值与产业赋能能力,预计未来3年实现技术产品快速增长,为光伏行业智能化转型升级筑牢数据与算法底座。

一、实施背景

随着光伏产业规模化、智能化发展,光伏电池片生产、组件制造、电站运维全流程产生海量图像、视频等多模态数据,这些数据蕴含复杂时空特征,是实现智能质检、缺陷预警、高效运维的核心载体。但当前行业面临三大突出瓶颈:一是标注数据时空特征难以自动化对齐,视觉、文字、时序数据脱节导致标注精度不足;二是高质量标注数据稀缺,传统人工标注效率低、成本高,大模型难以适配多样化复杂场景;三是数据标注与模型训练相互割裂,无法形成迭代优化闭环,制约智能化技术落地。

同时,光伏行业智能质检、自动化运维需求持续攀升,市场对大规模、高精度、多场景标注数据集与适配性大模型的需求日益迫切。在此背景下,本项目启动研发与建设工作,聚焦攻克数据标注核心技术难题,推动光伏质检多模态数据标注大模型与高质量数据集持续迭代,破解行业智能化发展的底层数据瓶颈。

二、实施目标

技术目标:突破多模态数据时空对齐、扩散模型数据生成、自动化标注大模型研发三大核心技术,构建全流程闭环数据标注体系,实现标注效率、数据质量大幅提升,打造行业标杆级高质量数据集。

产品目标:基于核心技术与数据集,研发多款光伏智能检测装备与系统,覆盖生产、质检、运维全场景,形成可落地、可复制的智能化解决方案。

应用目标:推动成果在光伏行业规模化应用,入选重点示范场景,实现技术成果转化与市场落地,助力光伏产业降本增效、智能化升级。

发展目标:建立大模型与数据集双向迭代机制,持续拓展数据规模与模型泛化能力,未来3年实现相关产品技术快速增长,抢占行业智能化市场先机。

三、建设内容

(一)核心技术创新建设

项目聚焦技术痛点,打造两大核心技术突破,构建行业领先的标注技术体系。一是研发基于扩散模型的感知注释数据生成模型,依托GPT-4o、国产豆包等大语言模型生成多样化引导语句,合成多场景、高适配性图像,通过训练解码器模块,输出高质量感知注释,覆盖语义分割、实例分割等多下游任务,解决标注数据稀缺难题。二是构建自动化标注大模型,整合多传感器数据开展多模态训练,提升复杂环境适应能力,实现光伏质检图像的高效、精准自动标注。

(二)模式与体系创新建设

打造两大创新模式,筑牢项目核心竞争力。一方面,构建光伏行业首个全流程数据标注工作流,覆盖数据采集、清洗、预处理、增强扩充、标注、质量控制、迭代优化全环节,形成完整闭环,规范行业大规模数据标注流程。另一方面,建立数据标注大模型与高质量数据集双向反馈循环机制,用标注数据训练优化模型,依托模型输出反向提升标注数据质量,通过迭代训练策略持续升级技术体系。

(三)高质量数据集建设

基于自研标注技术与工作流,建成光伏行业五大专项数据集,累计包含600多万张图像,数据总量约34TB,图像分辨率覆盖0.5k-2k,全面涵盖光伏电池片、光伏组件生产环节及光伏电站运维环节,实现从生产制造到发电运维全场景覆盖,为大模型训练、智能装备研发提供海量优质数据支撑。

(四)智能装备与系统研发

依托高质量数据集与标注大模型,团队成功研发三款核心智能装备系统:智能识别与分类工业机器人系统,实现光伏产品生产环节自动化分拣与质检;航天用砷化镓光伏电池智能检测机器人,满足高端光伏器件高精度质检需求;无人机光伏电池巡检系统,实现光伏电站远程、高效、全覆盖运维巡检,形成全场景智能化解决方案。

(五)科研与知识产权建设

项目依托5项国家自然科学基金、3项国家重点项目支持,深耕技术研发与成果沉淀,累计发表学术论文60余篇,其中ESI高被引论文3篇,获得核心专利20余项,构建了完善的知识产权体系,为技术持续迭代与成果保护提供坚实保障。

四、实施效果

(一)荣誉与示范成效

项目成果获得行业与权威机构高度认可,成功入选2024年“京津冀共建共享十大场景”,斩获2025年全国人工智能应用场景创新挑战赛一等奖,雄安垂直大模型应用大赛行业高质量数据集赛道三等奖,累计荣获7项省部级奖励,成为光伏行业智能化数据标注领域的标杆示范项目,彰显技术先进性与应用价值。

(二)技术与产业成效

核心技术彻底破解行业数据标注痛点,自动化标注效率大幅提升,数据集质量达到行业领先水平,填补了光伏行业多模态质检大数据标注领域的技术空白。三款智能装备系统实现产业化落地,有效提升光伏生产质检效率、降低运维成本,推动光伏行业生产模式向智能化、自动化转型。

(三)市场与发展成效

项目应用推广与市场反馈良好,光伏行业智能化需求的持续攀升,为项目带来大量潜在订单与合作机会,预计未来3年内相关产品和技术将实现快速增长,创造可观营收效益。同时,项目规划在雄安新区及河北省内重点推广光伏组件智能检测和运维系统,进一步扩大应用覆盖面,提升区域光伏电站运维效率与可靠性。

五、下一步提升计划

后续将持续深化技术迭代与场景拓展,一是优化数据标注大模型性能,提升模型泛化能力与复杂场景适配度;二是进一步扩充数据集规模与场景覆盖面,完善全链条数据体系;三是深化雄安及河北区域应用推广,打磨落地场景,推动成果在全国光伏行业规模化复制;四是持续开展科研攻关,完善知识产权布局,巩固技术领先优势,助力光伏行业高质量智能化发展。

140012134.png

140018277.png

完成单位:河北工业大学

完成人:陈海永

责编:左右